4 troxoi website home 4 troxoi forum

Η ΙΣΤΟΡΙΑ ΤΗΣ ΑΥΤΟΚΙΝΗΣΗΣ, ΜΕΣΑ ΑΠΟ ΕΠΙΛΕΓΜΕΝΑ ΑΡΘΡΑ ΤΟΥ ΠΕΡΙΟΔΙΚΟΥ 4ΤΡΟΧΟΙ

Aναγνώριση φωνής

Hands free



Είναι μερικές φορές που η εξέλιξη της τεχνολογίας μάς αφήνει κυριολεκτικά άφωνους. Ειδικά την εποχή αυτή, που έχει επιταχύνει τους ρυθμούς της και στοχεύει να κατακτήσει χώρους που, μέχρι πρόσφατα, είχε αγγίξει μόνο η επιστημονική φαντασία. Το νέο μεγάλο στοίχημα της τεχνολογίας λέγεται «Αναγνώριση Φωνής» και θα είναι η πρώτη φορά που μια τόσο μεγάλη τεχνολογική επανάσταση... δεν θα μας αφήσει άφωνους. Οι πρώτες εφαρμογές της νέας αυτής τεχνολογίας είναι ήδη εδώ και μερικοί τις χρησιμοποιούν καθημερινά, αφού είναι ενσωματωμένες σε πολλά προϊόντα ―όπως είναι τα κινητά τηλέφωνα, οι υπολογιστές, οι ειδικοί εγγραφείς φωνής―, ακόμη και... σε μερικά νέα αυτοκίνητα. Όπως γνωρίζουν, όμως, πολλοί από την καθημερινή χρήση της «αναγνώρισης φωνής», οι επιδόσεις της μάλλον δεν είναι και τόσο κορυφαίες, αφού αρκετά κινητά τηλέφωνα άλλο όνομα καλούμε και άλλο παίρνουν. Το τοπίο σίγουρα θα αλλάξει και δεν είναι μακριά ο καιρός, όπου πληκτρολόγια, κουμπιά, ρυθμιστικά και άλλα χειριστήρια θα αντικατασταθούν από ένα και μόνο μικρόφωνο. Οι φωνητικές εντολές είναι το μέλλον και, σύμφωνα με τους κατασκευαστές, η τεχνολογία που θα τις εξυπηρετεί θα κοστίζει αρκετά λιγότερα από ένα τηλεχειριστήριο ή ένα καντράν τηλεφώνου.
Τα τελευταία δέκα χρόνια, έχουμε γίνει μάρτυρες πολλών φιλόδοξων προσπαθειών που μας έδωσαν γεύσεις μέλλοντος. Μερικές από τις εταιρείες που έχουν αναπτύξει προϊόντα, αλλά και πραγματοποιήσει βαθιά έρευνα στο θέμα της αναγνώρισης φωνής, είναι οι Lernout & Hauspie, IBM και Philips. Αυτές πουλούν και έχουν στον κατάλογό τους προϊόντα (software) αναγνώρισης φωνής, ειδικά για χρήση σε επεξεργαστές κειμένου υπολογιστή. Οι πρώτες εκδόσεις αυτών δεν ήταν και τόσο αποτελεσματικές, οι τελευταίες τους όμως είναι ικανές να «γράφουν» κείμενα με τη χρήση μικροφώνου, χωρίς να προβληματίζουν το χρήστη. Επιπροσθέτως, οι εφαρμογές των παραπάνω εταιρειών επιτρέπουν στο χρήστη να «γράψει» με τη φωνή του κάποιο επίσημο έγγραφο χρησιμοποιώντας ειδικούς όρους, χωρίς αυτός να αλλάξει καθόλου τον καθημερινό τρόπο ομιλίας του. Το σύστημα, από μόνο του, απλά, για κάθε λέξη, προτείνει από το λεξικό κάποιες εναλλακτικές για επιλογή... πάντα με τη φωνή, ακόμη και από την πολυθρόνα μας. Η προφορική γλώσσα αποτελείται από δεκάδες διαφορετικών, αλλά και ταυτόσημων συχνοτήτων, τις οποίες το σύστημα μετατρέπει σε ένα είδος σήματος που έχει ως ταυτότητα τη χροιά της φωνής μας. Οι μόνες συνιστώσες που μεταβάλλονται στη φωνή ενός ανθρώπου, σε σχέση με κάποιον άλλο, που όμως μιλούν την ίδια γλώσσα, είναι: η ένταση (το πόσο δυνατά, δηλαδή, μιλάμε), η ταχύτητα (το πόσο γρήγορα μιλάμε), το γλωσσικό ιδίωμα της κάθε περιοχής (η προφορά, δηλαδή) και το ποσοστό ψευδίσματος ή η εσφαλμένη προφορά. Τα προγράμματα αναγνώρισης φωνής των υπολογιστών αναγνωρίζουν τις λέξεις σε αντιπαραβολή με άλλες που έχουν στη μνήμη (αποθηκευμένες), αλλά και με τη χρήση ακουστικών μοντέλων που έχουν αναπτυχθεί με τη βοήθεια της στατιστικής πρόβλεψης και των αγαπημένων φράσεων ή συνδυασμών λέξεων του χρήστη. Για παράδειγμα, μπορούμε να μιλάμε με το δικό μας τρόπο, όπως: «Παπαδόπουλε, θέλω το χαρτί...», και η εφαρμογή να γράφει στον επεξεργαστή κειμένου μας «Αξιότιμε κύριε Παπαδόπουλε, παρακαλείστε όπως προσκομίσετε το έγγραφο...». H εκτέλεση των παραπάνω εργασιών απαιτεί κατανάλωση αρκετής ισχύος από τον υπολογιστή και για το λόγο αυτό προτείνονται μόνο για «δυνατούς» υπολογιστές.

Αυτόματη εκφώνηση

Εκτός από τον απλό χρήστη ενός υπολογιστή, τα προγράμματα αναγνώρισης φωνής, αλλά και ειδικές συσκευές ίδιας αποστολής, χρησιμοποιούνται εδώ και μερικά χρόνια από διάφορους επαγγελματίες, αλλά και από ανθρώπους με ειδικές ανάγκες που δεν μπορούσαν να χρησιμοποιήσουν πληκτρολόγιο. Με τον καιρό, όμως, οι τιμές των προϊόντων αυτών μειώθηκαν και παράλληλα αυξήθηκαν οι επιδόσεις τους. Έτσι, φθάσαμε στην εποχή που μπορούμε πια να έχουμε υπολογιστές χωρίς πληκτρολόγια και hands free κινητά τηλέφωνα. Η αναγνώριση φωνής, βέβαια, δεν θα εφαρμοστεί μόνο για τη συγγραφή κειμένων ή για τηλεφωνικές κλήσεις, αλλά θα χρησιμοποιηθεί σε πλήθος συσκευών και προϊόντων, από την τηλεόραση έως το φούρνο μικροκυμάτων και από «έξυπνα» παιχνίδια έως το αυριανό στερεοφωνικό μας. Όπως σήμερα λέμε το «γραφικό περιβάλλον» του υπολογιστή μας, ίσως αύριο να λέμε το «φωνητικό»!
Σύντομα θα μπορούμε να... λέμε περισσότερα στον υπολογιστή μας, όπως: «Αποθήκευση», «Άνοιγμα αρχείου...» ή «Αποστολή e-mail» και αυτός να ακούει και να εκτελεί τις εντολές μας. Φανταστείτε τον αυριανό σας υπολογιστή ως μια σελίδα Α4 με πάχος μερικά εκατοστά. Μια επίπεδη, δηλαδή, συσκευή «οθόνη-υπολογιστής» σαν το TabletPC που παρουσίασε ο Bill Gates στην πρόσφατη έκθεση Comdex, στο Λας Βέγκας, χωρίς πληκτρολόγιο και με ασύρματη ικανότητα σύνδεσης στο Διαδίκτυο.
Σύμφωνα με έρευνες αγοράς, περισσότερα από τρία δισεκατομμύρια e-mail αποστέλλονται καθημερινά. Xρησιμοποιώντας όμως συστήματα «αναγνώρισης φωνής» τόσο για τη συγγραφή, αλλά και για την ανάγνωση αυτών, φανταστείτε πόσο λιγότερος χρόνος θα χρειάζεται για την παραγωγή τους από τους χρήστες. Πολλές εταιρείες, όπως η www.internetspeech.com, το γνωρίζουν και έχουν ήδη αρχίσει να κατασκευάζουν σελίδες που να πλοηγούνται με φωνητικές εντολές, αλλά και να εκφωνούνται πληροφορίες στους επισκέπτες. Η παραπάνω εταιρεία, μάλιστα, έχει αναπτύξει ένα σύστημα εκφώνησης του περιεχομένου των ιστοσελίδων χρησιμοποιώντας απλά μια τηλεφωνική συσκευή και τη φωνή μας (φωνητικές εντολές), χωρίς φυσικά την ανάγκη υπολογιστή. Προς το παρόν, το σύστημα αυτό διατίθεται μόνο στη Βόρεια Αμερική. Η τεχνολογία που εφαρμόζεται ονομάζεται NetECHO και αρχικά θα επιτρέπει στους χρήστες του Yahoo e-mail να λαμβάνουν φωνητικά το ηλεκτρονικό τους ταχυδρομείο από το τηλέφωνό τους... ακόμη κι αν δεν βρίσκονται κοντά σε υπολογιστή. Αξίζει να σημειωθεί ότι, ακόμη και σήμερα, δεν είναι λίγες οι φορές που λαμβάνουμε στη συσκευή μας οδηγίες ή εντολές από κάποια «τηλεφωνήτρια» που δεν υφίσταται ως φυσικό πρόσωπο, αφού είναι συσκευή «εκφώνησης». Το μέλλον της αυτόματης εκφώνησης σίγουρα είναι λαμπρό, μιας και θα ενταχθούν σ' αυτό δυνατότητες άμεσης μετάφρασης σε άλλη (ή άλλες) γλώσσα και δημιουργίας προσωπικού εκφωνητή στον υπολογιστή μας ή στο Internet, ο οποίος θα έχει την ικανότητα να μας διαβάζει ένα γερμανικό κείμενο σε άπταιστα ελληνικά.

Φωνητικές εντολές στο αυτοκίνητο

Οι φανατικοί των γκάτζετ θα πρέπει να τρίβουν τα χέρια τους, μιας και πολλά από τα επόμενα μοντέλα αυτοκινήτων θα περιέχουν συστήματα αναγνώρισης φωνητικών εντολών. Προς το παρόν, τα συστήματα αυτά θα τα βρει κανείς μόνο σε αυτοκίνητα πολυτελείας, όπως στην Τζάγκιουαρ S-type, που είναι η πρώτη του είδους που λειτουργεί με φωνητικές εντολές από το κλιματιστικό έως το ηχητικό της σύστημα. Ανάλογο σύστημα αναγνώρισης φωνής υπάρχει και στο κορυφαίο μοντέλο LS430 της Λέξους, αλλά και σε μερικά μοντέλα της Μερτσέντες. Το θέμα της χρήσης του ταμπλό του αυτοκινήτου χωρίς να...επεμβαίνουν τα χέρια μας (hands free), κατά τη διάρκεια της οδήγησης, σε μερικές χώρες είναι νόμος για λόγους ασφαλείας. Αυτή είναι μια περίπτωση, όπου η τεχνολογία αναγνώρισης φωνής κρίνεται απαραίτητη, εφόσον αυτή περιορίζει στο ελάχιστο τη χρήση οποιουδήποτε πλήκτρου στο ταμπλό του αυτοκινήτου, αφήνοντας τα χέρια μας ελεύθερα μόνο για το τιμόνι. Στα επόμενα χρόνια, θα δούμε πολλά τέτοια αυτοκίνητα. Δίχως άλλο, η τεχνολογία της αναγνώρισης φωνής είναι η καλύτερη είδηση για την αυτοκινητιστική βιομηχανία, μιας και θα της ανοίξει το δρόμο για μοντέλα νέας εποχής, χωρίς πλήκτρα και ρυθμιστικά στο ταμπλό, παρά μόνο με ένα τιμόνι και ένα μικρόφωνο.
Η αναγνώριση φωνής είναι στο δρόμο για την επανάσταση του τρόπου χρήσης μιας συσκευής, αλλά και του τρόπου επικοινωνίας της με το χρήστη της. Θα τοποθετηθούν μικρόφωνα παντού, από τον υπολογιστή μας έως το ταμπλό του αυτοκινήτου. Οι φωνητικές εντολές έρχονται να λύσουν χέρια...