Εργασία με Αναγνώριση ομιλίας: Εντολές, Υπαγόρευση κειμένου & Περιήγηση στον Ιστό

Το λογισμικό αναγνώρισης ομιλίας στα Windows 7 είναι εκπληκτικά εξελιγμένο. Η Microsoft(Microsoft) ενσωμάτωσε σε αυτό πολλές δυνατότητες που, κάποτε, ήταν διαθέσιμες μόνο σε ακριβό λογισμικό αναγνώρισης ομιλίας τρίτων. Το Speech Recognition(Speech Recognition) είναι εύκολο στη χρήση, αλλά όπως συμβαίνει με όλα τα εξελιγμένα λογισμικά, θα χρειαστεί να μάθετε μερικά βασικά για να μπορέσετε να μιλήσετε με τον υπολογιστή σας τόσο άπταιστα όσο μιλάτε με τους φίλους σας. Τα βασικά περιλαμβάνουν: πώς να ξεκινήσετε την Αναγνώριση ομιλίας(Speech Recognition) , κοινές εντολές, την εισαγωγή κειμένου, την πραγματοποίηση διορθώσεων και την περιήγηση στον Ιστό.

Στο προηγούμενο άρθρο ( Εργασία με Αναγνώριση ομιλίας: Ρύθμιση και διαμόρφωση(Working with Speech Recognition: Setup and Configuration) ), συζήτησα τη ρύθμιση του εξοπλισμού σας για επιτυχία με την Αναγνώριση ομιλίας(Speech Recognition) . Θα ξεκινήσω εδώ υποθέτοντας ότι περάσατε από τα βήματα, συμπεριλαμβανομένου του ενσωματωμένου σεμιναρίου της Microsoft , και είστε πλέον έτοιμοι να ξεκινήσετε.

ΣΗΜΕΙΩΣΗ:(NOTE:) Δεν πρόκειται να μιλήσω για όλα όσα μπορείτε να κάνετε με την Αναγνώριση ομιλίας(Speech Recognition) —για αυτό θα έπρεπε να γράψω ένα βιβλίο! Αλλά θα συζητήσω τις πιο κοινές χρήσεις, τη γραφή και την περιήγηση.

Έναρξη Αναγνώρισης ομιλίας

Πριν ξεκινήσουμε, κλείστε όλες τις άλλες εφαρμογές που έχετε ανοίξει στην οθόνη σας. (Αυτό είναι μόνο για λόγους μάθησης—μπορείτε να έχετε ανοιχτές όσες εφαρμογές θέλετε, αφού είστε ενήμεροι για τον τρόπο λειτουργίας της Αναγνώρισης ομιλίας(Speech Recognition) και μπορείτε να μιλήσετε στον υπολογιστή σας για να τον κατευθύνετε ώστε να μεταβεί σε άλλες εφαρμογές. )

Μπορείτε απλώς να πληκτρολογήσετε ομιλία(speech) στο πλαίσιο αναζήτησης του Μενού Έναρξη , να επιλέξετε (Start Menu)Αναγνώριση ομιλίας(Speech Recognition) και να αρχίσετε να μιλάτε — αλλά υπάρχει ένας πολύ καλός λόγος για να προχωρήσετε πολύ σε αυτήν την περίπτωση. Μεταβείτε στον Control Panel -> Ease of Access -> Speech Recognition και κάντε κλικ στο Αναγνώριση ομιλίας(Speech Recognition) .

Αναγνώρισης ομιλίας

Όπως μπορείτε να δείτε, έχετε ήδη φροντίσει για τα περισσότερα από αυτά. Παρακάμψτε(Skip) το Εκπαιδεύστε τον υπολογιστή σας για να σας καταλάβω καλύτερα(Train your computer to better understand you) (θα ασχοληθώ με αυτό στο επόμενο άρθρο, όπου θα συζητήσω την αντιμετώπιση προβλημάτων) και κάντε κλικ στο Άνοιγμα της κάρτας αναφοράς ομιλίας(Open the Speech Reference Card) .

Αναγνώρισης ομιλίας

Αυτό σας δίνει ένα ευρετήριο θεμάτων βοήθειας προς εξερεύνηση. Προς το παρόν, κάντε κλικ στις Κοινές εντολές αναγνώρισης ομιλίας(Common speech recognition commands) .

Αναγνώρισης ομιλίας

Θα δείτε ένα ωραίο γράφημα με τις πιο συχνά χρησιμοποιούμενες εντολές και τι πρέπει να πείτε για να τις ενεργοποιήσετε. Θα σας συμβούλευα να το εκτυπώσετε, για να το έχετε στη διάθεσή σας όσο μαθαίνετε πώς λειτουργεί η Αναγνώριση ομιλίας(Speech Recognition) .

Αναγνώρισης ομιλίας

Η λίστα βρίσκεται επίσης εδώ: Κοινές εντολές στην Αναγνώριση ομιλίας(Common commands in Speech Recognition) .

Τώρα είστε έτοιμοι! Κάντε κλικ στο Έναρξη αναγνώρισης ομιλίας(Start speech recognition) . Θα δείτε το gadget Αναγνώρισης ομιλίας(Speech Recognition) στο επάνω μέρος της οθόνης σας και θα κελαηδήσει για να σας πει ότι είναι ενεργό. Από προεπιλογή, όμως, δεν σας "ακούει" μέχρι να το πείτε.

Αναγνώρισης ομιλίας

Υπενθύμιση:(A reminder:) Θα πρέπει να έχετε μια κενή επιφάνεια εργασίας με το gadget Αναγνώρισης ομιλίας(Speech Recognition) στο επάνω μέρος.

Τώρα, βεβαιωθείτε ότι το μικρόφωνό σας είναι συνδεδεμένο, βεβαιωθείτε ότι υπάρχει όσο το δυνατόν λιγότερος θόρυβος στο φόντο και πείτε "Start listening". Θα δείτε ότι το gadget σας το υπενθυμίζει χρήσιμα.

Αναγνώρισης ομιλίας

Αυτή είναι η μόνη φράση που το Speech Recognition θα «ακούει» όταν είναι σε αδράνεια. Τίποτα άλλο δεν θα το ξυπνήσει. Μπορείτε να πειραματιστείτε με αυτό, αν θέλετε, προτού πείτε στο Speech Recognition αυτό που θέλει να ακούσει. Στη συνέχεια, πείτε "Start listening" και θα είστε έτοιμοι να το δοκιμάσετε.

Αναγνώρισης ομιλίας

Υπαγόρευση κειμένου(Text) με αναγνώριση ομιλίας(Speech Recognition)

Τώρα που το πρόγραμμα Αναγνώρισης ομιλίας(Speech Recognition) είναι ενεργό, τι μπορείτε να κάνετε με αυτό; Υπάρχουν μερικά πράγματα που πρέπει να θυμάστε. Εάν δεν έχετε εφαρμογές που εκτελούνται ενεργά, δεν μπορείτε να κάνετε πολλά σε αυτό το σημείο. Πείτε "Έναρξη"("Start") για να ανοίξετε το μενού(Start Menu) "Έναρξη" . Εφόσον η Αναγνώριση ομιλίας(Speech Recognition) είναι προϊόν της Microsoft , λειτουργεί με μεγαλύτερη επιτυχία με άλλα προϊόντα της Microsoft(Microsoft) . Ας επιλέξουμε λοιπόν το Σημειωματάριο(Notepad) για να πειραματιστούμε.

Ο τρόπος εκκίνησης του Σημειωματάριου(Notepad) εξαρτάται από τον τρόπο διαμόρφωσης του Μενού Έναρξης . (Start Menu)Εάν το Σημειωματάριο(Notepad) είναι ένα στοιχείο που είναι ορατό όταν ανοίγετε το μενού "Έναρξη(Start Menu) " , απλώς πείτε "Σημειωματάριο". ("Notepad.")Εάν δεν υπάρχει, πείτε "Όλα τα προγράμματα"("All programs,") και μετά "Αξεσουάρ"("Accessories,") και μετά "Σημειωματάριο". Το Σημειωματάριο("Notepad." Notepad) είναι ανοιχτό και έτοιμο για χρήση.

Και τώρα τι? Απλώς αρχίστε να μιλάτε. Εδώ, δοκιμάζω μια γνωστή φράση. Το μιλώ με κανονικό τόνο συνομιλίας και με κανονική ταχύτητα.

Αναγνώρισης ομιλίας

Περίμενε(Wait) , δεν είναι σωστό. Δεν υπάρχουν σημεία στίξης ή κεφαλαία και δύο λέξεις είναι λάθος. Πώς μπορώ να το διορθώσω;

Χρησιμοποιήστε την εντολή επιλογή(select) για να επιλέξετε κάθε λέξη που έχει πρόβλημα. Εδώ, είπα "Επιλέξτε φίλους".("Select friends." )

Αναγνώρισης ομιλίας

Τι φταίει αυτή η λέξη; Μετά από αυτό δεν υπάρχει κόμμα, όπως θα έπρεπε. Αφού λοιπόν επιλεγεί το "Friends" , λέω "Friends Comma". Εμφανίζεται ένα παράθυρο με μια λίστα πιθανών επιλογών

Αναγνώρισης ομιλίας

Λέω "Ένα"("One") για να επιλέξω το πρώτο στοιχείο και μετά λέω "OK" για να το εγκρίνω.

Αναγνώρισης ομιλίας

Προχωρώντας στην πρόταση, επιλέγω "Romans" και λέω "Romans Comma". Ανεβάζει ξανά το πλαίσιο και για άλλη μια φορά επιλέγω το αντικείμενο που θέλω.

Αναγνώρισης ομιλίας

Διορθώνω την ορθογραφία των «επαρχιωτών»("countrymen") και «αυτιών»("ears") επιλέγοντάς τα, λέγοντας τη λέξη πιο καθαρά και επιλέγοντας τη σωστή ορθογραφία. Όταν τελειώνω με τα «αυτιά»("ears") λέω «θαυμαστικό».("exclamation point.")

Αναγνώρισης ομιλίας

Τώρα συνεχίζω με μια άλλη πρόταση, φροντίζοντας να πω και τα σημεία στίξης. Το Speech Recognition(Speech Recognition) με καταλαβαίνει πολύ καλύτερα αυτή τη φορά. Το μόνο που χρειάζεται να κάνω είναι να επιλέξω το "caesar", να το γράψω με κεφαλαία και τελείωσα.

Αναγνώρισης ομιλίας

Τώρα, θέλω να τελειώσω αυτή τη γραμμή και να πάω σε άλλη γραμμή. Υπάρχουν δύο τρόποι για να γίνει αυτό. Αν πω "Νέα γραμμή",("New line,") ο κέρσορας πέφτει στο επόμενο διάστημα κάτω από αυτό που εμφανίζεται στην οθόνη.

Αναγνώρισης ομιλίας

Αν πω "Νέα παράγραφος",("New paragraph") ο κέρσορας πέφτει δύο γραμμές, οπότε θα υπάρχει κενό μεταξύ των παραγράφων.

Αναγνώρισης ομιλίας

Εξασκηθείτε(Practice) στην ομιλία προτάσεων και παραγράφων, ώστε να μπορείτε να δείτε πώς λειτουργεί. Πιθανότατα θα χρειαστεί να μιλήσετε πιο αργά από ό,τι σε μια συνομιλία και πιθανότατα θα πρέπει να διορθώσετε τα πράγματα καθώς προχωράτε, αλλά η Αναγνώριση ομιλίας(Speech Recognition) μαθαίνει γρήγορα και αφού εξασκηθείτε για λίγα λεπτά, η ακρίβεια αναγνώρισης θα είναι αισθητά βελτιωμένο.

Ας υποθέσουμε ότι τώρα θέλω να αποθηκεύσω αυτό το έγγραφο. Πώς θα το έκανα αν χρησιμοποιούσα τα μενού (και όχι ένα πλήκτρο συντόμευσης); Θα έκανα κλικ στο Αρχείο(File) και στην Αποθήκευση ως(Save As) . Και αυτό κάνω τώρα. Λέω "Αρχείο"("File") και "Αποθήκευση ως"("Save As") και εκφωνώ ένα όνομα αρχείου στο μενού " Αποθήκευση ως(Save As) ".

Αναγνώρισης ομιλίας

Τι γίνεται όμως αν αποδειχθεί ότι δεν μου αρέσει αυτό που έχω στο έγγραφο του Σημειωματάριου(Notepad) και θέλω απλώς να διαγράψω τα πάντα; Η επιλογή "Επιλογή όλων"("Select all") επισημαίνει όλο το κείμενο και η "Διαγραφή"("Delete") απαλλαγεί από αυτό.

Αναγνώρισης ομιλίας

Όταν ολοκληρώσετε την εξάσκηση, πείτε "Κλείσιμο Σημειωματάριου". ("Close Notepad.")Θα ερωτηθείτε εάν θέλετε να αποθηκεύσετε όσα έχετε γράψει και μπορείτε να πείτε "Αποθήκευση"("Save") ή "Μην αποθηκεύσετε"("Don't save") όπως προτιμάτε.

Χρήση αναγνώρισης ομιλίας(Speech Recognition) με τον Internet Explorer

Όπως ανέφερα, το Speech Recognition(Speech Recognition) λειτουργεί καλύτερα με άλλο λογισμικό της Microsoft(Microsoft) . Το ενσωματωμένο σεμινάριο της Microsoft σάς έδειξε το (Microsoft)Σημειωματάριο(Notepad) και το WordPad και έριξε μια σύντομη ματιά στον Internet Explorer . Ας(Let) διερευνήσουμε τη χρήση της Αναγνώρισης ομιλίας(Speech Recognition) με τον Internet Explorer λίγο περισσότερο.

Πείτε "Έναρξη"("Start") για να ανοίξετε το μενού έναρξης. Ακόμα κι αν ο Internet Explorer δεν εμφανίζεται, πείτε "Internet Explorer" και θα ανοίξει. Στη συνέχεια, πείτε "Διεύθυνση". ("Address.")Αυτό θα σας μεταφέρει στη γραμμή URL στο επάνω μέρος της οθόνης. Μπορεί να εμφανίζει έναν αριθμό σε μια μπλε γραμμή.

Αναγνώρισης ομιλίας

Πείτε αυτόν τον αριθμό και μετά πείτε "OK". Όπως μπορείτε να δείτε, το gadget θα σας υπενθυμίσει τι περιμένει να κάνετε εδώ.

Αναγνώρισης ομιλίας

Πείτε "www dot επτά tutorials dot com." ("w w w dot seven tutorials dot com.")Ωχ. Η Αναγνώριση ομιλίας(Speech Recognition) δεν την εμφανίζει σωστά.

Αναγνώρισης ομιλίας

Πείτε "διαγράψτε το". ("delete that.")Στη συνέχεια, πείτε "Spell it" και μιλήστε κάθε μεμονωμένο χαρακτήρα. Θα χρειαστεί να πείτε «περίοδος»("period") αντί για «κουκκίδα». ("dot.")Θα χρειαστεί να πείτε "Αριθμός επτά"("Number seven") για να λάβετε τον αριθμό 7 και, στη συνέχεια, να γράψετε την υπόλοιπη διεύθυνση ιστού.

Αναγνώρισης ομιλίας

Στη συνέχεια, πείτε "OK". Η διεύθυνση μεταφέρεται στη γραμμή URL . (Μπορεί να σας ζητηθεί να προσθέσετε τη λέξη στο λεξικό. Αυτό εξαρτάται από εσάς.) Μόλις η διεύθυνση βρεθεί στη γραμμή URL , πείτε "Πατήστε enter". ("Press enter.")Και ορίστε.

Αναγνώρισης ομιλίας

ΣΗΜΕΙΩΣΗ:(NOTE:) Όταν εκφωνείτε μια διεύθυνση ιστού στη γραμμή URL , μπορείτε να πείτε "κουκκίδα"("dot") αντί για "περίοδος". ("period.")Και πρέπει να πείτε τη διεύθυνση ταυτόχρονα. Μην κάνετε παύση. Μια παύση κάνει την Αναγνώριση ομιλίας(Speech Recognition) να πιστεύει ότι θέλετε να ξεκινήσετε μια νέα πρόταση.

Τι γίνεται αν θέλετε να διαβάσετε ένα άρθρο για τα 7 Tutorials ; Πώς θα το επιλέγατε; Πείτε "εμφάνιση αριθμών". ("show numbers.")Κάθε στοιχείο στη σελίδα επικαλύπτεται με έναν αριθμό σε ένα μπλε πλαίσιο. Πείτε τον αριθμό του άρθρου που θέλετε να διαβάσετε (εδώ, είναι ο αριθμός 34). Στη συνέχεια, πείτε "OK".

Αναγνώρισης ομιλίας

Πείτε "OK" και το άρθρο θα ανοίξει. (Θα πρέπει επίσης να επωφεληθείτε πλήρως από αυτή τη μεγάλη προσφορά.)

Αναγνώρισης ομιλίας

Και υπάρχουν περισσότερα

Όπως μπορείτε να δείτε, η Αναγνώριση ομιλίας(Speech Recognition) είναι εκπληκτικά εύκολη στη χρήση, από την αρχή. Το να το συνηθίσεις είναι απλώς θέμα εξάσκησης. Δοκιμάστε να επιλέξετε τα αγαπημένα σας προγράμματα από το μενού Έναρξη(Start Menu) και δείτε τι μπορείτε να κάνετε με αυτά. Δεν θα λειτουργήσουν όλοι. (Φαίνεται ότι τα προγράμματα της Adobe δεν είναι πραγματικά συμβατά, για παράδειγμα.) Ο μόνος τρόπος για να μάθετε τι είναι συμβατό και τι όχι είναι να δοκιμάσετε. Εάν υπάρχουν προγράμματα που χρησιμοποιείτε συνεχώς, τα οποία δεν είναι συμβατά με αυτήν την ενσωματωμένη Αναγνώριση ομιλίας(Speech Recognition) και διαπιστώσετε ότι προτιμάτε να μιλάτε στον υπολογιστή σας, θα θέλετε να εξερευνήσετε πιο εξελιγμένες επιλογές από άλλες εταιρείες. όπως το Dragon NaturallySpeaking Premium 11.5 .

Στο επόμενο άρθρο, θα μιλήσω για την αντιμετώπιση προβλημάτων της Αναγνώρισης ομιλίας(Speech Recognition) και την επίλυση μερικών από τα πιο κοινά προβλήματα. Στο μεταξύ, συνεχίστε να εξασκείτε και να πειραματίζεστε. Νομίζω ότι θα εκπλαγείτε ευχάριστα από το πόσο καλά λειτουργεί.



About the author

Είμαι μηχανικός λογισμικού με πάνω από 10 χρόνια εμπειρίας στον κλάδο του Xbox. Ειδικεύομαι στην ανάπτυξη παιχνιδιών και στις δοκιμές ασφαλείας. Είμαι επίσης έμπειρος κριτικός και εργάζομαι σε έργα για μερικά από τα μεγαλύτερα ονόματα του gaming, συμπεριλαμβανομένων των Ubisoft, Microsoft και Sony. Στον ελεύθερο χρόνο μου, μου αρέσει να παίζω βιντεοπαιχνίδια και να παρακολουθώ τηλεοπτικές εκπομπές.



Related posts