Archiv für die Kategorie „Tastaturersatz“
MacSpeech veröffentlicht MacSpeech Scribe
Am 11. Februar 2010 veröffentlichte MacSpeech (Hersteller der marktführenden Spracherkennungssoftware MacSpeech Dictate für Macintosh) das Programm Macspeech Scribe, mit dem sich aufgenommene Diktate im Nachhinein in Text umwandeln lassen. Die Erweiterung ist derzeit nur auf Englisch verfügbar, für registrierte Macspeech-Kunden um 99 $ zu haben. Das Programm akzeptiert dazu die Formate .wav, .aif, .aiff, .m4v, mp4, und .m4a.
Makros für die Windows 7 Spracherkennung
Microsoft stellt ein ganz wesentliches Tool zur Erweiterung der Windows Spracherkennung zur Verfügung. Die so genannten „Windows Speech Recognition Macros“ erweitern die Spracherkennung in sowohl Windows Vista als auch Windows 7. Das Tool – kurz: WSR Macros – macht es möglich, benutzerdefinierte Sprachbefehle hinzuzufügen.
Befehle können einerseits für bestimmte Textphrasen (beispielsweise die eigene E-Mail-Adresse, Postanschrift oder etwa häufig verwendete komplizierte Passwörter…), für Tastenkombinationen, zum Starten von Programmen (oder auch Kommandozeilen-Befehlen), oder – sofern man sich auskennt – mit XML erstellt werden.
Weiters kann man auch schon existierende Befehle um benutzerdefinierte Sprachkommandos erweitern.
Die Erweiterung gibt es auf der Microsoft-Website zum Download. Als Systemanforderung gibt Microsoft das Betriebssystem Windows Vista an (sowohl 32 als auch 64 Bit), bei meinem Windows 7 lief die Erweiterung aber tadellos. Die Benutzeroberfläche des Tools ist in englischer Sprache, funktioniert aber genauso gut für die deutsche Spracherkennung (habe ich selbst ausprobiert).
Hilfe zur Einrichtung, Befehlsbeispiele und weitere Informationen finden sich auf code.msdn.microsoft.com/wsrmacros.
Die wichtigsten MacSpeech Dictate Befehle (Deutsch)
Da die meisten Macspeech Dictate-Befehle auch nach längerer Verwendung nicht merkbar sind, und ich deshalb immer die ausgedruckten Listen neben mir liegen haben muss, habe ich die wichtigsten Befehle nun zusammengefasst. Im Hilfemenü des Programms können alle Befehls-Listen ausgedruckt werden, allerdings sind da viele Befehle völlig unnötig – wie oft verwendet man wohl den Mail-Befehl „Kleine Postfachsymbole verwenden“?
Modi | |
Mikrofon Schlafmodus | Schaltet das Mikrofon in den Ruhezustand |
Fortfahren/Mikrofon aktivieren | Aktiviert das Mikrofon aus dem Ruhezustand |
Diktatmodus einschalten | Wechselt zum Diktat-Modus (Standardmodus) |
Buchstabiermodus einschalten | Wechselt zum Buchstabiermodus |
Befehlsmodus einschalten | Wechselt zum Befehlsmodus |
Allgemein | |
Öffne/starte „Programmname“ | Öffnet jedes Programm, das im Programme-Ordner abgelegt ist; bzw. wechselt zum Programm – sofern geöffnet |
Beende „Programmname“ | Beendet jedes Programm, das im Programme-Ordner abgelegt ist |
Programm beenden | Beendet das aktuelle Programm; entspricht Cmd-Q |
Programm ausblenden | Versteckt das aktuelle Programm; entspricht Cmd-H |
Alles auswählen | Wählt alles aus; entspricht Cmd-A |
Auswahl kopieren | Kopiert die Auswahl; entspricht Cmd-C |
Zwischenablage einsetzen | Entspricht Cmd-V |
Letzte Aktion widerrufen | Macht letzte Aktion rückgängig; entspricht Cmd-Z |
Bearbeiten neu | Erstellt ein neues Dokument; entspricht Cmd-N |
Bearbeiten schließen | Schließt das aktuelle Fenster; entspricht Cmd-W |
Bearbeiten öffnen | Entspricht Cmd-O |
Bearbeiten drucken | Druckt aktuelles Dokument; entspricht Cmd-P |
Nächstes Eingabefeld | Springt zum nächsten Eingabefeld und löscht dabei den Cache; entspricht im Wesentlichen dem Drücken der Tabulatortaste |
Dialogfenster | |
Drücke Abbrechen | Klickt auf die Schaltfläche „Abbrechen“ |
Drücke Nicht sichern/Sichern | Klickt auf die Schaltfläche „Nicht sichern“/“Sichern“ |
Drücke OK/Verbinden | Klickt auf die Schaltfläche „OK“ bzw. „Verbinden“ |
Wichtige Tasten | |
Drücke Enter | Drückt die Eingabetaste (Enter-Taste) |
Drücke Löschen | Drückt die Rücktaste (Löschtaste) |
Leertaste | Drückt die Leertaste |
Tabulatortaste | Drückt die Tabulatortaste |
Drücke Bild auf | Drückt die Taste „Bild nach oben“ |
Drücke Bild ab | Drückt die Taste „Bild nach unten“ |
Pfeiltaste links/rechts/runter/hoch | Drückt die Pfeiltaste links, rechts, hinunter bzw. hinauf |
Diktieren | |
Lösche Passage | Löscht alles, was nach der letzten Sprechpause diktiert worden ist |
Zum Textanfang/Textende bewegen | Setzt die Einfügemarke an den Anfang bzw. ans Ende |
Texterkennung-Fenster einblenden | Blendet Alternativen ein und ermöglicht das Hinzufügen neuer Wörter |
Verwende/Wähle 2 [usw.] | Wählt die zweite Alternative des Texterkennungsfensters aus |
Bearbeite/Editiere 2 [usw.] | Bearbeitet die zweite Alternative des Texterkennungsfensters, somit können auch neue Wörter hinzugefügt werden |
Dokument zwischenspeichern | Liest den Inhalt des Fensters neu ein (nach Bearbeitungen mittels Tastatur nötig) |
Alle neuen E-Mails empfangen | Ruft neue Nachrichten aller Konten ab |
Neue E-Mail erzeugen | Erstellt eine neue E-Mail-Nachricht |
E-Mail senden | Sendet aktuelles E-Mail |
E-Mail beantworten | Öffnet ein Antwort-E-Mail der ausgewählten Nachricht |
Nachricht weiterleiten | Leitet die ausgewählte Nachricht weiter |
Eine kleine Anmerkung zur Logik der Befehle: Warum wird einmal das Wort „E-Mail“, ein anderes mal das Wort „Nachricht“ verwendet? Warum darf ich „Leertaste“ sagen, aber nicht „Rücktaste“ oder „Löschtaste“? Wo bleibt die Kontinuität?
Handschrifterkennung bei Windows 7 als Tastaturersatz
Dem viel gerühmten Betriebssystem Windows 7 ist eine Handschrifterkennung beigelegt, die die eigene Handschrift erkennen und in Druckschrift umwandeln soll. Doch arbeitet die Erkennung genau genug, um als Tastaturersatz dienen zu können? Kann man auch mit schlecht leserlicher Handschrift schnell genug arbeiten, um die Handschrifterkennung verwenden zu können? Diesen Fragen bin ich im Test nachgegangen.
Als Eingabegerät habe ich das bereits getestete Bamboo-Tablet verwendet. Die Treiber werden unter Windows 7 automatisch und ohne Probleme installiert, es öffnet sich auch sofort das Eingabefenster, welches zur Eingabe dienen soll. Neben der Bildschirmtastatur findet sich hier auch die Fläche, in die handschriftlich geschrieben werden soll:
Ein geschriebenes Wort wird sofort in Druckschrift umgewandelt. Ausbessern kann man mittels tippen auf das auszubessernde Wort, dann kann man Fehler überschreiben, Buchstaben mittels Durchstreichen löschen. Ein richtig erkannter Satz kann mittels der „Einfügen“-Schaltfläche in jedes x-beliebige Programm (z. B. Word) eingefügt werden, was ohne Probleme funktioniert. Die Bedienung des Eingabeprogramms läuft tadellos, ist durchdacht und durchgehend intuitiv gestaltet. Zusätzlich fungiert ein kleines Demo-Fenster als Art Hilfe und Tutorial zu Beginn, falls man Probleme hat.
Zur Verbesserung der Handschrifterkennung kann und sollte man unter der Schaltfläche „Extras“/“Handschrifterkennung anpassen“ die eigene Handschrift trainieren.
Ich selbst habe 50 Sätze in meiner zugegebenermaßen recht unleserlichen Handschrift eingegeben – die teilweise schon von Menschen schwer zu entziffern ist. Funktioniert es beim Computer also besser? Diese Frage muss ich leider mit einem klaren Nein beantworten. Mit meiner durchschnittlichen Schreibgeschwindigkeit geschriebenen Sätze werden vom Computer gar nicht erkannt, er spukt stattdessen abenteuerliche Buchstabenkombinationen aus – obwohl ich ja 50 Sätze trainiert habe. Wenn ich langsam und bemüht deutlich schreibe, verbessert sich die Erkennung enorm, dennoch muss ich jedes dritte Wort ausbessern, da sich ein Fehler darin verbirgt. Und das nur bei Wörtern, die in der Datenbank sind – ein Fremdwort oder ungewöhnlicheres Wort muss man meist einzeln buchstabieren (beispielsweise englische Wörter). Ob die Handschrifterkennung mit längerer Verwendung besser wird bezweifle ich – dennoch: solange habe ich die Erkennung noch nicht getestet.
Um einen längeren Text zu verfassen, muss man jedenfalls über viel Geduld und ein wirklich ergonomisches Eingabegerät verfügen – sonst wird die Eingabe zur Qual.
Hat man bereits ein Schreibgerät wie ein Tablet zuhause liegen, sollte man die Handschrifterkennung von Windows 7 unbedingt einmal ausprobieren, vielleicht klappt es bei dem einen oder anderen ja besser. Zur Eingabe von Texten empfehle ich aber eindeutig die Verwendung einer Spracherkennungssoftware, da längere Texte mit dieser deutlich schneller zu verfassen sind, und (fast) keine physische Belastung darstellt.
Was außerdem sehr nützlich sein kann sind so genannte Stiftbewegungen (engl. „Pen Flicks“), mit denen man einige häufig verwendete Befehle über spezielle Bewegungsgesten eingeben kann.
So aktivierst du Gesten unter Windows 7: In das Suchfeld des Startmenüs gib „Stift“ ein, dann wähle den Systemsteuerungpunkt „Stift- und Fingereingabe“ aus. Im Tab „Bewegungen“ kannst du die Gesten aktivieren.
Dennoch funktionieren kommerzielle Handschrifterkennungsprogramme vielleicht noch besser: Eine Variante wäre das 40$ teure ritePen von Evernote Corporation. Zusätzlich zur Schrifterkennung unterstützt das Programm auch die Erkennung von Gesten, was unter Umständen äußerst nützlich sein kann. Bei ritePen kann außerdem über den ganzen Bildschirm geschrieben werden. Das Programm gibt auch als Demoversion zum Download, wo es schon viel besser abschneidet als die hauseigene Version von Windows 7: unbedingt ausprobieren!
Testvideo zur Windows 7 Spracherkennung
Ein sehr informatives Video zur Spracherkennung von Windows 7 hat windowsblog.at herausgegeben, offensichtlich das beste Video auf der YouTube-Plattform.
Testbericht MacSpeech Dictate International Deutsch
Der erste Eindruck
MacSpeech Dictate International Deutsch beweist eine sehr gute Erkennungsqualität. Die eingebaute Dragon-Engine macht sich hier bemerkbar. Schon nach dem kurzem Anfangstraining (circa 7 min) erkennt die Software nahezu alles – natürlich nur was im Wortschatz ist – problemlos.
Wie das Hinzufügen und Trainieren neuer Wörter funktioniert, habe ich noch nicht herausgefunden. Denn mit den Befehlen bei MacSpeech Dictate ist das so eine Sache: Sie sind überhaupt nicht logisch. Die Steuerungs-Befehle von Dragon NaturallySpeaking hatte ich in weniger Zeit erlernt, einfach weil sie logisch und natürlich sind.
Einige Beispiele als Gegenüberstellung:
Dragon NaturallySpeaking | MacSpeech Dictate |
Mach das rückgängig/Rückgängig machen | Letzte Aktion widerrufen |
Gehe ans Ende | Zum Textende bewegen |
Kopier das | Auswahl kopieren |
Füge das ein | Zwischenablage einsetzen |
Lösche das | Lösche Passage |
Die vordefinierten MacSpeech Dictate-Befehle sind sehr holprig und absolut nicht natürlich. Nicht einmal für die Mikrofonsteuerung (Mikrofon aktivieren/deaktivieren) gibt es zwei äquivalente Befehle. Um das Mikrofon in den Schlafmodus zu versetzen, muss ich sagen „Mikrofon Schlafmodus“, um es aufzuwecken „fortfahren/Mikrofon aufwecken/aufwachen/wieder zu hören/Mikrofon aktivieren“ – also nichts ähnliches. Um es nochmal mit Dragon NaturallySpeaking zu vergleichen, hier habe ich zwei simple Befehle: „wach auf“ und „geh schlafen“. Und ich könnte hier noch einige andere Beispiele aufführen.
Das absolut positive an MacSpeech Dictate ist die Möglichkeit, alle Sprachbefehle bearbeiten und auch neue hinzufügen zu können (bei Dragon NaturallySpeaking können Befehle nur ab der Professional-Version hinzugefügt werden). Ich kann also alle Befehle individuell verändern, sowohl den Ausdruck den ich sprechen soll, als auch das, was der Befehl ausführen soll. Wie ich sehe ist beispielsweise der Tastenkombination Command-W der Befehlsspruch „Bearbeiten schließen“ zugeordnet. Diesen könnte ich ändern auf „Fenster schließen“, was ja viel logischer ist.
Bei jedem Befehl der mir unklar erscheint, kann ich außerdem nachschauen, was dieser in Wirklichkeit tut. Vorausgesetzt ich verstehe einwenig AppleScript.
Ein Kritikpunkt der schon von vielen angesprochen wurde ist der Umgang mit dem Ausbessern von Diktaten. Sobald man mit Maus oder Tastatur nachhilft, ist die Spracherkennungssoftware verwirrt. Ausbessern mittels Sprache funktioniert dann so gut wie gar nicht mehr. Sogar das Diktieren verursacht dann manchmal Fehlfunktionen, wie beispielsweise das Einfügen scheinbar zufälliger Buchstaben. MacSpeech Dictate weist im Handbuch auf die Unverträglichkeit von Maus/Tastatur und Sprache ausdrücklich hin (die „goldene Regel“), dennoch könnte die Verträglichkeit viel besser sein und das Programm noch stabiler laufen als bisher (Dragon NaturallySpeaking toleriert Maus und Tastatur fast anstandslos).
Conclusio
Alles in allem kann ich die Spracherkennungssoftware MacSpeech Dictate aber jetzt schon auf jeden Fall empfehlen, schon allein wegen der hohen Erkennungsrate.
Über die Steuerung und die weiteren Fähigkeiten des Programms werde ich nach längerer Testzeit besser berichten können, dies war erstmal der erste Eindruck, ein Demonstrationsvideo folgt dann auch noch.
Herstellerwebseite: macspeech.com
<tr>
<td width=“278″><strong>Dragon NaturallySpeaking</strong></td>
<td width=“199″><strong>MacSpeech Dictate</strong></td>
</tr>
<tr>
<td>Mach das rückgängig/Rückgängig machen</td>
<td>Letzte Aktion widerrufen</td>
</tr>
<tr>
<td>Gehe ans Ende</td>
<td>Zum Textende bewegen</td>
</tr>
<tr>
<td>Kopier das</td>
<td>Auswahl kopieren</td>
</tr>
<tr>
<td>Füge das ein</td>
<td>Zwischenablage einsetzen</td>
</tr>
<tr>
<td>Lösche das</td>
<td>Lösche Passage</td>
</tr>
</table>
apfeltalk testet MacSpeech Dictate Deutsch
apfeltalk.de veröffentlichte vor einem Monat einen Testbericht beziehungsweise ein Demo-Video zur deutschen Version von MacSpeech Dictate. Wie mir ein User (in den Kommentaren gepostet) bestätigt, ist die Steuerung bei MacSpeech Dictate zur Textverbesserung einfach nur grauenhaft. Man darf keineswegs in Versuchung kommen mit Maus und Tastatur nachhelfen zu wollen, dann ist der Text mit der Sprachsoftware überhaupt nicht mehr verbesserbar. Bei Dragon NaturallySpeaking gibt es in dieser Hinsicht keine Probleme, da kann ich noch so oft mit Maus und Tastatur dazwischen fummeln…
Zum Artikel: http://www.apfeltalk.de/forum/test-macspeech-dictate-t261452.html
MacSpeech Dictate Screencast from Apfeltalk on Vimeo.
Ein weiterer Test von macwelt.de kommt zu ähnlichem Ergebnis: Texterkennung gut, Steuerung/Navigation noch deutlich verbesserungswürdig.
Neues zu Project Natal, Xbox 360
Die Bewegungssteuerung (sowie Stimmen- und Gesichtserkennung) für die Xbox 360 soll im November 2010 zu äußerst günstigen Preisen erscheinen, berichtet Golem.
Näheres: golem.de
Peregrine: Handschuhsteuerung
Eine neuartige Computersteuerung hat die Firma Peregrine (Bereits im Juni dieses Jahres bei der „Electronic Entertainment Expo) vorgestellt: Einen Handschuh für die Computersteuerung. 27 Sensoren auf vier Fingern schaffen bis zu 250 Aktionen pro Sekunde (APS). Der Handschuh ist für das Computerspielen entwickelt worden, um die Steuerung „schneller, exakter und komfortabler“ zu machen.
Sobald der Handschuh erhältlich ist, kann ich über die Steuerung des Computers mit diesem Gerät berichten.
Laut Peregrine soll der Handschuh diesen Herbst auf den Markt kommen, bis jetzt ist es allerdings noch nicht so weit. Die Kosten des Handschuhes belaufen sich auf circa 130 $.
Meldungen:
derStandard.at
GIZMODO
Herstellerwebsite: http://www.theperegrine.com
Beim Spielen von WarCraft III: