Archiv für Februar 2010

Testvideo zu MacSpeech Dictate Deutsch

<-- Zurück zum Hauptartikel

 

Zur Demonstration der deutschen Variante von MacSpeech Dictate International habe ich ein kleines Testvideo hochgeladen. Kommentare bitte posten!

Hier der Testbericht – nach zwei Monaten Verwendung:

 

Texterkennung

Die Spracherkennungssoftware habe ich nun seit circa zwei Monaten in Verwendung, besitze also ein trainiertes Profil. Die Texterkennung funktioniert demnach sehr gut, genauso gut wie bei Dragon NaturallySpeaking. Alle Wörter des Macspeech-Wortschatzes werden eigentlich problemlos erkannt (wie im Video zu sehen), ausbessern ist beispielsweise nur bei Fremdwörtern nötig. Im Diktatfenster von Macspeech und in Textedit läuft das Diktieren und auch Ausbessern weit besser als beispielsweise in Pages oder Texteingabefeldern auf Webseiten. Das Ausbessern mit dem Texterkennungsfenster ist ein wenig happig, meist muss die ganze Phrase editiert werden. Allerdings lernt die Software ohne Ausbessern nicht dazu. Setzt man hierfür die Tastatur ein, muss man aufpassen. Wenn Tastatur und Spracherkennung gleichzeitig verwendet werden, bricht man nach dem Macspeech-Handbuch die „goldene Regel„. Das Programm ist dann meistens wirklich verwirrt und weiß nicht mehr wo hinten und vorne ist. Dazu hat Macspeech jedoch einen eigenen Befehl eingebaut: Dokument zwischenspeichern. Dieser Befehl liest den gesamten Text nochmals ein, danach kennt sich die Spracherkennungssoftware wieder vorzüglich aus 😉

 

Befehle

Die Macspeech-Dictate Befehle sind wahrhaftig schwer zu erlernen. Für jedes Programm gibt es quasi einen eigenen Befehlssatz, obwohl man beispielsweise für einen Befehl wie CMD-N (neues Dokument, Datei, …) – und viele andere systemweite Tastenkombinationen – universelle Sprachbefehle verwenden könnte. Ein leersehr anschauliches Beispiel für die Befehle ausschneiden, kopieren und einfügen sei hier noch erwähnt: Dragon NaturallySpeaking verwendet hierfür „schneide das aus“, „kopier das“ und „füge das ein“. Ich würde sagen: einfach und intuitiv.
Bei Macspeech Dictate hingegen lauten diese „Auswahl ausschneiden“, „Auswahl kopieren“ und „Zwischenablage einsetzen“. Völlig verwirrend ist das dann, wenn Macspeech für den Befehl „Lösche Passage“ kein Infinitiv mehr verwendet.
Man kann nur hoffen, dass sich hier durch die Übernahme von Nuance einiges tun wird.

 

Fazit

Im Großen und Ganzen ist das Programm brauchbar, die Texterkennung sehr schnell und gut. Wenn man kleine Erkennungsfehler mit Tastatur ausbessert, ist man sicherlich schneller als beim Tippen. Die Steuerung und das „Handling“ lässt allerdings noch zu wünschen übrig, hier ist viel Verbesserungpotenzial vorhanden – eine Maussteuerung ist aber beispielsweise inoffiziell schon angekündigt.
Preislich ist Macspeech Dictate mit knapp 230 € für die deutsche Variante noch weitaus teurer als Dragon NaturallySpeaking. Ob sich das  „auszahlt“ sich jeder selbst überlegen.

 

Computer mit den Augen steuern

Bei der diesjährigen GSMA Mobilfunkmesse in Barcelona stellte die Firma NTT DoCoMo eine zukunftsträchtige Steuerungsmethode vor. Mittels Augenbewegungen steuerte ein Mitarbeiter der Firma die Wiedergabe von Musik: Stopp, Pause, Zurückspulen, nächster Titel…
Die Technologie funktioniert selbst bei geschlossenen Augen und ist im Gegensatz zur Spracherkennung unempfindlich auf Umgebungsgeräusche.
Für eine Marktreife braucht es allerdings noch. Man darf allerdings gespannt sein.

Weiterlesen

Richtiges Mikrofon für Dragon NaturallySpeaking

Dass es bei der Erkennungsqualität von Dragon NaturallySpeaking (und wahrscheinlich auch bei anderer Spracherkennungssoftware) nicht so sehr auf die Qualität des Mikrofons ankommt, erzählt ein Nutzer des neuen Windows-Spracherkennung-Forum dragon-spracherkennung.forumprofi.de.

Nuance übernimmt Macspeech

Am 16. Februar verkündete Nuance, der führende Hersteller an Spracherkennungssoftware für Windows-Systeme, die Übernahme der Firma Macspeech (einziger Spracherkennungssoftwarehersteller für Macs). Nuance erweitert damit die Dragon NaturallySpeaking Software Familie auf Macintosh. In der Presseaussendung verspricht die Firma keine Änderungen in näherer Zukunft und weiterhin regelmäßige Updates.

Macspeech Dictate arbeitet ohnehin schon mit der Dragon-Engine, nun wird die Software gänzlich zu einem NaturallySpeaking-Produkt. Darf man sich hier gute Entwicklungen erwarten? Kommt schon bald eine Maussteuerung für Dictate?

Wir sind gespannt. Die neue Website: www.nuance.com/macspeech

MacSpeech veröffentlicht MacSpeech Scribe

Am 11. Februar 2010 veröffentlichte MacSpeech (Hersteller der marktführenden Spracherkennungssoftware MacSpeech Dictate für Macintosh) das Programm Macspeech Scribe, mit dem sich aufgenommene Diktate im Nachhinein in Text umwandeln lassen. Die Erweiterung ist derzeit nur auf Englisch verfügbar, für registrierte Macspeech-Kunden um 99 $ zu haben. Das Programm akzeptiert dazu die Formate .wav, .aif, .aiff, .m4v, mp4, und .m4a.

MacSpeech kündigt Spracherkennung für iPhone an

Im Gegenzug zum Nuances Dragon NaturallySpeaking für das iPhone hat MacSpeech nun auch eine Spracherkennungssoftware für dieses Mobiltelefon angekündigt. Die Software ist als kostenlose Erweiterung für Macspeech Dictate (-Besitzer) gedacht. Genaue Veröffentlichungstermine gibt es noch nicht, auch keine Auskunft über andere Sprachversionen als Englisch.

Zur Pressemeldung

Remote Buddy: Die universelle Fernbedienungssoftware für den Mac

Wer mehr aus seiner Apple Remote Fernbedienung machen will, dem könnte die äußerst nützliche Software Remote Buddy von der deutschen Firma IOSPIRIT gefallen. Sie verwandelt jegliche Apple Remote Fernbedienung, sowie auch das iPhone, den iPod Touch, die Wii Remote von Nintendo, und etliche andere Standard-Fernbedienungen in eine universelle Mac-Fernbedienung.
Die Software ist sehr konfigurierbar, jegliche Taste der entsprechenden Fernbedienung lässt sich mit Funktionen belegen, über das iPhone werden Tastatureingaben auf den Computer übertragen und mit der Wii Remote lässt sich der Mauszeiger bequem aus der Ferne steuern.

Die knapp 20 € teure Software kitzelt so ziemlich alles aus einer Fernbedienung, was möglich ist.

Remote Buddy unterstützt nicht wenige Fernbedienungen (die genaue Hardwareunterstützung kann auf der Website nachgelesen werden), sogar ein Mobiltelefon von Sony Ericsson findet sich auf der Liste der unterstützten Geräte. Um das zu ermöglichen arbeitet die Software mit praktisch allen Funktechnologien (Infrarot, Bluetooth, WLAN) zusammen. Die Zahl der unterstützten Macintosh-Programme ist auch nicht gerade klein. Für viele Programme werden vordefinierte Befehle mitgeliefert, diese können jedoch (für jedes Programm extra) abgeändert werden. Sollte ein Programm dennoch nicht dabei sein, können universelle Tastaturbelegungen weiterhelfen. Weiters kann mit der Software eine virtuelle Tastatur erzeugt werden, um beispielsweise mittels der Apple Remote Fernbedienung Tastatureingaben tätigen zu können (!).
Wer ein iPhone oder einen iPod Touch besitzt, der kann mit diesem seinen Mac auch mit Gesten steuern (siehe Video unten).

Mehr Videos gibt es auf der Herstellerwebsite, außerdem kann dort eine 30-Tage-Testversion heruntergeladen werden.

Eine äußerst nützliche Software, und bei Besitz mehrerer unterstützter Fernbedienung, den Preis absolut Wert.

Maussteuerung mit dem Kopf

Wer hätte das gedacht, die Maus mit seinen eigenen Kopfbewegungen zu steuern? Klingt wie Zukunftsmusik – ist es aber nicht. Die kleine Firma Eyetwig, spezialisiert auf Bild- und Videoanalyse, veröffentlichte bereits vor einem halben Jahr das Programm EyeTwig Tracker (beziehungsweise iTracker für Macintosh), das die Kopfsteuerung ermöglicht. Die Software nützt die Webcam, um mittels Gesichtserkennung die Kopfbewegungen in Mausbewegungen umzuwandeln. Voraussetzung ist also lediglich eine Webcam; mit der iSight-Kamera meines MacBooks hat die Maussteuerung hervorragend funktioniert: wirklich sehr faszinierend, iSight als Mausersatz!

iTracker kostet circa 30 US-Dollar, eine voll funktionstüchtige Demoversion gibt es allerdings auf der Website zum Download (einzige Einschränkung: nach 10 min ist ein Programmneustart notwendig). Die Software erledigt auch den automatischen Mausklick und unterstützt in der Pro-Variante sogar Sprachbefehle.

Als ernsthafte Alternative zur Maus kann die Software von EyeTwig allerdings nicht herangezogen werden. Dafür ist die Steuerung zu unpräzise und die Auflösung der feinen Kopfbewegungen zu schwach (wohl auch Webcam-bedingt). Mit professionellen Systemen wie die Kopfsteuerung SmartNav von NaturalPoint kann die Firma natürlich nicht mithalten, dennoch funktioniert die Software für dieses Preissegment relativ gut und ist auf jeden Fall wert ausprobiert zu werden, zumal ja eine kostenlose Demoversion zur Verfügung steht!

Anmerkung: Bei meinem 64-Bit Windows 7 ließ sich das Programm installieren, aber nicht starten. Ob es an 64-Bit liegt oder an Windows 7 ist mir unbekannt.

Nachlese: EyeTwig-Blog

Dragon NaturallySpeaking: Unterschied zwischen Preferred und Standard (Premium/Home)

Die Unterschiede zwischen den einzelnen Versionen von Dragon NaturallySpeaking sind oft nicht ganz klar, wesentliche Preisunterschiede gibt es ja.

Für den Privatanwender gibt es im Grunde die Auswahl zwischen den Versionen Preferred und Standard (ab Version 11 heißen diese Premium und Home). Die Versionen Legal und Medical sind spezielle Versionen für die Berufsgruppen Juristen und Mediziner und zeichnet sich hauptsächlich durch spezielles Fachvokabular und Unterstützung fachspezifische Anwendungen aus. Genauso auch wie die Professional-Variante kosten diese Versionen aber über 1000 €.
Die Professional-Version unterstützt Tastenkombinationen, Erstellung von Makros (auch VisualBasic-Scripting), die Verwendung von Microsoft Outlook und Lotus, und spezielle Verwaltungsfunktionen über das Netzwerk. Durch den hohen Preis kommen diese Versionen für den Privatanwender meist aber nicht infrage.

Für die Versionen Preferred und Professional gibt es zusätzlich Mobile-Versionen, die für mobile Spracherkennung ein digitales Diktiergerät mitliefern, welches sich automatisch synchronisieren lässt. Bei der Wireless-Version ist ein Bluetooth-Headset der Firma Plantronics enthalten.

 

Vergleich von Premium und Home

Vier wesentliche Funktionen die Dragon NaturallySpeaking Standard im Vergleich zu Preferred nicht unterstützt:

  1. Import/Export von Benutzerdaten (Sprachprofilen): Wenn der Computer neu aufgesetzt oder die Software auf einem Zweitrechner installiert werden soll, muss das komplette Training nochmals durchgeführt werden.
  2. Unterstützung von Bluetooth-Mikrofonen
  3. Transkription von Diktat-Aufnahmen
  4. Volle Unterstützung von Microsoft Excel
  5. Diktatwiedergabe: Vorlesefunktion zur Korrektur
  6. Zusätzliche Sprache Englisch ist dabei (also zweisprachig)

 

Den genauen Versionsvergleich gibt es auf der Nuance-Website, auch als PDF.
Dragon NaturallySpeaking kostet in der Standard-Version circa 50 €, Preferred gibt es für circa 145 €.

The Peregrine Glove – lieferbar ab Ende März 2010

Der Liefertermin des „Peregrine Glove“ hat sich noch um zwei Monate verschoben. Da die Ingenieure, so schreibt Iron Will Innovations Inc. in ihrem Rundschreiben, an deutlichen Verbesserungen arbeiten, wie die Firma den Handschuh in der verbesserten Variante erst gegen Ende März 2010 ausliefern. Alle Geeks müssen sich noch gedulden.

Infos zum Handschuh