|
|
|||||||||||||||||||||||||||||
| Wer zu spät kommt..
Schon 1997, als die ersten Programme zur kontinuierlichen Spracherkennung auf dem deutschen Markt erschienen, war IBM ViaVoice als erstes Produkt erhältlich. Da ViaVoice nicht nur zuerst, sondern durch die Vertriebsstruktur auch fast überall erhältlich war, verkaufte sich das Programm insgesamt deutlich häufiger als das damals noch einzige Konkurrenzprodukt von Dragon Systems. Auch 1998 war man wieder schneller als der Konkurrent: während NaturallySpeaking erst in diesen Wochen (Januar 1999) erschien, ist ViaVoice 98 bereits seit einigen Monaten verfügbar. Entsprechend den zwischenzeitlichen Entwicklungen bietet ViaVoice 98 gegenüber seinem Vorgänger einiges Neues: der aktive Wortschatz wurde auf 64.000/128.000 Wörte erweitert, Korrektur durch Sprachbefehle wurde integriert, ein Umschalten zwischen Befehls- und Diktiermodus ist nicht mehr notwendig, und schließlich ist es in Microsoft Word auch möglich, mit sogenannten "natürlichen Befehlen" Text auf verschiedene Arten und Weisen zu formatieren, Fußnoten und Tabellen einzufügen und so weiter. All you need is.. Als Voraussetzung für den Einsatz von ViaVoice 98 Home gibt IBM
einen Prozessor mit mindestens 166 MHz sowie ein Systemspeicher von mindestens
32 MB bzw. 48 MB, wenn in Word 97 diktiert werden soll, an. Hier fällt
gleich zu Beginn auf, daß Windows NT als Betriebssystem nicht unterstützt
wird. Wer also mit dem großen Bruder von Windows 95 und 98 arbeitet,
ist gezwungen, auf die rund dreimal so teure Executive Edition zurückzugreifen,
die zudem noch Desktop Navigation und direktes Diktieren in alle Anwendungen
bietet. Allerdings sind die Anforderungen (wie üblich) tendenziell
etwas zu niedrig gegriffen - hier sollte man nochmals 16 MB und 34 MHz
aufschlagen, um komfortabel arbeiten zu können.
Das von früheren Versionen gewohnte Andrea NC-80 liegt als Mikrofon
auch ViaVoice Home bei. Nach wie vor könnte man sich hier besseres
wünschen, denn neben einem etwas dumpfen Klang stören die schlechte
Positionierbarkeit und der etwas zu lang geratene Mikrofonhalter. Hier
sind mit einem hochwertigeren Modell verbesserte Erkennungsleistungen möglich.
Allerdings kann man bei einem Preis von etwas über 100 DM auch keine
Wunderdinge erwarten.
Installation ViaVoice 98 ermöglicht es, Benutzerprofile, die mit Vorgängerversion erstellt worden sind, in die neue Version übernehmen, so daß ein neues Training sowie das hinzufügen des Benutzer typischen Wortschatzes nicht unbedingt notwendig sind. Allerdings verwendet ViaVoice 98 ein genaueres Audio Format (22 statt 11 kHz Samplerate), weshalb ein erneutes trainieren doch stark angeraten erscheint. Auf unseren Testsystem verlief die Installation ohne größere Auffälligkeiten. Fit for talk Wer schon einmal mit einer IBM Spracherkennung gearbeitet hat, trifft hier auf bekanntes: IBM hat die Texte des Trainings (das nach wie vor Sprachmusterregistrierung heißt) seit VoiceType nicht verändert. Das ruft insofern wenig Begeisterung hervor, als die Texte unbestritten die langweiligsten sein dürften, die man mit einem Spracherkennungsprogramm bekommen kann. Amüsant wird es nur an manchen Stellen: wenn auffällt, wie nahe die Texte durch ihr Alter daran sind, zum Anachronismus zu werden. Aber nach ca. einer halben Stunde ist alles vorbei - und der geduldige Papagei, ähem: Benutzer wird mit verbesserten Erkennungsleistungen belohnt. Verständnisfrage Auch ohne die Sprachmusterregistrierung ist ein Diktieren möglich,
die Leistung hat sich hier gegenüber dem Vorgänger bereits merklich
gebessert: falls keine unbekannten Wörter im Text vorkommen werden
ca. 95 Prozent Genauigkeit erreicht - wenn die benutzte Soundkarte über
einen guten Mikrofoneingang verfügt. Allerdings ist zu sagen, daß
die Tests hier nicht mit dem mitgelieferten Mikrofon durchgeführt
wurden, sondern, der Vergleichbarkeit wegen, mit unserem Standardmikrofon,
einem VXI mit eingebautem Batterieadapter.
"..Wie bitte?" Das ist auch besser so: Denn obwohl IBM sein neues Produkt mit der Fähigkeit ausgestattet hat, Erkennungsfehler nicht nur mit der Tastatur, sondern auch per Sprache korrigieren zu können, können einem einige häßliche Details ordentlich den Spaß verderben. Aber zuerst einige allgemeine Worte zum Vorgehen: zu einem beliebigen Zeitpunkt während oder nach dem Diktat können falsch erkannte Worte mit dem Befehl "wähle XY aus" ausgewählt werden, woraufhin im Korrekturfenster die Alternativen zur Auswahl eingeblendet werden. Eine solche Alternativen kann man ebenfalls mit einem Sprachbefehl, zum Beispiel "3 auswählen" in den Text einfügen lassen. Alternativ ist es möglich, im Korrekturfenster zu Buchstabieren oder Korrekturen per Tastatur einzugeben. Hier kommt das 340.000 Worte umfassende Lexikon ins Spiel, denn sobald
die Korrektur buchstabiert wird, erscheinen als Alternativen Worte, die
mit den entsprechenden Buchstaben beginnen. Leider werden die eingeblendeten
Worte nicht anhand der zuvor gemachten Spracheingabe selektiert, so daß
es zumeist notwendig sein wird, das gesamte Wort einzugeben. Ist das korrigierte
Wort nicht bereits im Lexikon enthalten, so fordert ViaVoice Benutzer in
den meisten Fällen auf, das Wort einmalig vorzusprechen. Dies führt
zwar zu einer sofort verbesserten Erkennung des Wortes, kann aber beim
Hinzufügen vieler Worte auch sehr lästig werden. Außerdem
ist es möglich, mehrere Worte als einen gemeinsamen Ausdruck hinzuzufügen,
was bei Floskeln und ähnlichen Wendungen zu einer drastisch verbesserten
Erkennung führt.
Zusammenarbeit Gut gelungen erscheint allerdings die Integration in Microsoft Word 97, denn hier geht das Diktieren sehr flüssig und ohne merklich Unterschiede in der Erkennungsgenauigkeit zum eingebauten Editor Speakpad vor sich. Die "natürlichen Befehle"sind recht vernünftig implementiert, bieten aber teilweise etwas zu wenig Abwechslung, um sie ohne regelmäßige Anwendung beziehungsweise einiger Einarbeitungszeit zu benutzen. So lautet der Befehl zum einfügen einer Tabelle zum Beispiel "eine 3 Zeilen 4 Spalten Tabelle einfügen", nicht aber "eine Tabelle mit 3 Zeilen und 4 Spalten einfügen". Dennoch: nach etwas Gewöhnung dürften die Befehle eine erhebliche Arbeitserleichterung bringen. Vor allem aber die nicht verringerte Geschwindigkeit wird vom Konkurrenten NaturallySpeaking in Word 97 nicht erreicht - ein Faktum, daß die Entscheidung mancher routinierter Word-Benutzer durchaus beeinflussen könnte. Und außerdem.. Vom Vorgänger übernommen wurde die Möglichkeit, mit dem Text zusammen auch die Sprache abzuspeichern, so daß die gesamte Diktiersitzung als eine einzige Datei wieder eingeladen werden kann. So wird die Korrektur durch eine andere Person erheblich erleichtert - schlicht der einzig vernünftige Weg, um ein zwar transkribiertes, aber noch nicht korrigiertes Diktat weiterzugeben. Die hier abgespeicherte Sprache braucht aber (Philips hat mit FreeSpeech gezeigt, daß es auch anders geht) erhebliche Mengen von Speicherplatz, so daß ein Transport beispielsweise über Disketten von vorneherein ausscheidet. In einem Büro mit der mittlerweile üblichen Vernetzung sollte dies aber kein Problem darstellen. Die üblichen Hilfsprogramme zur Anpassung des Vokabulars sind ebenfalls enthalten, wobei die Vokabularerweiterung leider etwas umständlich ist, denn es ist notwendig, jedes Dokument einzeln einzuladen und auf neue Worte hin zu analysieren. Auch hier muß ein neues Wort oft erst einmalig vorgesprochen werden, bevor es benutzt werden kann. Eine Vokabularerweiterung kann so durchaus mehrere Stunden in Anspruch nehmen, wenn viele Dokumente zu verarbeiten sind. Wenngleich nur im ViaVoice-eigenen Editor zu benutzen, so stellt der mitgelieferte Formular-Editor für manche Bereiche sicherlich ein mächtiges Hilfsmittel da: mit ihm können Formulare generiert werden, die aus vorgefertigtem Text bestehen, in dem sich einzelne Felder befinden, in welche diktiert werden kann. So lassen sich höchst effizient Standardschreiben erstellen, bei denen lediglich wenige Informationen wie beispielsweise Termine oder Namen variieren. Die so erstellten Formulare können mit einem einzigen Befehl in den Text eingefügt werden, das Diktieren in die in ihnen enthaltenen Felder funktioniert gut. Auch wenn das Diktieren in alle Anwendungen der teureren Executive Edition vorbehalten bleibt, so ist das notwendige Übertragen des Textes in die jeweilige Zielanwendung gut gelungen. Nach einmaliger Auswahl der Anwendung muß nur noch auf ein Icon geklickt werden, damit der Text an der zuvor ausgewählten Stelle erscheint. Fazit IBM hat mit ViaVoice 98 einen würdigen Nachfolger vorgelegt. Wer
auf das Diktieren in alle Anwendungen verzichten kann, erhält ein
Programm, das sich in Sachen Erkennungsgenauigkeit momentan vor keiner
Konkurrenz zu verstecken braucht. In puncto Bedienungskomfort hat ViaVoice
98 allerdings noch einiges aufzuholen, und die letztendliche Geschwindigkeit
hängt nicht nur von der Genauigkeit der Erkennung ab, sondern auch
davon, wie einfach es ist, aufgetretene Fehler zu korrigieren. Hier hat
die Konkurrenz vorgemacht, daß es besser geht.
Pro & Contra + hohe Erkennungsleistung
- unpraktische Korrektur
|