Software

IBM ViaVoice 98 Home

IBM 
ViaVoice 98 Home Edition
Sprechmodus kontinuierlich
Aktiver Wortschatz 
Wortschatz erweiterbar auf
64000 
128000
Passiver Wortschatz (Lexikon) 340000
Korrektur durch Sprache Ja
Desktop-Navigation Ja
Diktat in andere Anwendungen Home:Nein Exec:Ja
Textbausteine erstellen ja
Makrofähigkeit ja (Formulare)
Eigene Makros erstellen ja
Mitgeliefertes Mikrofon 
(Qualität)
Andrea NC-80 (Home Ed.) 
(mäßig)
Trainingsdauer  
Qualität der Trainingstexte
30-70 Minuten 
langweilig
Besonderheiten braucht weniger RAM als andere Programme,  dafür aber eine möglichst schnelle Festplatte 
Mikrofon verbesserungswürdig
 
 

 

Wer zu spät kommt.. 

Schon 1997, als die ersten Programme zur kontinuierlichen Spracherkennung auf dem deutschen Markt erschienen, war IBM ViaVoice als erstes Produkt erhältlich. Da ViaVoice nicht nur zuerst, sondern durch die Vertriebsstruktur auch fast überall erhältlich war,  verkaufte sich das Programm insgesamt deutlich häufiger als das damals noch einzige Konkurrenzprodukt von Dragon Systems. Auch 1998 war man wieder schneller als der Konkurrent: während NaturallySpeaking erst in diesen Wochen (Januar 1999) erschien, ist ViaVoice 98 bereits seit einigen Monaten verfügbar. 

Entsprechend den zwischenzeitlichen Entwicklungen bietet ViaVoice 98 gegenüber seinem Vorgänger einiges Neues: der aktive Wortschatz wurde auf 64.000/128.000 Wörte erweitert, Korrektur durch Sprachbefehle wurde integriert, ein Umschalten zwischen Befehls- und Diktiermodus ist nicht mehr notwendig, und schließlich ist es in Microsoft Word auch möglich, mit sogenannten "natürlichen Befehlen" Text auf verschiedene Arten und Weisen zu formatieren, Fußnoten und Tabellen einzufügen und so weiter. 

All you need is.. 

Als Voraussetzung für den Einsatz von ViaVoice 98 Home gibt IBM einen Prozessor mit mindestens 166 MHz sowie ein Systemspeicher von mindestens 32 MB bzw. 48 MB, wenn in Word 97 diktiert werden soll, an. Hier fällt gleich zu Beginn auf, daß Windows NT als Betriebssystem nicht unterstützt wird. Wer also mit dem großen Bruder von Windows 95 und 98 arbeitet, ist gezwungen, auf die rund dreimal so teure Executive Edition zurückzugreifen, die zudem noch Desktop Navigation und direktes Diktieren in alle Anwendungen bietet. Allerdings sind die Anforderungen (wie üblich) tendenziell etwas zu niedrig gegriffen - hier sollte man nochmals 16 MB und 34 MHz aufschlagen, um komfortabel arbeiten zu können. 
Erwähnenswert ist, daß ViaVoice eine andere Strategie in Bezug auf die Systemressourcen verfolgt: die zur Erkennung benötigten Daten werden nicht komplett in den Speicher geladen, was zweierlei zur Folge hat: zwar kommt ViaVoice mit relativ wenig Systemspeicher gut zurecht, doch sind die Möglichkeiten zur Performancesteigerung durch das Aufrüsten des Systems Grenzen gesetzt, denn die Software greift während der Erkennung fortwährend auf die Festplatte zu, deren Leistung damit für die Geschwindigkeit eine erhebliche Rolle spielt. Auch kann für unkonzentrierte Naturen (wie z.B. den Rezensenten) das andauernde Arbeitsgeräusch der Festplatte irritierend wirken. 

Das von früheren Versionen gewohnte Andrea NC-80 liegt als Mikrofon auch ViaVoice Home bei. Nach wie vor könnte man sich hier besseres wünschen, denn neben einem etwas dumpfen Klang stören die schlechte Positionierbarkeit und der etwas zu lang geratene Mikrofonhalter. Hier sind mit einem hochwertigeren Modell verbesserte Erkennungsleistungen möglich. Allerdings kann man bei einem Preis von etwas über 100 DM auch keine Wunderdinge erwarten. 
Das mitgelieferte Handbuch erschlägt den Benutzer nicht mit Details, bietet aber vernünftige, schrittweise Einführungen in ihm die wichtigsten Abläufe. 

Installation 

ViaVoice 98 ermöglicht es, Benutzerprofile, die mit Vorgängerversion erstellt worden sind, in die neue Version übernehmen, so daß ein neues Training sowie das hinzufügen des Benutzer typischen Wortschatzes nicht unbedingt notwendig sind. Allerdings verwendet ViaVoice 98 ein genaueres Audio Format (22 statt 11 kHz Samplerate), weshalb ein erneutes trainieren doch stark angeraten erscheint. Auf unseren Testsystem verlief die Installation ohne größere Auffälligkeiten. 

Fit for talk 

Wer schon einmal mit einer IBM Spracherkennung gearbeitet hat, trifft hier auf bekanntes: IBM hat die Texte des Trainings (das nach wie vor Sprachmusterregistrierung heißt) seit VoiceType nicht verändert. Das ruft insofern wenig Begeisterung hervor, als die Texte unbestritten die langweiligsten sein dürften, die man mit einem Spracherkennungsprogramm bekommen kann. Amüsant wird es nur an manchen Stellen: wenn auffällt, wie nahe die Texte durch ihr Alter daran sind, zum Anachronismus zu werden. Aber nach ca. einer halben Stunde ist alles vorbei - und der geduldige Papagei, ähem: Benutzer wird mit verbesserten Erkennungsleistungen belohnt. 

Verständnisfrage 

Auch ohne die Sprachmusterregistrierung ist ein Diktieren möglich, die Leistung hat sich hier gegenüber dem Vorgänger bereits merklich gebessert: falls keine unbekannten Wörter im Text vorkommen werden ca. 95 Prozent Genauigkeit erreicht - wenn die benutzte Soundkarte über einen guten Mikrofoneingang verfügt. Allerdings ist zu sagen, daß die Tests hier nicht mit dem mitgelieferten Mikrofon durchgeführt wurden, sondern, der Vergleichbarkeit wegen, mit unserem Standardmikrofon, einem VXI mit eingebautem Batterieadapter. 
Nach dem erfolgreichen absolvieren des Trainings (genau gesagt, der ersten Hälfte, denn ViaVoice bietet nach 128 von 256 Sätzen eine Beendigung an) überzeugte wir Voice mit der bislang besten gesehenen Leistung - in dem 450 Worte langen Text (spezielle Worte waren noch vom ersten Test im Vokabular) traten lediglich 11 Fehler auf. Das verspricht dem geübten Diktierer ein nur wenig durch unliebsame Korrekturen verlängertes Arbeiten. 

"..Wie bitte?" 

Das ist auch besser so: Denn obwohl IBM sein neues Produkt mit der Fähigkeit ausgestattet hat, Erkennungsfehler nicht nur mit der Tastatur, sondern auch per Sprache korrigieren zu können, können einem einige häßliche Details ordentlich den Spaß verderben. Aber zuerst einige allgemeine Worte zum Vorgehen: zu einem beliebigen Zeitpunkt während oder nach dem Diktat können falsch erkannte Worte mit dem Befehl "wähle XY aus" ausgewählt werden, woraufhin im Korrekturfenster die Alternativen zur Auswahl eingeblendet werden. Eine solche Alternativen kann man ebenfalls mit einem Sprachbefehl, zum Beispiel "3 auswählen" in den Text einfügen lassen. Alternativ ist es möglich, im Korrekturfenster zu Buchstabieren oder Korrekturen per Tastatur einzugeben. 

Hier kommt das 340.000 Worte umfassende Lexikon ins Spiel, denn sobald die Korrektur buchstabiert wird, erscheinen als Alternativen Worte, die mit den entsprechenden Buchstaben beginnen. Leider werden die eingeblendeten Worte nicht anhand der zuvor gemachten Spracheingabe selektiert, so daß es zumeist notwendig sein wird, das gesamte Wort einzugeben. Ist das korrigierte Wort nicht bereits im Lexikon enthalten, so fordert ViaVoice Benutzer in den meisten Fällen auf, das Wort einmalig vorzusprechen. Dies führt zwar zu einer sofort verbesserten Erkennung des Wortes, kann aber beim Hinzufügen vieler Worte auch sehr lästig werden. Außerdem ist es möglich, mehrere Worte als einen gemeinsamen Ausdruck hinzuzufügen, was bei Floskeln und ähnlichen Wendungen zu einer drastisch verbesserten Erkennung führt. 
 
Leider zeigen sich hier einige unangenehme Mankos: sollen mehrere Worte auf einmal korrigiert werden, so fallen ViaVoice in über 90 Prozent der Fälle keine Alternativen zu den erkannten Worten ein. Niemals kam es in unserem Test vor, daß ViaVoice als Alternative mehr als 1 Wort zur Auswahl stellte. Das erfordert oftmals nicht nur ein mehrfaches Anklicken und korrigieren: ein häufig auftretendes Problem ist es, daß durch Erkennungsfehler auch die Wortgrenzen durch das Programm falsch erkannt werden, was zum Beispiel dazu führen kann, daß ein Wort als 2 falsche Worte erkannt wird. Bei der Korrektur solcher Fehler kann man von ViaVoice dann leider wenig Hilfe erwarten. Hier hatte der Konkurrent NaturallySpeaking schon in der letzten Version mehr zu bieten, denn das korrigieren gesamter Phrasen auf einmal stellt dort kein Problem dar. Ärgerlich ist auch, daß es kaum möglich ist, einem Wort, welches nur geringfügig falsch erkannt wurde, im Korrekturfenster 1 oder 2 Zeichen mit der Maus zu markieren und neu zu Buchstabieren - via Voice markiert hier sehr häufig sofort das gesamte Wort. 

Drei Beispiele für Korrekturen: ViaVoice, Point&Speak
 
Bei einem Wort ist noch alles in Ordnung..
  
..nicht aber bei mehreren: 
die Alternative besteht stets nur aus einem Wort
  
..so ginge es auch: Hier bei Point&Speak
  

Zusammenarbeit 

Gut gelungen erscheint allerdings die Integration in Microsoft Word 97, denn hier geht das Diktieren sehr flüssig und ohne merklich Unterschiede in der Erkennungsgenauigkeit zum eingebauten Editor Speakpad vor sich. Die "natürlichen Befehle"sind recht vernünftig implementiert, bieten aber teilweise etwas zu wenig Abwechslung, um sie ohne regelmäßige Anwendung beziehungsweise einiger Einarbeitungszeit zu benutzen. So lautet der Befehl zum einfügen einer Tabelle zum Beispiel "eine 3 Zeilen 4 Spalten Tabelle einfügen", nicht aber "eine Tabelle mit 3 Zeilen und 4 Spalten einfügen". Dennoch: nach etwas Gewöhnung dürften die Befehle eine erhebliche Arbeitserleichterung bringen. Vor allem aber die nicht verringerte Geschwindigkeit wird vom Konkurrenten NaturallySpeaking in Word 97 nicht erreicht - ein Faktum, daß die Entscheidung mancher routinierter Word-Benutzer durchaus beeinflussen könnte. 

Und außerdem.. 

Vom Vorgänger übernommen wurde die Möglichkeit, mit dem Text zusammen auch die Sprache abzuspeichern, so daß die gesamte Diktiersitzung als eine einzige Datei wieder eingeladen werden kann. So wird die Korrektur durch eine andere Person erheblich erleichtert - schlicht der einzig vernünftige Weg, um ein zwar transkribiertes, aber noch nicht korrigiertes Diktat weiterzugeben. Die hier abgespeicherte Sprache braucht aber (Philips hat mit FreeSpeech gezeigt, daß es auch anders geht) erhebliche Mengen von Speicherplatz, so daß ein Transport beispielsweise über Disketten von vorneherein ausscheidet. In einem Büro mit der mittlerweile üblichen Vernetzung sollte dies aber kein Problem darstellen. 

Die üblichen Hilfsprogramme zur Anpassung des Vokabulars sind ebenfalls enthalten, wobei die Vokabularerweiterung leider etwas umständlich ist, denn es ist notwendig, jedes Dokument einzeln einzuladen und auf neue Worte hin zu analysieren. Auch hier muß ein neues Wort oft erst einmalig vorgesprochen werden, bevor es benutzt werden kann. Eine Vokabularerweiterung kann so durchaus mehrere Stunden in Anspruch nehmen, wenn viele Dokumente zu verarbeiten sind. 

Wenngleich nur im ViaVoice-eigenen Editor zu benutzen, so stellt der mitgelieferte Formular-Editor für manche Bereiche sicherlich ein mächtiges Hilfsmittel da: mit ihm können Formulare generiert werden, die aus vorgefertigtem Text bestehen, in dem sich einzelne Felder befinden, in welche diktiert werden kann. So lassen sich höchst effizient Standardschreiben erstellen, bei denen lediglich wenige Informationen wie beispielsweise Termine oder Namen variieren. Die so erstellten Formulare können mit einem einzigen Befehl in den Text eingefügt werden, das Diktieren in die in ihnen enthaltenen Felder funktioniert gut. 

Auch wenn das Diktieren in alle Anwendungen der teureren Executive Edition vorbehalten bleibt, so ist das notwendige Übertragen des Textes in die jeweilige Zielanwendung gut gelungen. Nach einmaliger Auswahl der Anwendung muß nur noch auf ein Icon geklickt werden, damit der Text an der zuvor ausgewählten Stelle erscheint. 

Fazit 

IBM hat mit ViaVoice 98 einen würdigen Nachfolger vorgelegt. Wer auf das Diktieren in alle Anwendungen verzichten kann, erhält ein Programm, das sich in Sachen Erkennungsgenauigkeit momentan vor keiner Konkurrenz zu verstecken braucht. In puncto Bedienungskomfort hat ViaVoice 98 allerdings noch einiges aufzuholen, und die letztendliche Geschwindigkeit hängt nicht nur von der Genauigkeit der Erkennung ab, sondern auch davon, wie einfach es ist, aufgetretene Fehler zu korrigieren. Hier hat die Konkurrenz vorgemacht, daß es besser geht. 
Wer neben der hohen Erkennungsgenauigkeit allerdings auf die Möglichkeit der Korrektur durch eine weitere Person angewiesen ist, kommt an ViaVoice kaum vorbei. Hier, bei der Genauigkeit und bei den Möglichkeiten zur Formularerstellung hat ViaVoice seine Stärken. 

Pro & Contra 

+ hohe Erkennungsleistung 
+ großer Wortschatz 
+ flüssiges Diktieren in Word 97 
+ guter Formulargenerator 
+ Fremdkorrektur mmöglich 

- unpraktische Korrektur 
- kein Diktieren in alle Fenster 
- mäßiges mitgeliefertes Mikrofon 
- Windows NT nur mit der Executive Edition 
 

 
Zurück zu Software
Zurück zu Hauptseite

Fragen oder Kommentare? Wir freuen uns auf Ihr Feedback an info@DiktatStarten.de !