Wie der Videomoderator, reagiert die Spracherkennung IntelliSpeech spezifisch auf die Eingaben des Lerners. IntelliSpeech ist die Erste eigens für Sprachlernprogramme entwickelte Spracherkennungssoftware. Die Unterschiede und Vorteile, aber auch die Grenzen dieses bei digital publishing neu entwickelten Systems gegenüber herkömmlichen Spracherkennungsprogrammen haben wir hier kurz zusammengefasst.

Wie funktioniert Spracherkennung?
Eine ganze Reihe von Softwareanbietern arbeiten an einer natürlichsprachlichen Benutzerschnittstelle zur Eingabe von Programmbefehlen. Eines der grundlegenden Probleme ist dabei die Frage der Sicherheit: Wenn Sie bei einem solchen System mal wieder "die Wände hochgehen" könnten, darf die zugrunde liegende Spracherkennungssoftware natürlich auf keinen Fall den Befehl Ende heraushören. Herkömmliche Spracherkennungssysteme sind deshalb allein auf die Frage ausgelegt, ob ein bestimmtes Wort mit einer möglichst hohen Wahrscheinlichkeit gesagt worden ist oder nicht. Zu diesem Zweck wird gesprochene Sprache in ihre kleinsten Einheiten - so genannte Phoneme - heruntergebrochen, die wiederum in Phonemdatenbanken zusammengefasst werden. Viele Hersteller bezeichnen diese Datenbanken auch als Ihre "Lexika". Die Aufgabe einer Spracherkennungssoftware besteht nun in diesem Fall - vereinfacht gesagt - darin, gesprochene Sprache ebenfalls in einzelne Phoneme aufzubrechen. Auf Grund eines Vergleichs mit den im Lexikon gespeicherten Phonemkombinationen versucht das System dann herauszufinden, ob diese Spracheingabe einem hier gespeicherten Wort oder Satz entspricht. Keines der herkömmlichen Systeme macht also eine sinnvolle Aussage über die Qualität einer Spracheingabe. Ganz im Gegenteil: Je akzentuierter und unnatürlicher ein Wort ausgesprochen wird, desto besser fällt die Bewertung der Spracherkennung aus.

Was macht IntelliSpeech anders?
In einem Sprachkurs ist die Antwort auf die Frage, ob ein Wort oder Satz gesagt worden ist, eher unerheblich. Hier ist die Frage nach dem Wie entscheidend. IntelliSpeech versucht deshalb herauszufinden, wie weit sich ein Sprecher oder eine Sprecherin in den Charakteristika seiner Aussprache an einen muttersprachlichen Referenzsprecher annähern kann. Auch IntelliSpeech basiert dabei auf einer Phonemdatenbank. Darüber hinaus aber ordnet das Programm eine Spracheingabe so genannten "character feature sets" und damit einem von vier Referenzsprechern zu - jedes Wort ist mit einem weiblichen, einem männlichen, einem jungen und einem alten Referenzsprecher unterlegt.

Nach der Zuordnung über die Phonemdatenbank vergleicht IntelliSpeech in einer Reihe von mathematischen Prozessen die Spracheingabe mit der Aussprache eines realen Sprechers. Der Effekt: Je genauer man die Vorlage des Muttersprachlers nachahmt - je natürlicher die eigene Aussprache - desto besser ist auch das zurückgelieferte Ergebnis der Spracherkennung. Einmalig ist dabei, dass IntelliSpeech wie ein Lehrer jedes einzelne Wort eines gesprochenen Satzes bewertet. Jedes dieser Wörter kann dann im Einzelwortmodus trainiert werden.

 AGB | Downloads | Impressum | Sitemap | Kontakt | FAQ