Drei gescheiterte Versuche, mit Apples Spracherkennungssoftware Siri auf Österreichisch ins Gespräch zu kommen. Die studierte Physikerin, Hispanistin und Sprachtechnologin Barbara Schuppler will mit einer neuen Methode das automatisierte Verstehen unseres Idioms erleichtern.

Illustration: STANDARD/Thomas Korn

Graz - Im ungezwungenen Gespräch will es uns auch die Sprache bequem machen und neigt deshalb zur Reduktion. Das klingt im Österreichischen dann etwa so: "I haß Bavara und les grad an Atikl." Würde man diesen Satz sorgfältig artikuliert vom Blatt lesen, müsste er um etliche Buchstaben und Silben ergänzt werden - ein Mehraufwand, der in der gesprochenen Alltagssprache eher vermieden wird.

Was für die Gesprächspartner die Kommunikation erleichtert, stellt für automatische Spracherkennungssysteme jedoch eine unüberwindliche Hürde dar: Da bisher hauptsächlich gelesenes Material zum Training dieser Systeme verwendet wurde, konnten sie mit verschwundenen Silben, "ungrammatikalischen" Formulierungen und Monophthongierungen (aus Doppelvokalen wird einer, aus "heiße" also beispielsweise "haß") nicht umgehen.

Beträchtliches Manko

Das ist ein beträchtliches Manko für eine an sich äußerst hilfreiche Technologie, die mittlerweile nicht nur zum simplen Diktieren, sondern auch zur schriftlichen Dokumentation von Meetings und Operationen oder als Helfer für alte und behinderte Menschen eingesetzt wird.

Die Grazer Sprachtechnologin Barbara Schuppler hat die "Trefferquote" eines Spracherkennungssystems untersucht, das mit von Österreichern gelesenen Sätzen "trainiert" wurde: "Wenn österreichische Sprecher einen Text lesen, erkennt das System immerhin mehr als 97 Prozent der Wörter", so die Forscherin. "Bei spontanem österreichischem Sprachmaterial, also wenn sich zwei Personen längere Zeit zwanglos miteinander unterhalten, werden aber nur noch 56 Prozent erkannt." An jener Sprache, die hierzulande für eine Spracherkennung am relevantesten ist, scheitert das System also.

Um Spracherkennungssysteme sensibler für die österreichische Alltagssprache zu machen, hat Barbara Schuppler im Rahmen ihres Hertha-Firnberg-Stipendiums am Institut für Signalverarbeitung und Sprachkommunikation der TU Graz zunächst eine große Menge an Sprachmaterial gesammelt, wobei die Sprecher sehr genau ausgewählt wurden, um möglichst repräsentative Daten zu erhalten: "Alle 40 Sprecher haben mindestens Matura, wuchsen in verschiedenen Bundesländern in der Stadt oder auf dem Land auf und leben zurzeit in Graz, wo auch die Aufnahmen im Tonstudio gemacht wurden", sagt die Forscherin.

Regionale Sprachfärbung

Die von Barbara Schuppler zusammengestellten Corpusdaten sind durch dieses strenge Auswahlverfahren zwar nicht mehr stark regional gefärbt, unterscheiden sich aber noch immer deutlich von der gelesenen Sprache. Anhand dieses Sprachmaterials will Schuppler nun mittels quantitativer Methoden ermitteln, wie die Details der fonetischen Realisierung von Wörtern mit der Grammatik und den funktionellen Eigenschaften einer Aussage zusammenhängen. Die Ergebnisse sollen zur Verbesserung der automatischen Spracherkennung genutzt werden.

So hat sie zum Beispiel untersucht, wie häufig und unter welchen Umständen im Österreichischen die Monophthongierung oder das Weglassen von Lauten im Vergleich zwischen gelesener und gesprochener Sprache auftreten. "Diese Phänomene kommen nicht nur in der Spontansprache häufig vor", so Schuppler, "sondern auch in gelesenen Sätzen - und zwar umso öfter, je länger der Satz und je dialognäher seine Struktur ist."

Grundsätzlich gelte: Häufig gebrauchte Wörter werden eher verkürzt als selten verwendete. Klassisches Beispiel sind die Personalpronomen: Beim "ich" zum Beispiel fehlt das "ch" am Ende im Spontanmaterial in 85 Prozent der Fälle. Auch ein voll ausgesprochenes "nein" oder "kein" wird man in einem entspannten Gespräch unter Österreichern nicht allzu häufig finden.

Wird ein vergleichsweise selten verwendetes Wort - etwa ein Straßenname - im Gespräch häufig erwähnt, verliert aber auch dieses mit der Zeit Buchstaben und Silben: So kann aus der Münzgrabenstraße allmählich die "Münzgramstraßn" werden, weil der Gesprächspartner dann ohnehin schon weiß, wovon die Rede ist. "Relevant für das Phänomen der Reduktion ist also nicht nur die Häufigkeit eines Wortes allgemein, sondern auch seine Frequenz innerhalb des Gesprächs", so die Sprachtechnologin.

Wie können Spracherkennungssysteme von diesen Erkenntnissen profitieren? "Ein Spracherkenner basiert auf einem akustischen Modell, das die Verbindung der akustischen Signale mit den einzelnen Lautsymbolen herstellt", erklärt Barbara Schuppler. "Da weiß man aber noch nicht, um welches Wort es geht. Um das zu erkennen, braucht man ein Aussprachelexikon, das die Symbole für das jeweilige akustische Modell mit dem Wort verbindet."

Akustische Wechselwirkung

Während die meisten Spracherkenner die akustischen Eigenschaften eines Wortes unabhängig von seinen sprachstrukturellen Attributen behandeln, wird deren Wechselwirkung in der neuen Methode erstmals berücksichtigt. Es steht also zu erwarten, dass die automatische Spracherkennung deutlich sensibler für die österreichische Alltagssprache wird.

Für ihre in den Niederlanden verfasste Doktorarbeit hat die Sprachtechnologin mit abgeschlossenem Physik- und Spanischstudium übrigens bereits ein Transkriptionssystem für Holländisch entwickelt. "Phänomene wie etwa die Verkürzung hochfrequenter Wörter charakterisieren nicht nur das Österreichische, sondern auch zahlreiche andere Sprachen", weiß die Forscherin.

"So wird etwa das häufig gesprochene holländische 'eigenlijk' (eigentlich) in der Spontansprache zum bündigen 'eik'." Der Hang zur sprachlichen Verknappung ist also keine österreichische Spezialität, sondern eine international praktizierte Maßnahme zur sprachlichen Effizienzsteigerung.

Drei gescheiterte Versuche, mit Apples Spracherkennungssoftware Siri auf Österreichisch ins Gespräch zu kommen. Die studierte Physikerin, Hispanistin und Sprachtechnologin Barbara Schuppler will mit einer neuen Methode das automatisierte Verstehen unseres Idioms erleichtern. (Doris Griesser, DER STANDARD, 17.9.2014)