Wenn KI Steirisch lernt

Grazer Forscher knacken den Dialekt-Code

In einer bahnbrechenden Initiative haben Wissenschaftler der TU Graz eine Sprachdatenbank entwickelt, die Maschinen beibringt, österreichisches Deutsch – insbesondere steirische Dialekte – besser zu verstehen. Was wie Science-Fiction klingt, ist Teil eines fünfjährigen Forschungsprojekts, das regionale Sprachfärbungen maschinenlesbar macht. Die Ergebnisse versprechen nicht nur Fortschritte in der Spracherkennung, sondern könnten auch in der Medizin und Mensch-Computer-Interaktion revolutionäre Anwendungen finden.

Dialekt trifft auf digitale Intelligenz

Für fremdsprachige Menschen mag österreichisches Deutsch ein Rätsel sein – ähnlich ergeht es künstlicher Intelligenz (KI). Begriffe wie „mi“ statt „mich“ oder „hom“ statt „haben“ lassen selbst die modernsten Spracherkennungssysteme ins Stolpern geraten. Dialekte wie Steirisch seien besonders komplex, da sie von der standardisierten Hochsprache stark abweichen, erklärt Barbara Schuppler, Leiterin des Projekts am Institut für Signalverarbeitung und Sprachkommunikation der TU Graz.

Die Lösung? Eine eigens entwickelte Sprachdatenbank namens „Graz Corpus of Read and Spontaneous Speech“ (GRASS). Diese umfasst Aufnahmen von 38 Personen, die sowohl gelesene Texte als auch spontane Gespräche beisteuerten. Besonders die freien Gespräche, die im Tonstudio aufgenommen wurden, zeigen die Herausforderungen der Konversationssprache auf: überlappende Redebeiträge, kurze Sätze und dialektale Färbungen.

Neue Technik für alte Herausforderungen

Die Forscher testeten verschiedene Spracherkennungsmodelle, darunter traditionelle Hidden-Markov-Modelle (HMM) und modernste Transformer-basierte Systeme wie „Whisper“. Während die Transformer bei längeren Sätzen brillieren, versagen sie häufig bei kurzen, fragmentarischen Gesprächsabschnitten. Überraschenderweise erwiesen sich die altbewährten HMM-Modelle als robuster bei Dialekten und kurzen Sätzen. Die Lösung könnte in einem hybriden Ansatz liegen, der die Stärken beider Systeme kombiniert.

Von Dialekt zu Diagnostik

Die Forschung hat bereits konkrete Anwendungen: Ein Prototyp soll Kindern mit Sprachdefiziten helfen, sich besser zu verständigen. So könnten Untertitel auf Tablets anzeigen, was ein Kind sagt – oder ihm ermöglichen, Formulare selbst auszufüllen. Doch das Potenzial reicht weiter: Künftig könnte die KI helfen, medizinische Diagnosen zu stellen, etwa die Schwere von Demenzerkrankungen zu bewerten oder epileptische Anfälle frühzeitig zu erkennen.

Auch die Mensch-Computer-Interaktion soll natürlicher werden. Soziale Roboter könnten durch die Grazer Datenbank lernen, auf Dialekte einzugehen – oder sogar das Lachen im richtigen Moment zu imitieren. Bereits 20 internationale Forschungsinstitute nutzen die Ergebnisse, und die Anwendungsmöglichkeiten sind vielfältig.

Ein Blick in die Zukunft

„Spontane Sprache, vor allem im Zwiegespräch, hat völlig andere Merkmale als eine vorgetragene oder gelesene Rede“, sagt Barbara Schuppler. „Gerade durch die Analyse von Mensch-Mensch-Kommunikation haben wir in unserem Projekt wichtige Erkenntnisse erreicht, die uns auch technisch weiterhelfen und neue Anwendungsbereiche aufmachen.“ Von der Sprachtherapie bis zur Mensch-Roboter-Interaktion: Die Grazer Forscher stellen die Weichen für eine Zukunft, in der Maschinen nicht nur besser verstehen, sondern auch natürlicher kommunizieren. Also wer weiß, vielleicht hören wir dennoch bald einen Roboter sagen: „Jo, i hobs verstaundn!“

Übrigens: Auch wir haben für Teile dieses Textes die Unterstützung von KI genützt.

Kommentare und Antworten

×

Name ist erforderlich!

Geben Sie einen gültigen Namen ein

Gültige E-Mail ist erforderlich!

Gib eine gültige E-Mail Adresse ein

Kommentar ist erforderlich!

* Diese Felder sind erforderlich.

Sei der erste der kommentiert