Spracherkennungstechnologie 20.02.2022, 17:11 Uhr

Ämter und Betriebe verstehen Mundart

Bis anhin weigern sich die Technologieriesen noch, die Schweizer Mundart zu verstehen. Zwei lokale Spezialisten beweisen mit bemerkenswerten Anwendungen, wie leistungsfähig die Spracherkennungstechnologie mittlerweile ist.
Allenfalls erlaubt die Mundartspracherkennung künftig auch die Kommunikation mit Tieren ;-)
(Quelle: Shutterstock/Jaromir Chalabala)
Sprachtechnologie ist ein Milliardengeschäft. Das bewies spätestens die Übernahme von Nuance durch Microsoft vor knapp einem Jahr. Der Windows-Konzern zahlte fast 20 Milliarden US-Dollar für eine Technologie, die ihm Vorderhand «nur» ein weiteres Standbein im Gesundheitswesen sicherte. Denn Nuance-Programme sind in US-amerikanischen Spitälern weit­verbreitet. Zum Beispiel diktieren Radiologen ihre Befunde, die Software mit Domänenvokabular transkribiert die gesprochenen Gutachten und nimmt den Ärzten so viel Arbeit ab. Ein zweites Anwendungsgebiet ist die Juristerei: Nuance bringt ebenfalls Spezialvokabular für Anwälte mit, damit sie ihre Aktennotizen und Gerichts­anträge nicht tippen (lassen) müssen. Jedoch schliesst sich die Frage an: Sind Sprachtechnologie und Fachwortschatz tatsächlich die vielen Milliarden wert, die Microsoft bezahlt hat? Oder steckt mehr hinter der Akquisition?
Der Trend in den sozialen Medien, anstatt Text- kurze Sprachnachrichten zu senden, lässt bis anhin sowohl Apple als auch Google kalt. Sie könnten mit ihren Sprachtechnologien durchaus auch die getippten Nachrichten vorlesen – und dem User das Tippen abnehmen, indem gesprochene Chat-Botschaften verschriftlicht werden. Beides sind Zukunftsszenarien, obwohl die Technologie vorhanden ist. Alexa, Google Assistant, Siri stehen parat. Microsofts Cortana ebenfalls. Jedoch sprechen die wenigsten User mit ihrem Windows-PC. Mit der Nuance-Akquisition hat Microsoft nun signalisiert, welche Bedeutung der Konzern der Sprachschnittstelle künftig zumisst.

Big Tech versteht die Schweiz nicht

Wer den direkten Draht zum Kunden hat, kann den maximalen Erfolg erzielen. Amazon hat Alexa, Apple das iPhone (und Siri) und Google die Suchmaschine (und Google Assistant). Microsoft besitzt auf dem Desktop ein Quasimonopol. In Zeiten von Home Office und täglichen Videokonferenzen sollte die Sprache als Interaktionsmethode wichtiger werden. Mit einer kostenpflichtigen Teams-Integration könnte sich Microsofts Akquisition schnell rechnen.
Ob dieses Szenario auch in der Schweiz zur neuen Realität wird, ist fraglich. Zwar hat Microsoft mit den Rumantsch-Interfaces für Office und Windows schon bewiesen, wie wichtig dem Konzern die lokalen Sprachen sind. Ob die Nuance-Technologie nun noch Mattenänglisch, Wallisertitsch und Züridütsch lernen wird, darf bezweifelt werden. «In der Schweiz spielt Nuance aktuell keine Rolle mehr, nachdem sie sich 2017 aus dem Markt zurückgezogen haben», sagt Jürg Schleier vom Sprach­anbieter Spitch. Ein Grund für den Rückzug sei der Mangel an Schweizerdeutschkenntnissen gewesen, doppelt er nach.
Amazon, Apple, Google und Microsoft respektive Nuance scheitern am Schweizerdeutsch. Nicht so die zwei Spezialisten Recapp und Spitch, die mittlerweile schon einen beachtlichen Kundenstamm in der Schweiz auf­gebaut haben. Beide Anbieter waren und sind dafür bereit, Investitionen zu leisten und auch Zugeständnisse zu machen. «Bei Unternehmen und Behörden sind die Anforderungen deutlich höher als bei Consumer Services wie Siri, weil die Systeme das branchen- und fachspezifische Vokabular beherrschen müssen», führt Schleier aus.
Daher müssten die Sprachdialogsysteme über mehrere Monate lang fachlich trainiert werden. «Zudem sind die Anforderungen an Sicherheit um ein Vielfaches höher», so der Experte. Öffentliche Verwaltungen dürften nur Dienste nutzen, die eine Datenspeicherung innerhalb der Schweiz garantieren könnten.




Das könnte Sie auch interessieren