Der Unterschied zwischen Sprach- und Sprecherkennung

Kombinierte Sprach- und Sprecherkennung in Call Centers
Bild: Jupiterimages | Getty Images

Das eine hat mit dem anderen zu tun, ist jedoch nicht dasselbe.

Letzte Woche haben wir über das aktuelle Projekt der Swisscom berichtet – das Unternehmen setzt neu Technologien der Stimm- und Sprecherkennung für ihre Hotline ein. Voiceprint setzt auf Sprecherkennung, Call Centers nutzen jedoch vermehrt auch die Möglichkeiten der Spracherkennung. Wo liegen die Unterschiede?

Spracherkennung

Über Spracherkennung werden gesprochene Worte und Sätze analysiert, semantisch ausgewertet und zu nutzbaren Resultaten verarbeitet.

Anwendungen
Die Technologien und Methoden der Spracherkennung öffnen eine Vielzahl von Anwendungsbereichen. Zum Beispiel lassen sich Texte am PC oder mobil diktieren und automatisch erfassen und brauchen nicht getippt zu werden. Die Softwarepakete Dragon von Nuance sind seit Jahren führend in diesem Bereich. Oder Kundenservice an Automaten und im Web: der Kunde stellt mündlich Fragen und erhält vom System automatisch die richtigen Antworten. Oder auch die inzwischen hoch entwickelten Sprachassistenten wie Siri von Apple, die nicht nur gesprochene Anfragen ausführen, sondern immer mehr auch zu "Gesprächspartnern" werden und teilweise komplexe Fragen kompetent beantworten können.
Die Anwendungsfelder sind inzwischen sehr weit gefasst, im Kern geht es bei der Spracherkennung um die Interaktion und den Austausch von Informationen zwischen Mensch und Maschine – über das Mittel der Sprache.

Sprecherkennung

Sprecherkennung zielt auf den Sprechenden selbst, der identifiziert werden soll. Aufgrund seiner Sprechweise, Frequenz, Geschwindigkeit, Aussprache, Akzent, Sprachrhythmus und weiteren Merkmalen, die für diesen einen Menschen typisch und einzigartig sind.

Anwendungen
Ausgefeilte Technologien der Sprecherkennung ermöglichen die eindeutige Identifizierung des Sprechenden und lassen sich innerhalb von sicherheitsrelevanten Bereichen einsetzen. Zum Beispiel für Zugriffs- oder Zutrittsberechtigungen und damit verbundene Autorisierungen und Freigaben. Voiceprints gehören auch im Finanzbereich und Zahlungsverkehr zu den biometrischen Authentifizierungsverfahren, neben Fingerprint und Gesichtserkennung, die Passwort-Systeme ablösen werden.

Spracherkennung und Sprecherkennung in Kombination

Das Schweizer Startup-Unternehmen Spitch gehört zu den Spezialisten in den Bereichen der Spracherkennung, Analyse und Sprecherkennung. Das Video zeigt beispielhaft eine kombinierte Anwendung der Technologien in Call Centers und für Hotlines.

Spitch: Anwendung Sprachtechnologien und Services

Spitch: Nochmals dasselbe, aber statt Deutsch in Schwiizerdütsch

Mehr zum Thema: Event "Speech Technology Trends", Zürich, 22. September 2016

Nuance: Beispiele Spracherkennung mit Dragon Software

Stichworte zum Thema im Lexikon: Biometrische Authentifizierung