Ihr wolltet schon immer mal wissen, wie ein Spracherkenner, wie zum Beispiel Siri oder Google, funktioniert und
aufgebaut ist? Dann seid ihr hier genau richtig!
In diesem Projekt war ein bestehendes Spracherkennungssystems (ASR-System) so anzupassen, dass es in der Sprachaudiometrie
beim Göttinger Satztest (Gösa) eingesetzt werden kann. Der Göttinger Satztest ist ein Sprachtest, der das Verstehen von
Sprache in Ruhe und im Störgeräusch prüft. Dieser Test kann sowohl beim Akustiker als auch beim HNO-Arzt durchgeführt
werden.
Aber, was ist nun ein ASR-System?
Ein ASR-System wandelt die Sprache in einen Text um. Es kann zum Beispiel bei Assistenzsystemen für Menschen mit
Einschränkungen, Diktate, Sprachsteuerung, Stichwortsuche oder weiteren Anwendungen eingesetzt werden.
Wie sind wir vorgegangen?
Zuerst wurden alle originalen Gösa-Sätze mittels eines Aufnahmeprogrammes eingesprochen und anschließend verschriftlicht.
Zusätzlich mussten auch noch falsch eingesprochene Gösa-Sätze aufgenommen und verschriftlicht werden. Diese falsch
eingesprochenen Gösa-Sätze sind nötig, um einen beim Akustiker durchgeführten Sprachtest möglichst realistisch
darzustellen.
Anschließend wurden diese Dateien in ein bestehendes ASR-System eingefügt. Hierbei mussten zum Beispiel das Language Modell
und das Lexikon, welche Bestandteile eines ASR-System sind, mittels dieser Dateien verändert werden. Wir hatten uns für
zwei verschiedene online verfügbare, kostenlose ASR-Systeme entschieden (Kaldi und Deepspeech). Am Ende wurden diese
miteinander verglichen. Betrachtet wurde dabei die Genauigkeit nach der Anpassung.
In Zukunft wäre es vielleicht möglich solche ASR-Systeme im klinischen Bereich oder beim Akustiker einzusetzen, um das
Personal zu entlasten und auch in Pandemie Zeiten Hörtests zu ermöglichen.
Na, Interesse geweckt?
Dann kommt vorbei und studiert "Hörtechnik und Audiologie" an der Jade Hochschule!