SITA

Speech Intelligibility Transformation & Autocorrection

Universell einsetzbares Softwaresystem zur automatisierten, individualisierbaren Verbesserung von Sprachverständlichkeit für Broadcast und Empfänger

Für Menschen mit reduziertem Hörvermögen ist das Sprachverstehen beim Fernsehen bisweilen anstrengend bis unmöglich. Der Einsatz von Musik, Effekten und Nebengeräuschen ist manchmal ein Problem - nicht nur für ältere oder schwerhörende Menschen.

Im BMBF geförderten Verbundprojekt SITA wurden auf Grundlage innovativer Softwaretechnologien Lösungen erforscht, entwickelt und evaluiert, die alle wesentlichen Faktoren für schlechtes Sprachverstehen von Audioinhalten adressieren und die Barrieren für verständliche Sprache umfassend auflösen. Der Projektverbund bestand aus dem Konsortialführer RTW GmbH & Co. KG aus Köln, dem Fraunhofer-Institut für Digitale Medientechnologie (IDMT), Oldenburg und der ebee Engineering GmbH Dresden (vormals TechniSat Dresden GmbH).

Das Projektziel war die Entwicklung einer Technologie zur objektiven Messung der Sprachverständlichkeit und zu deren automatischen und zielgruppenspezifischen Verbesserung. Dabei sollte das System nicht nur im professionellen Umfeld zum Einsatz kommen, wie beispielsweise bei Rundfunk- und Fernsehanstalten, sondern auch dem Endkunden am heimischen Fernsehgerät ein besseres Hörerlebnis ermöglichen.

Basierend auf Verfahren des maschinellen Lernens werden in Echtzeit die vom System empfangenen Audiosignale analysiert und in einem Sprachverständlichkeitsmodell verarbeitet. Dieses Modell berücksichtigt die für die menschliche Sprachwahrnehmung wesentlichen Verarbeitungsmechanismen und berechnet daraus einen Index, der die von Menschen empfundene Höranstrengung widerspiegelt.

Als Ergebnis des Forschungsprojektes konnte zum einen eine Software für den Einsatz im professionellen Audiobereich entwickelt werden, welche die Ergebnisse der Sprachverständlichkeitsanalyse numerisch und graphisch wiedergibt. Zum anderen wurde eine Lösung erarbeitet, die dem Nutzer eine automatische und zielgruppenspezifische Verbesserung der Sprachverständlichkeit im heimischen Umfeld ermöglicht.

Die im Forschungsprojekt entwickelten Technologien ermöglichen nicht nur Rundfunk- und Fernsehanstalten, Produktionsfirmen, Distributoren und Content Providern dem Endkunden ein besseres Hörerlebnis zu verschaffen, sondern auch Medien-Dienstleister und Hersteller aus den Bereichen Home Entertainment und Consumer Electronics können davon profitieren.