GEI§T– Generator für emotional individualisierbare Synthetik-Stimmen

In der heutigen Medienproduktion entstehen hohe Kosten durch händische Anpassungen von Nachrichtenbeiträgen für andere Medienkanäle. In der Regel werden zeitlich kürzere Fassungen für unterschiedliche Kanäle, wie zum Beispiel Social Media erzeugt. Dabei wäre häufig auch eine komplette Neuvertonung durch den Originalsprechenden nötig. Ziel des Projekts GEI§T ist es, ein automatisiertes Verfahren zur Erstellung unterschiedlicher Varianten eines Originalbeitrags zu realisieren, wobei sowohl die inhaltliche Zusammenfassung als auch die Nachvertonung mit Hilfe synthetisierter Stimmen, mittels individueller Stimmprofile und frei wählbarer Tonalität und Emotionalität weitgehend automatisiert erfolgen. Auch die Transkription zu leichter Sprache soll automatisiert möglich sein. Somit werden Arbeitsprozesse noch effizienter und einfacher.

Unter der Leitung des Hamburger Unternehmen nachtblau, welches sich auf effiziente Prozesslösungen rund um die Medienproduktion spezialisiert hat, wird geforscht, inwiefern bestehende Prozesse sich durch den Einsatz moderner KI-basierter Technologien verbessern lassen, Content schneller und effizienter genutzt und der Workflow beschleunigt werden kann.

Die beteiligten Forscherinnen und Forscher der Stuttgarter Hochschule der Medien HdM legen ihren Fokus dabei auf Medienethik und die rechtlichen Fragen, die sich aus den neuen KI-Technologien ergeben. Die Forschenden des Fraunhofer IDMT am Standort Oldenburg konzentrieren sich im Projekt auf die KI-basierte Signalanalyse und Sprachsynthese. Ihre Kolleginnen und Kollegen am Standort Ilmenau entwickeln außerdem Technologien zur robusten Kenntlichmachung von synthetisch erzeugtem Material und damit verknüpften Nutzungsinformationen. Damit sollen die Authentizität und eine rechtskonforme Nutzung der künstlich erzeugten Stimmen sichergestellt werden.  Zum Ende des Projektes werden die entwickelten Technologien in einen Demonstrator überführt.

Die Entwicklungen sollen im Erfolgsfall in bestehende Produkte von der nachtblau GmbH integriert werden.

Weitere Informationen

 

Presseinformation / 23.5.2022

Sehen, wann gesprochen wird

Neue Algorithmen des Fraunhofer IDMT bilden die Basis für die »Dialog Detection« in Steinbergs neuster Version von Nuendo.

 

Presseinformation / 4.11.2021

Besser verstehen

Tonmeistertagung 2021: Das Fraunhofer IDMT stellt Lösungen für die Analyse, Bewertung und Verbesserung von Sprachverständlichkeit vor.

 

Projekt SITA

Besser verstehen statt lauter drehen!

SITA adressiert die wesentlichen Faktoren für schlechte Sprachverständlichkeit in der gesamten Distributionskette.

 

Projekt SpeechTrust+

Synthetische Sprache zuverlässig erkennen

Ziel von SpeechTrust+ ist die Erkennung von KI-basierter Sprachsynthese und Stimmverfremdung.

 

Projekt vera.ai

Verifikation mit Hilfe von künstlicher Intelligenz

Im Projekt vera.ai entstehen vertrauenswürdige KI-Lösungen zur Desinformationserkennung.

Das Projekt wird unter dem Förderkennzeichen FKZ 01IS23014 A-C vom Bundesministerium für Bildung und Forschung BMBF im Rahmen der Ausschreibung »Erforschung, Entwicklung und Nutzung von Methoden der Künstlichen Intelligenz in KMU (KI4KMU)« gefördert.

Sprachverständlichkeit analysieren und optimieren

Die von uns entwickelten Softwarelösungen sind in der Lage, die Verständlichkeit von Sprache zu messen, anzuzeigen und zu optimieren – auf Wunsch auch automatisch.