Best Paper Award der AES International Conference on Audio Forensics 2024 geht an Luca Cuccovillo, Patrick Aichroth und Thomas Köllmer

Luca Cuccovillo, Patrick Aichroth und Thomas Köllmer erhielten Ende Juni in Denver (Colorado, USA) den Best Paper Award auf der 2024 AES International Conference on Audio Forensics. In ihrem Beitrag beschreiben sie eine Methode, mit der man nicht nur Aussagen treffen kann, ob es sich um synthetisierte Sprache handelt oder nicht, sondern auch eine Fehlerquote angibt, wie sicher diese Erkennung ist.

Drei Männer halten eine Urkunde in den Händen.
© Fraunhofer IDMT
Luca Cuccovillo, Patrick Aichroth und Thomas Köllmer (v.l.n.r.) mit ihrem Best Paper Award, der ihnen im Juni auf der AES International Conference on Audio Forensics überreicht wurde.

In dem wissenschaftlichen Konferenzbeitrag »Calibrating neural networks for synthetic speech detection: A likelihood-ratio-based approach« stellten die drei Wissenschaftler vom Fraunhofer IDMT in Ilmenau ein Verfahren vor, mit dem unkalibrierte Ergebnisse aus synthetischer Spracherkennung in sogenannten Likelihood Ratios Wahrscheinlichkeitswerten angegeben werden.

Neuronale Netze zur Erkennung synthetischer Sprache sind normalerweise unkalibriert. Das bedeutet, dass der Wert, der ausdrückt, ob eine Sprache synthetisch ist oder nicht, stark variieren kann – je nach Qualität der Datei, abhängig davon wie oft sie beispielsweise in sozialen Netzwerken neu hochgeladen wurde oder auch, ob Hintergrundmusik vorhanden ist usw.

Die von Cuccovillo, Aichroth und Köllmer vorgestellte Methode zur Detektion synthetisierter Sprache gibt nun das Ergebnis in einem Wahrscheinlichkeitswert aus. Damit wird nicht nur angegeben, ob die Sprache synthetisch zu sein scheint oder nicht, sondern auch mit welcher Fehlerquote. Dieses Fehlermaß wird beispielsweise auch in forensischen Laboren bei DNA-Analysen verwendet.

 

Die Methode wurde im Rahmen der Projekte news-polygraph und speechtrust+ am Fraunhofer IDMT entwickelt und kombiniert die Expertise des Instituts im Bereich der Forschungsthemen Medienforensik und vertrauenswürdiger Künstlicher Intelligenz.

Diese Methode soll forensische Labore und Faktenprüfer schon bald dabei unterstützen, Audio-Deepfakes zuverlässig zu erkennen.

Herzlichen Glückwunsch an unsere Kollegen und vielen Dank an das AES-Organisationskomitee!

Letzte Änderung: