KI-basierte Sprachsynthese ist schon bald in der Lage, menschliche Sprache in so guter Qualität zu generieren, dass sie nicht mehr von natürlicher Sprache zu unterscheiden ist – eine Form sogenannter »Deepfakes«. In naher Zukunft wird es möglich sein, beliebigen Personen beliebige Botschaften in den Mund zu legen. Wirksamen Verfahren zur Erkennung synthetischer Sprache sind daher von großer Bedeutung, um auch langfristig eine Prävention und Verfolgung von Betrug, Phishing und Desinformation sicherzustellen.
Ziel von SpeechTrust+ ist es, eine neue Generation von Detektoren zu erforschen, die KI-basierte Sprachsynthese und Sprachverfremdungen zuverlässig und nachhaltig erkennen sollen. Dafür werden nicht nur genau die KI-Methoden zur Detektion eingesetzt, die zu den enormen Verbesserungen bei der Sprachsynthese geführt haben, sondern zusätzlich Verfahren aus der Audioforensik verwendet. Durch diese Kombination soll eine Toolbox entstehen, mit der robuste Detektoren bereitgestellt werden können.