Daten sind ein wesentlicher Rohstoff für die technologische Entwicklung intelligenter Algorithmen, digitaler Anwendungen und innovativer Produkte unserer Zeit. Daten helfen nicht nur, unsere (Um-)Welt zu beschreiben, sondern auch Veränderungen oder Herausforderungen vorherzusagen. In nahezu allen Lebens- und Arbeitsbereichen werden daher Daten generiert, erhoben und analysiert.
Insbesondere die Entwicklung, das Training und die Validierung von KI-Modellen sind auf Daten angewiesen. Diese müssen in geeigneter Qualität vorliegen und dabei den Teil der Realität beschreiben, in dem die Modelle später eingesetzt werden. Unter »geeigneter Qualität« ist nicht nur die Kenntnis und Kontrolle von Störeinflüssen zu verstehen, sondern auch die korrekte und detaillierte Beschreibung (Annotation) der betrachteten Vorgänge.
Bei der Modellierung von akustischen Ereignissen oder Umgebungen gibt es verschiedene Aspekte. Eine akustische Beobachtung besteht in der Regel aus einer oder mehreren Einzelschallquellen mit unterschiedlichen akustischen Eigenschaften sowie gewollten oder ungewollten Hintergrundgeräuschen. Der abgestrahlte Schall wird dann auf seinem Weg zum Empfänger durch Effekte der Schallausbreitung beeinflusst, z. B. Pegelabnahme mit der Entfernung, Beugung an Gegenständen, Brechung an Luftschichten, Absorption, Transmission und Reflexion an Wänden. Ein Schallempfänger wandelt den Schall anschließend in ein analysierbares Signal um. Dies kann z. B. ein Mensch sein, der über das Ohr seine Umgebung wahrnimmt. Andere, technische Empfänger sind elektroakustische Sensoren, z. B. Mikrofone oder Mikrofonarrays, Beschleunigungsaufnehmer, die als Teil einer Sensorik für eine bestimme Anwendung spezifiziert werden.
Je nach Anwendungsfall gilt deshalb für die Entwicklung, das Training und die Validierung von akustischen KI-Modellen: Je detaillierter die genannten Parameter erfasst werden, desto besser gelingt die Nutzung eines akustischen Datensatzes für das Training und die Validierung eines robusten und leistungsfähigen KI-Modells.