Automatic Gain Control (AGC)
Durch die AGC, im Deutschen auch automatische Verstärkungsregelung genannt, wird sichergestellt, dass das Mikrofonsignal immer in gleicher Lautstärke erfasst wird. Wenn eine Sprecherin oder ein Sprecher weiter weg im Raum steht, ist das Signal, das in die Mikrofone gelangt, deutlich leiser, als wenn die Person direkt vor dem Mikrofon steht. Die AGC gleicht diesen Pegelunterschied automatisch aus, ohne dabei leise Hintergrundgeräusche unerwünscht zu verstärken.
Beamforming
Beamforming ist die Technik, Signale aus mehreren Mikrofonen zu einem einzigen zusammenzufassen und dabei eine gewünschte Richtwirkung hin auf eine bestimmte Schallquelle zu erzielen. Durch das Fokussieren auf eine Sprachquelle im Raum werden seitliche Störgeräusche abgeschwächt und die Sprachverständlichkeit erhöht. Was der Mensch intuitiv kann (genau hinhören), ist für die Maschine nicht selbstverständlich.
Echo Cancellation
Jeder kennt es vom Telefonieren: Die Person am anderen Ende der Leitung schaltet das Telefon »auf Lautsprecher« – und plötzlich hört man die eigene Stimme als Echo. Das stört den Redefluss gewaltig! Das Sprachsignal, das beim Gegenüber aus dem Lautsprecher kommt, gelangt dort wieder ins Mikrofon. Aber eine gute Echo Cancellation, auch Echokompensation genannt, filtert das Echo heraus, bevor es über die Leitung geschickt wird. Keine einfache Sache, besonders wenn beide Partner gleichzeitig sprechen. Unsere Echo Cancellation beherrscht jedes Szenario und ist frei skalierbar, auch auf beliebig vielen Lautsprechern und Mikrofonkanälen gleichzeitig.
Dereverberation
Auch der natürliche Nachhall eines Raumes kann beim Telefonieren stören. Und die Qualität von automatischer Spracherkennung leidet ebenfalls stark darunter. Die sogenannte blinde Nachhallunterdrückung, auch Dereverberation genannt, entfernt störende Raumanteile aus der Sprache und sorgt für ein trockenes, gut verständliches Sprachsignal.
Comfort Noise Injection
»Hallo? Bist du noch da?« – auch die Situation kennen viele von Telefonaten. Wenn in Sprechpausen zu viel Störgeräusch herausgefiltert wird, bleibt völlige Stille. Es entsteht der Eindruck, die Leitung sei »tot«. Eine gute Comfort Noise Injection, im Deutschen Komfortrauschen genannt, füllt die Sprechpausen mit einem künstlich erzeugten Rauschen, das dem natürlichem Hintergrundgeräusch in Klangfarbe und Pegel entspricht, damit trotz massiver Störgeräusch-Beseitigung der Eindruck eines transparenten, offenen Kommunikationskanals besteht.