Workshop Digital Broadcasting 2022 – eine Rückschau
Vergangene Woche, am 15. und 16. September 2022, trafen sich über 70 Teilnehmende aus allen Teilen Deutschlands zum Workshop Digital Broadcasting WSDB im COMCENTER Brühl in Erfurt. Nach einem corona-bedingten virtuellen Format im Jahr 2020 waren alle Gäste, das Organisationsteam sowie die Kooperationspartner Technische Universität Ilmenau, Thüringer Landesmedienanstalt, Mitteldeutscher Rundfunk und das Fraunhofer IIS sichtlich froh, sich wieder in Person vor Ort zu begegnen.
Der wissenschaftliche Leiter des diesjährigen WSDB, Professor Alexander Raake (TU Ilmenau), eröffnete den mittlerweile 17. Branchentreff und begrüßte die Vertreterinnen und Vertreter aus Rundfunkanstalten, Industrie und Forschungseinrichtungen. Raake freute sich, den Gästen ein dicht gepacktes und abwechslungsreiches Vortrags- und Netzwerkprogramm ankündigen zu können.
Professor Ulrich Reimers zieht Bilanz über fast 30 Jahren Rundfunkentwicklung
Fast schon Tradition ist die Keynote zum Auftakt des WSDB von Professor a. D. Ulrich Reimers (Technische Universität Braunschweig). Für ihn ist der WSDB eine der ganz wenigen deutschsprachigen Fachtagungen, in denen Broadcasting einen thematischen Schwerpunkt bildet – von DAB+ bis 5G Broadcast. In diesem Jahr gab Reimers als profunder Kenner, Entwickler und Mitgestalter der Rundfunktechnologie in seiner Keynote »DAB, DVB-H, DVB-T2, DAB+, 5G Broadcast: Wenn man immer schon vorher klug (gewesen) wäre« einen ebenso spannenden wie unterhaltsamen Rückblick in fast 30 Jahre Rundfunkgeschichte. Er verdeutlichte, dass Erfolg wie auch Misserfolg von Rundfunktechnologien stets von einer Vielzahl von Einflussfaktoren abhängen. Diese sind im Vorhinein zwar abschätzbar, doch nicht immer erfüllen sich die Erwartungen. So konnten sich auch exzellente Technologien letztlich nicht am Markt durchsetzen (DVB-H, DMB), während andere (DVB-T, DAB+, DVB-T2, DVB-C, DVB-S und DVB-S2) heute fester Bestandteil der Rundfunkwelt sind. Diese Erkenntnisse regen zur Analyse an und werden uns auch mit dem »Blick nach vorn« weiter begleiten. Insbesondere dem Thema 5G Broadcast wird laut Reimers hier eine ganz besondere Bedeutung zukommen.
Fachsession 1 »5G Broadcast«
In zwei Vorträgen wurde den Teilnehmenden ein Überblick über derzeit laufende 5G Broadcast-Modellversuche geboten. Untersucht wird momentan, inwieweit die 5G-Technologie für die künftige Versorgung von mobilen Endgeräten und Fahrzeugen mit Rundfunkinhalten als auch zur Information der Bevölkerung im Krisen- und Katastrophenfall geeignet ist.
Dr. Nils Eulig (NDR, Media Broadcast GmbH) betonte, dass dabei einerseits die Parametrisierung und die damit jeweils erzielbaren Empfangseigenschaften auf mobilen Geräten im Stadtgebiet und andererseits die Interoperabilität der Systemkomponenten unterschiedlicher Hersteller eine wichtige Rolle spielen. Jonas von Beöczy (TU Braunschweig) berichtete von dem vielversprechenden Projekt »5G Media 2Go«, bei dem Testfahrzeuge während der Fahrt erstmals zuverlässig mit linearen Inhalten versorgt werden können.
Fachsession 2: »Streaming und Broadcast in der Praxis«
Peter Wyrwich von TVU Networks berichtete über cloud-basierte Remote Broadcast Workflows, wie sie aktuell vor allem in den USA bereits häufig eingesetzt werden. Es wurde anhand von Beispielen gezeigt, wie sowohl Live-Inhalte als auch Archivmaterial mit Hilfe von KI-Anwendungen automatisiert mit Metadaten angereichert und gesteuert werden können. Schließlich wurde auch vorgestellt, wie komplette Remote-Workflows in der Cloud abgebildet und so ganz neue Arbeitsweisen ermöglicht werden.
Tobias Rahn (ARD Koordination Digital) stellte in seinem Vortrag die geplante Betriebsplattform der Digitalen Produkte der ARD im Jahr 2030 vor. In einem Baukastensystem sollen zukünftig alle digitalen Produkte gebündelt und alle Rundfunkanstalten sowie Audio- und Videodaten eingebunden werden. Mit der neuen Infrastruktur wird die Grundlage geschaffen, Inhalte besser aufzufinden, passende automatisch generierte Empfehlungen zu erhalten und die ARD-Angebotsstrukturen und Produkte zu optimieren. Die Einführung und die damit verbundenen Anpassungen der Workflows in allen Gewerken aller Häusern der ARD wird ein Umbau von historischem Ausmaß.
Über die Herausforderungen der Streamingdienste in der Pandemie berichtete Christan Koch von der TreeTop GbR Ilmenau. In seinem Praxisbericht über das Online-Conferencing mittels Live-Videostream wurde deutlich, dass eine der größten technischen Herausforderung immer noch der am Ort verfügbare Netzwerkzugang ist – die Bandbreite reicht hier vom Gigabit-Anschluss bis zum LTE-Gateway mit unklarer Bandbreite. Koch zeigte gute und schlechte Praxisbeispiele auf mit der Konsequenz: Man sollte immer einen Rückkanal einrichten und im Vorfeld der Online-Events ausgiebig testen.
Die Session Streaming rundete Justus Rogmann (Haivision) mit seinem Resümee ab, dass man für Live-Streaming mit geringer Latenz nicht mehr an der Open Source Secure Reliable Transport (SRT) Protokoll-Lösung vorbeikommt. Mit einem ausklügelten Verfahren zum Ausgleichen von Paketverlusten ausgestattet, erlaubt SRT eine Zuverlässigen Übertragung von Mediendaten auch in potenziell weniger zuverlässigen Netzwerken wie WLAN, LTE, 5G sowie das öffentliche Internet.
Der erste Tag mit Fachvorträgen und vielen interessanten Pausendiskussionen endete mit einem Stadtrundgang durch Erfurts malerische Altstadt und die Horchgänge des Petersbergs. Bei einem rustikalen Abendessen wurde dann gerne und lange miteinander gefachsimpelt.
Keynote: »KI für Ton und Bild – Werkzeugkasten, Motivationsmonster oder Spielverderber?«
Der zweite Tag des Branchenevents begann mit einer Keynote von Steffen Holly, Geschäftsführer der Psoido GmbH in Erfurt und MusicTech Evangelist. Er stimmte die Gäste mit seinem kurzweiligen Vortrag zum Thema »KI für Ton und Bild – Werkzeugkasten, Motivationsmonster oder Spielverderber?« gut für den zweiten Workshoptag und die anschließende Fachsession 3 »KI in den Medien« ein. Holly skizzierte an Beispielen, dass KI Fluch und Segen zugleich sein kann und als Werkzeug für ganz unterschiedliche Interessen zum Einsatz kommt. Klar wurde, dass maschinelles Lernen und KI gerade im Medienbereich mächtige Werkzeuge sind, um die Informationsflut im Netz zu beherrschen, Inhalte zu analysieren und Arbeitsabläufe zu automatisieren. Und doch hat KI ihre Grenzen, denn Humor, Kreativität und gesunder Menschenverstand lassen sich mit KI noch nicht entschlüsseln.
Fachsession 3 »KI in den Medien«
Max Kiefer vom WDR stellte in seinem Vortrag die Ergebnisse der Arbeitsgruppe von ARD und ZDF zur Verbesserung der Sprachverständlichkeit im Fernsehprogramm vor. Anhand eindrucksvoller Beispiele zeigte er, wie mit Hilfe von KI-basierten Algorithmen eine optimierte Tonmischung für Menschen mit Hörbeeinträchtigungen erzeugt wird, die seit Juni 2022 als zusätzliche Tonspur »Klare Sprache« ausgespielt wird.
Passend zum vorherigen Vortrag präsentierte Christian Rollwage vom Fraunhofer IDMT eine KI-basierte Technologie, die es ermöglicht, eine alternative Tonspur automatisiert zu erzeugen. Grundlage hierfür sind die objektive Messung der Höranstrengung sowie eigens trainierte neuronale Netze. Diese extrahieren aus den Mischungen den Sprachanteil, beurteilen die Verständlichkeit und trennen das Mischsignal in Sprache/Nichtsprache bzw. Vorder- und Hintergrund. Auf dieser Basis wird eine Tonspur erzeugt, die optimiert ist für optimale Sprachverständlichkeit.
Dr. Julia Stockamp von der ProSiebenSat.1 Tech Solutions GmbH stellte die Plattform ICON (Intelligent Content) vor, die eine optimierte Verwertung von Videoinhalten durch den Einsatz KI-basiert erzeugter Metadaten zum Ziel. Hierfür werden verschiedene Machine-Learning-Verfahren für die automatisierten Inhaltsanalyse für Video, Audio und Text miteinander kombiniert und somit detailreiche Metadaten generiert. In ICON kommen sowohl Komponenten und Modelle kommerzieller Anbieter als auch eigens erstellte ML-Modelle, die auf konkrete individuelle Anforderungen trainiert wurden, zum Einsatz. Die generierten Metadaten bilden die Basis u. a. für die Archivierung und Wiederverwertung von Inhalten, für die optimierte Werbeausspielung oder für die weitere Automatisierung von Prozessen.
Fachsession 4 »Digitalradio«
In der vierten Session zum Thema Digitalradio DAB+ gab es auch dieses Mal interessante Beiträge, die zeigen, dass auch bei DAB+ immer wieder neue Anwendungsfelder erschlossen werden.
Harald Hoffend vom Funkhaus Regensburg stellte zum Thema Bevölkerungswarnung eine vollautomatische Anbindung der DAB+ Radioprogramme charivari und gong fm an das Modulare Warnsystem (MoWaS) des Bundesamts für Bevölkerungsschutz und Katastrophenhilfe (BBK) vor. Die Anforderungen des BBK an die Rundfunkstation sind dabei sehr hoch. Neben einer guten Text-to-Speech-Synthese der Warnmeldungen müssen jederzeit Programmunterbrechungen bei Warnmeldungen höchster Priorität möglich sein und es bedarf einer vollautomatischen Verarbeitungskette, die eine schnellstmögliche Verbreitung der Warnungen auch im automatischen Sendebetrieb ermöglicht.
Für die Auswahl der Radioprogramme bei DAB+, insbesondere in Fahrzeugen, stellen veraltete Senderlogos ein Problem dar. Mit dem Datendienst Service and Programm Information (SPI) können diese Logos in mehreren Auflösungsstufen direkt über DAB+ aktualisiert werden. Alexander Jahn von der Bayern Digital Radio GmbH (BDR) berichtete über die Ziele und die Ergebnisse des von der BDR durchgeführten SPI-Projekts. Wichtigste Erkenntnis hierbei ist, dass idealerweise alle Daten in einem einzigen SPI-Dienst für das gesamte Ensemble ausgesendet werden sollten, auch für Ensemble-fremde Programmanbieter. So werden möglichst viele Empfänger kompatibel versorgt.
Ralf Cabos (PaxLife Innocations GmbH) stellte ein gemeinsames Projekt mit Deutschlandradio vor, bei dem digitaler Rundfunk und Mediatheken für die Nutzung in der Bahn kombiniert wurden. Die Implementierungstests waren erfolgreich und zeigen, dass durch eine Kombination von Broadcast-Diensten, Mobilfunknetzen und lokalem Caching neue, attraktive und zuverlässig verfügbare Angebote für die Fahrgäste realisiert werden können. Nun folgt die Erstinstallation für den Regelbetrieb bei der ODEG (Ostdeutsche Eisenbahngesellschaft).
Fachsession 5 »KI für die Content-Analyse«
Nach der Mittagspause, die den nötigen Raum für angeregte Gespräche bot, startete die letzte Session des diesjährigen Workshops Digital Broadcasting. Den Auftakt machte Werner Bleisteiner vom Bayerischen Rundfunk. Er berichtete über verschiedene, bereits gut funktionierende Anwendungen, aber auch über Hürden der automatischen Inhaltsanalyse im Produktionsprozess. Viele Analyseverfahren (Transkription von Sprache, automatische Textübersetzung, künstliche Stimmsynthese, Erkennung von Menschen in Bildern und Tönen) erleichtern heute schon die Arbeit der Medienschaffenden deutlich. Bleisteiner zeigte aber auch Ursachen auf, warum die Erwartungen oftmals noch nicht erfüllt werden können. Als Ursachen dafür machte er u. a. mangelnde Interoperabilität von Formaten und Prozessen aus, die häufig noch zu stark vom alten»linearen Denken« geprägt sind.
Im Vortrag »Wie gut ist mein KI-System?« sprach Dr. Uwe Kühhirt vom Fraunhofer IDMT über die Evaluation von Gesichtserkennungsalgorithmen und die wichtige Rolle von KI-basierten Multimedia-Analysen für den Medienbereich. Dabei ging er auf die Bedeutung von Trainingsdatensätzen im Bereich Gesichtserkennung und dabei insbesondere auf die Gefahr von potenziell vorurteilsbehafteten Modellen ein. Vor allem der systematischen Evaluation aller Komponenten und Bausteine der Prozesskette kommt bei der Entwicklung anwendungsspezifischer KI-Lösungen eine besondere Bedeutung zu.
Den Abschluss der Session und des WSDB 2022 machten Manja Kuhn und Tom Breuer von der ZDF Digital Medienproduktion GmbH. Gemeinsam stellten sie unter dem Titel »Let Your Data Support You: Wie Machine Learning und Natural Language Processing Medien unterstützen« Zwischenergebnisse des Forschungsprojekts »AI4MediaData« vor. Sie zeigten am Beispiel des Teilprojekts »Asset Match«, wie mit einem zweistufigen Data-Mining-Prozess Videoinhalte semantisch aufgeschlossen werden können, indem extrahierte Texte mit Hilfe von Natural Language Processing (NLP) mit Kontext-gebenden Informationen angereichert werden. Darauf basierend können Inhalte anhand ihrer semantischen Ähnlichkeit miteinander verglichen und Verknüpfungen zwischen Inhalten hergestellt sowie Content inhaltsbasiert empfohlen werden. So können zeitaufwändige und fehleranfällige Arbeitsschritte reduziert werden und Medienschaffende behalten den Überblick in der stetig wachsenden Content-Landschaft.
Resümee: Facettenreiches Branchenevent mit fundierten Fachvorträgen, mitreißenden Keynotes und viel Raum für Gedankenaustausch
Dr. Ulrich Liebenow, Betriebsdirektor des MDR, zog positive Bilanz: »Ich bin froh, dass der MDR wieder als Kooperationspartner des Workshops Digital Broadcasting an Bord war. Sehr gern habe ich in diesem Jahr die Veranstaltung in Erfurt besucht. Dem Organisationsteam ist es wiederum gelungen, mit dem Vortragsprogramm eine fast einzigartige thematische Mischung aus Rundfunk-, Medienproduktions- und Infrastruktur-Themen in einer Balance zwischen Forschung, Modellversuchen und Praxis zu gestalten. Ich habe die kreative Atmosphäre der Veranstaltung und – nach vielen pandemiebedingten Einschränkungen – im Besonderen den persönlichen fachlichen Austausch vor Ort sehr geschätzt.«
Der nächste Workshop Digital Broadcasting findet voraussichtlich im September 2024 statt.