Unternehmen


19

Videos richtig beschriften Wie BR-Archive künstliche Intelligenz einsetzen

Neue Fernsehfilme, Dokus oder Magazinbeiträge – der Videobestand des Bayerischen Rundfunks wächst täglich weiter an. Um die Aussagen bekannter Personen im Archiv wiederzufinden, kommt es auf die richtigen Namen in der Datenbank an. Dafür nutzt der BR automatisierte Gesichtserkennung.

Von: Patrizia Kramliczek

Stand: 24.02.2021

Das Gesicht einer jungen Frau wird von einer Gesichterkennungssoftware erfasst (Symbolbild). | Bild: picture alliance / Zoonar | Axel Bueckert

Sei es ein Statement des Managers vom FC Bayern München oder eine Erklärung der bayerischen Verkehrsministerin: Der Bayerische Rundfunk zeigt in seiner Berichterstattung viele Personen des öffentlichen Lebens. Gut möglich, dass deren Aussagen für weitere Beiträge benötigt werden und aus dem Archiv geholt werden sollen.

Sich im Archiv zu bedienen, das klingt einfach. Doch der Videobestand des Bayerischen Rundfunks ist riesig. Neben den mehr als 311.000 analogen Bild- und Tonträgern sind es aktuell über 840.000 digitale Dateien. Und legt man die Zahlen von 2020 zugrunde, kommen im Schnitt täglich 245 Videofiles dazu.
Damit Redakteurinnen und Redakteure durch die Eingabe von Suchbegriffen am Computer fündig werden, ist die Vorarbeit der Archivarinnen und Archive nötig. Nur wenn sie dafür sorgen, dass zum Beispiel eine Aufnahme des Bayern München-Vorstandschefs Karl-Heinz Rummenigge unter seinem Namen und mit aussagekräftigen Stichworten wie Datum, Ort und Inhalt in der Datenbank abgelegt wird, ist sein O-Ton schnell wiederzufinden.

Technologische Unterstützung fürs Archiv

Gabriele Wenger-Glemser, Leiterin der BR-Abteilung Dokumentation und Recherche

"Die manuelle Dokumentation unserer stets wachsenden Audio- und Videomaterialien erfordert erhebliche Ressourcen, die mit dem wachsenden Sparzwang aber immer knapper werden“, sagt Gabriele Wenger-Glemser, Leiterin der BR-Abteilung Dokumentation und Recherche. "Der Bedarf an inhaltsbezogenen Metadaten für die zeitgemäße Medienproduktion ist enorm." Damit nicht alle Informationen von Archiv-Mitarbeiterinnen und Mitarbeitern zusammengetragen und händisch eingegeben werden müssen, gibt es nun technologische Unterstützung.

Bereits seit 2018 beschäftigt sich der BR mit automatisierter Gesichtserkennung. Das heißt: Mit Hilfe eines Computerprogramms soll bekannten Personen in Videoaufnahmen automatisch der richtige Name zugeordnet werden. Solche Programmierungen lernen aus vielen verschiedenen Aufnahmen einer Person, wie sie aussieht. Algorithmen können dann auch bei einem neuen, noch nicht dagewesenen Bild "entscheiden", ob es sich um die betreffende Person handelt. Man spricht bei dieser Komplexität der Programmierung von maschinellem Lernen oder verwendet den noch breiter gefassten Begriff der Künstlichen Intelligenz (KI).

Nach Tests und Projektversuchen kann der BR seit September 2020 als erste ARD-Anstalt eine automatisierte Gesichtserkennung bei der Archivierung einsetzen, zunächst für Material, das neu ins Archiv eingeht. "Ziel ist, dass dies nicht erst im Archiv erfolgt, sondern schon bei der Produktion neuer Beiträge", erklärt Wenger-Glemser, die das KI-Projekt zur Gesichtserkennung leitet.

"Wenn ein Fernsehteam oder ein VJ von einem Termin Drehmaterial mitbringt, soll dieses – so die Zielvorstellung – direkt automatisiert verschlagwortet werden und auch anderen Redaktionen für die aktuelle Berichterstattung zur Verfügung stehen."

Gabriele Wenger-Glemser, Leiterin der BR-Abteilung Dokumentation und Recherche

Einhaltung von Persönlichkeitsrechten und Datenschutz

Von Anfang an legte der Bayerische Rundfunk großen Wert darauf, dass bei der automatisierten Gesichtserkennung Persönlichkeitsrechte und Datenschutz gewährleistet sind. So werden in das Repertoire der Software nur Personen des öffentlichen Lebens aufgenommen.

"Bei Menschen, die zum Beispiel nur bei einer Straßenumfrage mitmachen, wird die automatische Gesichtserkennung nicht eingesetzt."

Gabriele Wenger-Glemser, Leiterin der BR-Abteilung Dokumentation und Recherche

Und auch bei den bekannten Personen wird der Grundsatz eingehalten, dass die Aufnahmen für die Berichterstattung relevant sein müssen. Es werden mit dem Video auch nur die Daten erfasst, die notwendig für die Berichterstattung sind. Zudem werden die Daten ausschließlich zu journalistischen Zwecken und unter Beachtung des Datenschutzrechts verarbeitet.

Die Dokumentarinnen und Dokumentare im Archiv haben als KI-Managerinnen und KI-Manager eine neue qualitätssichernde Aufgabe: Die Überwachung und Steuerung der Software auch unter dem Aspekt des Daten- und Persönlichkeitsschutzes.

Bauchbinden: Die Namen zum Gesicht

Franziska Mertl, Preisträgerin des ARD/ZDF-Förderpreises 2020

Um den Aufwand für das Training der Software möglichst gering zu halten, entstand die Idee, dafür Text-Einblendungen in bereits veröffentlichtem Filmmaterial zu verwenden. In den sogenannten "Bauchbinden" werden in der Regel Namen und Position einer Person eingeblendet, die zum Beispiel gerade im Interview zu sehen ist. Franziska Mertl, BR-Mitarbeiterin aus der Abteilung "IT und Medientechnik" hat über dieses Vorgehen ihre Masterarbeit geschrieben und wurde dafür mit dem ARD/ZDF Förderpreis "Frauen + Medientechnologie" ausgezeichnet.

Zugeschnitten auf Bayern

Zunächst hatte der BR testweise die Software eines Anbieters ausprobiert. "Wegen des regionalen Fokus der Berichterstattung wurden viele Personen aber gar nicht erkannt oder – noch schlimmer – sogar fehlerhaft gekennzeichnet", erinnert sich Wenger-Glemser. Es habe sich schnell gezeigt, dass für den Bayerischen Rundfunk ein umfangreicher und laufend zu aktualisierender Katalog bekannter Personen benötigt wird. Dass zum Beispiel auch Aufnahmen aus Pressekonferenzen von Vorständen fränkischer Fußball-Clubs oder einer Landrätin richtig zugeordnet werden, setzt ein ständiges Training der Datenbank voraus. Und bei allem Fortschritt übernehmen dabei nach wie vor Menschen eine Kontrollfunktion.


19