Wie man interdisziplinäre Kooperationen zwischen Kommunikationswissenschaft und Informatik gut gestaltet

 

 

 

   Katharina Kleinen-von Königslöw, Universität Hamburg

 

 

 

  Chris Biemann, Universität Hamburg

In den letzten Jahren haben wir diverse Projektanträge, Strategiepapiere und interdisziplinäre Projekte erfolgreich gestaltet, z. B. eine Online-Codier[Annotations!]plattform zur Verknüpfung von manuellen und automatisierten Inhaltsanalysen verbessert oder Ideen zum Einsatz hybrider Künstlicher Intelligenz zur Erkennung sozialwissenschaftlicher Konzepte in Texten entwickelt. Daraus ergeben sich folgende Überlegungen zur guten Kooperation zwischen Kommunikationswissenschaft (KW) und Informatik.

Die KW braucht die Informatik. Seit ihr Kerngegenstand, die mediale Kommunikation, überwiegend im digitalen Raum stattfindet, fallen kontinuierlich Aufgaben an, für die Informatikkenntnisse nötig sind. Das kann von Servern für Mediendaten und Simulationen, über Programmierschnittstellen oder Scraper, bis zu Programmierung von Nachrichten-Empfehlungssystemen für Experimente oder Machine Learning und neuronale Netzwerke für Inhaltsanalysen reichen. Es geht also nicht nur um Computational Communication Methods, sondern oft darum, „normale“ KW-Forschung zu erleichtern.

Aber braucht die Informatik die KW? Viele dieser Aufgaben sind für die Informatik reine Dienstleistungen, ohne Wert für die eigene ­Forschung, uninteressant für Drittmittelförderer. Und dennoch kann sich die Kooperation für die Informatik lohnen: Denn wenn die KW Informatik-Methoden zur Beantwortung ihrer eigenen Forschungsfragen anwendet, können dadurch z. B. Anforderungen an Sprachmodelle sichtbar, manuelle Codierungen als Trainings­daten wieder­verwendet werden oder schlicht neue, für die Informatik spannende Problemstellungen entstehen. Aber um das Innovationspotential der KW-Projektideen für ihr Fach einschätzen zu können, braucht es Informatiker*innen, die sich auf die Ideen einlassen und auf dieses Potential abklopfen. Und die bei Bedarf bereit sind, die reinen Dienstleistungsbedarfe der KW im Projekt mit zu adressieren (so wie die eigenen Infrastrukturbedarfe). Oder aber es braucht etwas wie das House of Computing and Data Science der Universität Hamburg, das Forschende bei der Suche nach Kooperationspartner*innen auf Augenhöhe in der Informatik unterstützt, aber auch informationstechnische Dienstleistungen an die Fachwissenschaften vermittelt.

Beide Fächer folgen allerdings unterschied­lichen Logiken, deren sich alle Beteiligten bewusst sein sollten, um Kooperationskonflikte zu vermeiden. Hierzu drei Beispiele:

Anforderungen an die Daten. Die Informatik liebt große, leicht zugängliche Datenmengen; ob diese Daten das Forschungsobjekt der KW aber gut abbilden, ist eher nebensächlich – außer es lassen sich darin für die Informatik relevante Problemstellungen finden. Für die Language Technology, Chrisʼ Forschungsfeld, ist außerdem der reine Text ausreichend, vielleicht noch ergänzt um Metadaten wie Medium, Autor und Rubrik. Für die KW wären aber Informationen zur Platzierung der Texte auf der (Web-)Seite, zu Formatierung und Bebilderung wichtig. Denn ohne diese Informationen können Codierer*innen z. B. journalistische Darstellungsformen nicht mehr so verlässlich wie gewohnt zuordnen.

Zudem ist aus Sicht der KW einer der wichtigsten nächsten Schritte in der Inhaltsanalyse die bessere Integration von Text-, Audio-, Bild- und Video­daten – aber die Expertise hierfür verteilt sich in der Informatik auf unterschiedliche Fach­gebiete, mit jeweils eigenen Forschungsinteressen.

Anforderungen an die Datenspeicherung. Die Informatik hat eine stärkere Open-­Data-Tradition als die KW und legt viel Wert darauf, die ­verwendeten Daten zukünftiger Forschung zur Verfügung zu stellen, und sei es in stark vereinfachter Form, um Konflikte mit Urheberrecht und Datenschutz zu vermeiden. Für die KW sind aber z. B. Textdaten, deren Sätze in zufällige Reihenfolge gebracht wurden, uninteressant, da sich die Originalkontexte nicht mehr daraus rekonstruieren lassen. Das hat Auswirkungen darauf, welche Daten in gemeinsamen Projekten genutzt werden können, welche Lizenzverein­barungen getroffen werden müssen, was später in welcher Form veröffentlicht werden darf oder gelöscht werden muss und natürlich Einfluss auf die Projektkosten.

Anforderung an Tools/Methoden. Im Fokus der Informatik liegt die Entwicklung neuer Tools; die KW ist darauf angewiesen, dass diese gepflegt, auftretende Fehler behoben und die Usability optimiert werden, idealerweise über den Projektzeitraum hinaus. Bei gemeinsamen Projekten muss dies also von Anfang an eingepreist sein. Dafür ist es oft besser, vorhandene Tools weiter­zuentwickeln, was nicht immer den Interessen der Informatiker*innen entspricht. Bei den Methoden feilt die Informatik an Algorithmen und Sprachmodellen und feiert jedes Prozent Präzisions­gewinn. Dass ein Modell mit einer ­Präzision von 51 statt 49 % aus Sicht der KW immer noch unbrauchbar ist, weil es weiterhin fast die Hälfte aller Textstellen „falsch“ codiert, dient dann aber den Projektpartner*innen sicherlich als Ansporn für weitere Modellverbesserungen.