Welche Digitalisierungsthemen werden politisch und gesellschaftlich gesetzt? Ergebnisse einer automatisierten Textanalyse

Um Hinweise auf potentiell wichtige Themen der Digitalisierungsforschung zu finden, führte das CAIS eine automatisierte Inhaltsanalyse richtungsweisender Textdokumente durch. Ein Einblick in den Prozess und in die Erkenntnisse.

Gesellschaftliche Entwicklungen vorherzusehen und darauf entsprechend zu reagieren, sind zentrale Aufgaben politischer und gesellschaftlicher Akteur:innen. Welche Digitalisierungsthemen werden aber überhaupt politisch gesetzt? Und welche davon eher kurz- oder eher mittelfristig? Wie agieren Fördermittelgeber (z.B. die Deutsche Forschungsgemeinschaft oder das Bundesministerium für Bildung und Forschung) in diesem Feld? Setzen sie abweichende Schwerpunkte? Und welche Themen mit Fokus auf die digitale Transformation werden von anderen Einrichtungen bearbeitet?

Um diese Fragen zu beantworten, wurde im Herbst 2020 eine automatisierte Textanalyse solch richtungsweisender Dokumente durchgeführt. In Kombination mit den Befunden der Online-Real-Time-Delphi-Studie von Herbst 2019 sowie den ein Jahr später durchgeführten Expert:innen-Diskussionen mit Forschenden der Digitalisierungsforschung, ist diese automatisierte Textanalyse ein weiterer Baustein im Rahmen der Identifikation zukunftsweisender Forschungsthemen am CAIS.

Automatisierte Textanalyse von 471 Dokumenten

Die automatisierte Textanalyse von 471 Dokumenten umfasste wichtige Texte, wie unter anderem die Digitalisierungsstrategien von Bundesländern, Ausschreibungen für Forschungsprojekte des Bundesministeriums für Bildung und Forschung, sowie die Selbstbeschreibungen bereits bestehender Forschungszusammenhänge mit Digital-Fokus. Die Datenerhebung dazu fand statt in der Zeit vom 20. August bis zum 07. September 2020. Dabei wurde basierend auf dem Bag-of-Words-Ansatz ein explorativer Einblick in grobe Strukturen und Inhalte der Texte erreicht.

Erste Erkenntnis: Starke Ausprägung von forschungs- und wirtschaftsbezogenem Vokabular in allen Texten

Durch die Auswahl der Quellen bedingt, stehen Worte wie „Digitalisierung“ und „digital“ natürlich im Zentrum. Der Fokus der Texte auf ein wirtschaftsbezogenes, praxisorientiertes Vokabular deutet auf die Diskussion eines starken Anwendungsbezugs digitaler Technologien in den Texten hin (siehe auch Abbildung 2). Basierend auf einem Topic-Modeling-Ansatz (LDA) zeigt sich neben einem Schwerpunkt an politik- und wirtschaftsbezogenen Inhalten ein hoher Anteil an forschungsbezogenem Vokabular.

 

Bag-of-Words-Ansatz

Bag-of-Words-Ansatz bedeutet, dass Texte für die Analyse in Bestandteile festgelegter Länge zerlegt werden. Dabei löst sich der Kontext auf, in dem sich etwa Worte, Wortgruppen oder Sätze befinden. Bildlich gesprochen befinden sich in einem Beutel alle Worte der ursprünglichen Texte in loser Reihenfolge und Beziehung.

Topic-Modeling-Ansatz

Topic Modeling bezeichnet ein Verfahren in der automatisierten Verarbeitung von Texten. Ein Topic Model kann verstanden werden als ein statistisches Model zur Entdeckung von Themen oder semantischen Strukturen, die in einer Sammlung von Dokumenten vorkommen. LDA ist die Kurzform eines gängigen Analyseverfahrens: Latent Dirichlet Allocation.

Zweite Erkenntnis: Kongruente Ergebnisse zu anderen Themenfindungsmethoden

Eine Analyse der Überschneidung von Themen der Real-Time-Delphi-Studie sowie der Expert:innen-Diskussionen mit Themen der automatisierten Textanalyse deutet auf einen Schwerpunkt hinsichtlich des Themenfeldes IT-/Cybersicherheit hin. Außerdem ergeben sich u.a. Schnittmengen im Hinblick auf die Themen Digitale Kompetenz (Literacy) Surveillance und Umweltschutz.

Dritte Erkenntnis: Wertvolle Einstiegshinweise und Entwicklungspotentiale

Der Textkorpus ist in seiner bisherigen Gestalt zu klein und zu heterogen, sodass sich mit den eingesetzten Verfahren bislang nicht ausreichend präzise Ergebnisse erzielen lassen. Dennoch liefert das Verfahren wertvolle Hinweise auf thematische Schwerpunkte, die von unterschiedlichen gesellschaftlichen und politischen Akteuren im Hinblick auf Digitalisierungsfragen gesetzt werden. Sowohl die Erweiterung der Datengrundlage wie auch die Nachschärfung der Analysewerkzeuge bergen Potenzial für eine zukünftige Neuauflage. Im konstanten Abgleich mit den anderen Bausteinen fügt sich der Ansatz aber schon jetzt produktiv in das Gesamtgefüge der Themenfindung für die CAIS-Forschungsprogramme zur Digitalisierungsforschung.

Die Visualisierung des gesamten Themenfindungsprozesses finden Sie im Video.

Abbildung 2. Übersicht über die 70 häufigsten Begriffe
Abbildung 2. Übersicht über die 70 häufigsten Begriffe