Zum Hauptinhalt springen

TubeWork - Das neue Berufsfeld der YouTuberInnen in Deutschland

Ungleichheit und Selbstökonomisierung in algorithmenbasierten Märkten


Camera and person
Foto: Jodie Cook via Unsplash

Projekt: TubeWork
Fördergeber: DFG
Laufzeit: 2022-2025

 

YouTube gehört aktuell zu den populärsten Internetplattformen der Welt. Auch in Deutschland steht sie stellvertretend für die digitale Transformation der Gesellschaft. Im Forschungsprojekt „TubeWork“ wird die Berufspraxis von YouTuberInnen in den Blick genommen.

Camera and person
Foto: Jodie Cook via Unsplash

Projekteinwerbung: Prof. Dr. Roland Verwiebe und Fr. Dr. Lena Seewann


Ehemalige ProjektmitarbeiterInnen: Marie Theres-Hesse (MA)


Ziele

Das Projekt verfolgt mehrere Themen. Einerseits geht es darum die Selbstwahrnehmung von YouTuberInnen als Berufsgruppe zu untersuchen. Zentrale Fragen dabei sind:

  • Welche Bedeutung geben YouTuberInnen ihrem eignen Handeln auf der Plattform? Wo liegen die Grenzen von Freizeitaktivität und beruflicher Tätigkeit?
  • Welche Chancen, aber auch Hürden, weist dieses neue Berufsfeld auf?
  • Welche Strategien nutzen Menschen, um diese Plattform beruflich nutzen zu können?

 

Andererseits wollen wir Ungleichheitsstrukturen untersuchen, die innerhalb des Berufsfeld der YouTuberInnen entstehen:

  • Welche typischen (Berufs-)Verläufe lassen sich durch die Aktivität auf dieser Plattform identifizieren?
  • Wie wirkt sich der YouTube-Algorithmus (als nicht menschlicher Akteur) auf Sichtbarkeits- und Einkommensungleichheit auf YouTube aus?
  • Wie stark beeinflussen Merkmale wie Alter, Geschlecht, Bildungsstand, Herkunft oder Branche Ungleichheiten auf YouTube?
  • Welche Rolle spielen soziotechnische Skills oder Organisationsformen für die Positionierung auf YouTube?

 

Aktuelle Fragestellungen sind: 

  • Welche inhaltlichen Muster von Sentiment und Diskriminierung lassen sich innerhalb von YT identifizieren? Welche Unterschiede nach sozialstrukturellen Merkmalen (z.B. Geschlecht, Migrationshintergrund) sowie Merkmalen der Social Media Plattform (Branche des YouTube-Kanals, Zahl der Abos, Views und Likes (Reichweite / Erfolg)) bestehen hierbei?
  • Welche individuellen Coping-Strategien entwickeln Content Creators, um mit Sentiment und Diskriminierungspraktiken auf Social Media umzugehen?
  • Wie nehmen Content Creator den Algorithmus von YouTube in ihrer Arbeit war? Inwieweit nehmen Content Creators das algorithmische System von Social-Media-Plattformen als unabhängige Entität wahr, die ihre eigene zugeschriebene Agency hat?

Watchtime-Statistiken für YouTube
Foto: Szabo Viktor via Unsplash

Datenbasis

Im Forschungsprojekt soll eine Reihe von verschiedenen Untersuchungsmethoden genutzt werden:

  • Es wurden zwischen Oktober 2022 und April 2023 30 problemzentrierte Interviews mit Frauen und Männern, die typische YouTube-Branchen repräsentieren und einen YouTube-Kanal zu beruflichen Zwecken betreiben
    • Das Sampling der YouTuber*innen wurde außerdem nach Kanal-Reichweite und Alter und soziodemographischen Merkmalen wie Geschlecht, Alter, Migrationshintergrund und Bildungshintergrund durchgeführt
    • Der Feldzugang entstand über verschiedene Entry-Points um unterschiedliche Teile der YouTube Community zu erreichen
    • Die Interviews wurden per Zoom durchgeführt
  • Mittels Webscraping über die YouTube API wurde eine Totalerhebung der YouTube-Kanäle aus dem D-A-C-H-Raum (Deutschland, Österreich, Schweiz) durchgeführt. Dabei wurden relevante plattformspezifischen Merkmale und Aktivitäten wie die Videofrequenz, Views, Kanalbeschreibungen und die Anzahl der Abonnenten erfasst.
    • Insgesamt beinhaltet der Datensatz Kanalinformationen von 120.000 Kanälen
    • Dies wird um weitere datenintensivere Informationen ergänzt wie die Kommentare unter bestimmten Videos oder den automatisch erstellten Untertiteln unter bestimmten Videos
  • Mithilfe eines selbstkonzipierten Klassifikationssurveys wurden Daten von 5000 zufällig ausgewählten Content Creators aus dem gescrapten Datensatz in Bezug auf die Themen Berufsausübung (Erfolg/Reichweite auf YT, Einkommen, Branche) und zur sozialen Komposition von Content Creators (Alter, Geschlecht, Bildung, Migrationshintergrund)  klassifiziert.  (→  siehe Klassifikationssurvey)
  • Der nächste Schritt wird eine Online-Befragung von ca. 2000 deutschen YouTuberInnen. Ziel ist es Informationen zum beruflichen Alltag, der Arbeitszufriedenheit und zu bestehenden Werthaltungen zu erlangen
Watchtime-Statistiken für YouTube
Foto: Szabo Viktor via Unsplash

Klassifikationssurvey 

Um Variablen zu generieren, die zwar auf der Plattform zu Teilen ersichtlich sind, jedoch nicht gescrapted werden können, wird ein Klassifikationssurvey genutzt. Mithilfe dieses Surveys haben studentische Hilfskräfte systematisch die Charakteristika von 5000 Kanälen klassifiziert (zB. das Geschlecht, das Alter, den Migrationshintergrund aber auch kanalspezifische Merkmale wie die Anzahl der beteiligten Personen, weitere Einkommensquellen wie Patreon oder gesponsorte Videos, und das spezifische Thema des Channels). Das Klassifikationssurvey gibt den Kodierer*innen nacheinander drei Stimuli vor (die Kanalbeschreibung, das letzte Video und zuletzt weitere Quellen wie Wikipedia oder LinkedIn), die dabei helfen, nachzuvollziehen woher einzelne Informationen kommen und erfasst jede Person innerhalb eines Kanals einzeln (siehe Bild).

  • Diese Daten dienen als Erweiterung des gescrapten Datensatzes und erlauben die Analyse  von soziologischen Fragestellungen auf YouTube, die demografische Merkmale  der Kanäle einschließt und damit im deutschsprachigen Raum bisher einzigartig ist.
  • Der nächste Schritt wird die Erweitung dieses Datensatzes mit machine learning Methoden.

Methodik und aktuelle Projekte

Darüber hinaus werden eine Vielzahl von Analysemethoden aus den Bereichen der qualitativen und quantitative Sozialforschung, Mixed-Methods und Computational Social Science verwendet, darunter:

- Eine Themenanalyse (Braun & Clarke, 2012) um der Frage nachzugehen, wie Content Creators den YouTube Algorithmus in ihrer Arbeit wahrnehmen

  • Erste Befunde zeigen die Wahrnehmung des Algorithmus als eigenständige Identität mit Agency und mitunter Konzentrierung auf die vier Themen Unvorhersehbarkeit des Algorithmus, Dynamik des Algorithmus, Macht des Algorithmus und Ungleichheit durch den Algorithmus.

- Eine Typenbildung (Kelle & Kluge 1999) zu Coping und Strategien, die Content Creators entwickeln, um mit Sentiment und Diskriminierungspraktiken auf Social Media umzugehen

  • Erste Befunde (→ siehe Konferenzen)

Dictionary, machine learning (zB. Lasso regression) und deep learning (zB. Bert Algorithmus) Methodiken zur generierung von Variablen wie Geschlecht aber auch Sentiment oder Hate-Speech von YouTube Kommentaren

→ Davon Ausgehend verschiedene Regressions- und Clusteranalysen

  • Erste Befunde ( → siehe Konferenzen & Veröffentlichungen)

Webscraping

Um uns Daten von der Plattform YouTube zugänglich zu machen, greifen wir auf die YouTube Data API zurück. APIs (Application Programming Interfaces) bieten die Möglichkeit, Funktionen der betreffenden Website in eigene Websites oder Apps zu integrieren, indem sie mit verschiedenen Programmiersprachen angesteuert werden können. In unserem Fall nutzen wir Python, um mithilfe der Schnittstelle (API), Daten strukturiert abzurufen und zu speichern. Wir sind somit in der Lage, Informationen zu Kanälen (z. Bsp. Name, Beschreibung, Anzahl Subscriber, Anzahl Videos, Profilbild), Videos (z. Bsp. Aufrufzahlen, Anzahl Likes, Topics) und Kommentaren (z. Bsp. Inhalt, Anzahl Likes, Name des Kanals) zu scrapen. Die dazugehörigen Python-Skripte stellen wir hier zur Verfügung.

 

Hinzukommend wurde der Quelltext der Kanäle ausgelesen, welcher zusätzliche Informationen erhält, die nicht über die YouTube Data API abgerufen werden können.

 

Seit Dezember 2022 werden täglich Daten von den 120.000 Kanälen gescraped, welche sich mittlerweile fast auf 200GB belaufen. Dabei handelt es sich hierbei um Querschnittsdaten, wobei seit November 2023 zusätzlich ein Längsschnittdatensatz für ausgewählte Kanäle und Videos erstellt wird.


Ergebnisse

Konferenzen

  • Philipp, Aaron; Verwiebe, Roland; Weißmann, Sarah (2023): „Sentiment und Diskriminierung auf Social Media? Ein Mixed-Methods-Ansatz zur Untersuchung von Kommunikations- und Debattenstrukturen innerhalb der YouTube-Community“, DGS Sektion "Soziale Ungleichheit und Sozialstrukturanalyse" - Frühjahrstagung 2023
  • Philipp, Aaron; Verwiebe, Roland; Weißmann, Sarah (2023): “Sentiment and hate-speech on social media. An analysis of the relevance of gender and race for the emergence of new communication structures within the YouTube Community”,General Online Research (GOR 23

 

Veröffentlichungen

 

Weiteres


Förderung

Das Projekt ist für den Zeitraum von drei Jahren durch die Deutsche Forschungsgemeinschaft gefördert.


YouTube
Foto: NordWood via Unsplash