TubeWork - Das neue Berufsfeld der YouTuberInnen in Deutschland
Ungleichheit und Selbstökonomisierung in algorithmenbasierten Märkten
Projekt: TubeWork
Fördergeber: DFG
Laufzeit: 2022-2025
YouTube gehört aktuell zu den populärsten Internetplattformen der Welt. Auch in Deutschland steht sie stellvertretend für die digitale Transformation der Gesellschaft. Im Forschungsprojekt „TubeWork“ wird die Berufspraxis von YouTuberInnen in den Blick genommen.
Projektleitung
Wissenschaftliche Mitarbeiter*innen
Claudia Buder (MA)
Projekteinwerbung: Prof. Dr. Roland Verwiebe und Fr. Dr. Lena Seewann
Ehemalige ProjektmitarbeiterInnen: Marie Theres-Hesse (MA)
Ziele
Das Projekt verfolgt mehrere Themen. Einerseits geht es darum die Selbstwahrnehmung von YouTuberInnen als Berufsgruppe zu untersuchen. Zentrale Fragen dabei sind:
- Welche Bedeutung geben YouTuberInnen ihrem eignen Handeln auf der Plattform? Wo liegen die Grenzen von Freizeitaktivität und beruflicher Tätigkeit?
- Welche Chancen, aber auch Hürden, weist dieses neue Berufsfeld auf?
- Welche Strategien nutzen Menschen, um diese Plattform beruflich nutzen zu können?
Andererseits wollen wir Ungleichheitsstrukturen untersuchen, die innerhalb des Berufsfeld der YouTuberInnen entstehen:
- Welche typischen (Berufs-)Verläufe lassen sich durch die Aktivität auf dieser Plattform identifizieren?
- Wie wirkt sich der YouTube-Algorithmus (als nicht menschlicher Akteur) auf Sichtbarkeits- und Einkommensungleichheit auf YouTube aus?
- Wie stark beeinflussen Merkmale wie Alter, Geschlecht, Bildungsstand, Herkunft oder Branche Ungleichheiten auf YouTube?
- Welche Rolle spielen soziotechnische Skills oder Organisationsformen für die Positionierung auf YouTube?
Aktuelle Fragestellungen sind:
- Welche inhaltlichen Muster von Sentiment und Diskriminierung lassen sich innerhalb von YT identifizieren? Welche Unterschiede nach sozialstrukturellen Merkmalen (z.B. Geschlecht, Migrationshintergrund) sowie Merkmalen der Social Media Plattform (Branche des YouTube-Kanals, Zahl der Abos, Views und Likes (Reichweite / Erfolg)) bestehen hierbei?
- Welche individuellen Coping-Strategien entwickeln Content Creators, um mit Sentiment und Diskriminierungspraktiken auf Social Media umzugehen?
- Wie nehmen Content Creator den Algorithmus von YouTube in ihrer Arbeit war? Inwieweit nehmen Content Creators das algorithmische System von Social-Media-Plattformen als unabhängige Entität wahr, die ihre eigene zugeschriebene Agency hat?
- „Lassen sich Einkommensunterschiede auf YouTube auf soziostrukturelle und plattformspezifische Merkmale zurückführen? Was sind die wichtigsten Prädiktoren unter diesen Variablen für den Verdienst von Content Creators auf dieser Plattform?“
- „Wie re-konfiguriert sich für die Berufsgruppe der Content Creators auf YouTube die Ausverhandlung von sozialer Anerkennung?“
Datenbasis
Im Forschungsprojekt soll eine Reihe von verschiedenen Untersuchungsmethoden genutzt werden:
- Es wurden zwischen Oktober 2022 und April 2023 30 problemzentrierte Interviews mit Frauen und Männern, die typische YouTube-Branchen repräsentieren und einen YouTube-Kanal zu beruflichen Zwecken betreiben.
- Das Sampling der YouTuber*innen wurde außerdem nach YouTube-spezifischen Merkmalen wie z. Bsp. der Kanalgröße und soziodemographischen Merkmalen wie Geschlecht, Alter, Migrationshintergrund und Bildungshintergrund durchgeführt.
- Der Feldzugang entstand über verschiedene Entry-Points um unterschiedliche Teile der YouTube Community zu erreichen
- Die Interviews wurden per Zoom durchgeführt
- Mittels Webscraping über die YouTube API wurde eine Totalerhebung der YouTube-Kanäle aus dem D-A-C-H-Raum (Deutschland, Österreich, Schweiz) durchgeführt. Dabei wurden relevante plattformspezifischen Merkmale und Aktivitäten wie die Videofrequenz, Views, Kanalbeschreibungen und die Anzahl der Abonnenten erfasst.
- Insgesamt beinhaltet der Datensatz Kanalinformationen von 120.000 Kanälen
- Dies wird um weitere datenintensivere Informationen ergänzt wie die Kommentare unter bestimmten Videos oder den automatisch erstellten Untertiteln unter bestimmten Videos
- Mithilfe eines selbstkonzipierten Klassifikationssurveys wurden Daten von 5000 zufällig ausgewählten Content Creators aus dem gescrapten Datensatz in Bezug auf die Themen Berufsausübung (Erfolg/Reichweite auf YT, Einkommen, Branche) und zur sozialen Komposition von Content Creators (Alter, Geschlecht, Bildung, Migrationshintergrund) klassifiziert. (→ siehe Klassifikationssurvey)
- Aktuell läuft eine Online-Befragung von ca. 15.000 deutschen YouTuberInnen. Ziel ist es, Informationen zum beruflichen Alltag, der Arbeitszufriedenheit und zu bestehenden Werthaltungen zu erlangen.
Klassifikationssurvey
Um Variablen zu generieren, die zwar auf der Plattform zu Teilen ersichtlich sind, jedoch nicht gescrapted werden können, wird ein Klassifikationssurvey genutzt. Mithilfe dieses Surveys haben studentische Hilfskräfte systematisch die Charakteristika von 5000 Kanälen klassifiziert (zB. das Geschlecht, das Alter, den Migrationshintergrund aber auch kanalspezifische Merkmale wie die Anzahl der beteiligten Personen, weitere Einkommensquellen wie Patreon oder gesponsorte Videos, und das spezifische Thema des Channels). Das Klassifikationssurvey gibt den Kodierer*innen nacheinander drei Stimuli vor (die Kanalbeschreibung, das letzte Video und zuletzt weitere Quellen wie Wikipedia oder LinkedIn), die dabei helfen, nachzuvollziehen woher einzelne Informationen kommen und erfasst jede Person innerhalb eines Kanals einzeln (siehe Bild).
- Diese Daten dienen als Erweiterung des gescrapten Datensatzes und erlauben die Analyse von soziologischen Fragestellungen auf YouTube, die demografische Merkmale der Kanäle einschließt und damit im deutschsprachigen Raum bisher einzigartig ist.
- In einem weiteren Schritt wird der Datensatz um eigens generierte Variablen wie z. Bsp. dem allgemeinen Sentiment in den Kommentaren, dem Anteil von Hate Speech oder der Community-Stärke ergänzt.
Methodik und aktuelle Projekte
Methodik und aktuelle Projekte
Darüber hinaus werden eine Vielzahl von Analysemethoden aus den Bereichen der qualitativen und quantitative Sozialforschung, Mixed-Methods und Computational Social Science verwendet. Mithilfe einer Themenanalyse (Braun & Clarke, 2012) wurde der Frage nachgegangen, wie Content Creators den YouTube Algorithmus in ihrer Arbeit wahrnehmen. Die Befunde zeigen, dass dieser als intransparent und unvorhersehbar gesehen wird, ihm absichtsvolles handeln und anthropomorphe Eigenschaften zugeschrieben werden, über Metriken kommuniziert und durch seine Macht Ungleichheiten verstärkt.
Eine qualitative Inhaltsanalyse (Kuckartz 2012) zu Copingstrategien von Content Creators auf Online Aggressions hat gezeigt, dass Kommentare selten gelöscht werden oder über Filter dagegen vorgegangen wird, sondern sich eher konkret mit diesen auseinandergesetzt wird. Zudem wird kaum auf externe Hilfe zurückgegriffen, sondern eigenständig auf diese reagiert.
Durch Machine-Learning Algorithmen (z. Bsp. XGBoost) und Deep Learning (z. Bsp. BERT) wurde das Sentiment und der Anteil von Hate-Speech in 40 Millionen YouTube Kommentaren berechnet. Im Gegensatz zu bestehenden Studien zeigen unsere Ergebnisse, dass weibliche Content Creator mit weniger Negativität, weniger beleidigender Sprache und weniger Hate Speech konfrontiert sind. Insbesondere zeigt unsere Analyse, dass BIPoC, die als CCs arbeiten, zwar deutlich mehr negatives Sentiment erhalten, aber nicht mit mehr beleidigenden Kommentaren oder Hassreden konfrontiert sind. Darüber hinaus spielen auch Plattformmerkmale eine entscheidende Rolle, da Kanäle, die sich auf Verschwörungstheorien oder Politik konzentrieren, häufiger mit Negativität und Hate Speech konfrontiert werden.
Webscraping
Um uns Daten von der Plattform YouTube zugänglich zu machen, greifen wir auf die YouTube Data API zurück. APIs (Application Programming Interfaces) bieten die Möglichkeit, Funktionen der betreffenden Website in eigene Websites oder Apps zu integrieren, indem sie mit verschiedenen Programmiersprachen angesteuert werden können. In unserem Fall nutzen wir Python, um mithilfe der Schnittstelle (API), Daten strukturiert abzurufen und zu speichern. Wir sind somit in der Lage, Informationen zu Kanälen (z. Bsp. Name, Beschreibung, Anzahl Subscriber, Anzahl Videos, Profilbild), Videos (z. Bsp. Aufrufzahlen, Anzahl Likes, Topics) und Kommentaren (z. Bsp. Inhalt, Anzahl Likes, Name des Kanals) zu scrapen. Die dazugehörigen Python-Skripte stellen wir hier zur Verfügung.
Hinzukommend wurde der Quelltext der Kanäle ausgelesen, welcher zusätzliche Informationen erhält, die nicht über die YouTube Data API abgerufen werden können.
Seit Dezember 2022 werden täglich Daten von den 120.000 Kanälen gescraped, welche sich mittlerweile fast auf 200GB belaufen. Dabei handelt es sich hierbei um Querschnittsdaten, wobei seit November 2023 zusätzlich ein Längsschnittdatensatz für ausgewählte Kanäle und Videos erstellt wird.
Ergebnisse
Konferenzen
- Weißmann, Verwiebe, Buder, Osorio-Krauter, Philipp (2024): „Content Creators on YouTube. Unveiling negativity, offensive language and hate speech”, 16th European Sociological Association Conference, Porto
- Weißmann, Verwiebe, Buder, Osorio-Krauter, Philipp (2024): „The algorithm is like a mercurial god – Exploring content creators' perception of algorithmic agency on YouTube”, 16th European Sociological Association Conference, Porto
- Weißmann, Verwiebe, Philipp (2024): „Unveiling negativity, offensive language and hate speech”, 30th International Conference for Europeanists, Lyon
- Verwiebe, Philipp, Weißmann, Osorio-Krauter, Fritsch (2024): “Exploring inequality of earnings on YouTube”, RC28 Spring Meeting, Shanghai
- Weißmann, Verwiebe, Philipp (2024): „Unveiling negativity, offensive language and hate speech”, Human Tech Transition (ICA regional conference), Warschau
- Philipp, Aaron; Verwiebe, Roland; Weißmann, Sarah (2023): „Sentiment und Diskriminierung auf Social Media? Ein Mixed-Methods-Ansatz zur Untersuchung von Kommunikations- und Debattenstrukturen innerhalb der YouTube-Community“, DGS Sektion "Soziale Ungleichheit und Sozialstrukturanalyse" - Frühjahrstagung 2023
- Philipp, Aaron; Verwiebe, Roland; Weißmann, Sarah (2023): “Sentiment and hate-speech on social media. An analysis of the relevance of gender and race for the emergence of new communication structures within the YouTube Community”,General Online Research (GOR 23)
Veröffentlichungen
- Verwiebe, R., Buder, C., Philipp, A., Weißmann, S., Osorio Krauter, C.: “The algorithm is like a mercurial god”: Exploring content creators’ perception of algorithmic agency on YouTube. 2024. https://journals.sagepub.com/doi/abs/10.1177/14614448241307931
- Seewann L, Verwiebe R, Buder C, Fritsch NS. "Broadcast your gender." A comparison of four text-based classification methods of German YouTube channels. Front Big Data. 2022 Sep 14;5:908636. doi: 10.3389/fdata.2022.908636
Weiteres
- Die Phython-Skripte finden Sie hier über GitHub, um eigene Daten wie Kanalinformationen, Videoinformationen und Kommentare mithilfe der YouTube API zu extrahieren.
- Artikel über das Forschungsprojekt in dem „Portal Wissen. Das Forschungsmagazin der Universität Potsdam“ 01/2023