Datenjournalismus

10907

Wortherkunft: Der Begriff Datenjournalismus (engl. data journalism) ist ein Kompositum aus ‚Daten‘ (Plural von Datum, lat. das Gegebene) und ‚Journalismus‘. Er entstammt der journalistischen Praxis (Coddington 2015: 334) und wird mitunter auch als datengetriebener Journalismus bezeichnet. Letzteres leitet sich vom englischen ,data-driven journalism‘ ab.

Definition:
In der Praxis wird Datenjournalismus oft als die journalistische Aufbereitung von quantitativen Daten zu Informationen, die für die → Öffentlichkeit relevant sind, verstanden (Lorenz 2014; Stray 2011; vgl. auch Lowrey/Broussard/Sherrill 2019: 69). Dies umfasst etwa die Interpretation, Einordnung oder Visualisierung von Daten, die beispielsweise in Form von zugespielten Dokumenten, eigenen oder in Studien erhobenen Messungen vorliegen.

Neben diesem anwendungsorientierten Verständnis betonen wissenschaftliche Definitionen die Interdisziplinarität, an der Datenjournalismus entsteht. Genannt werden insbesondere die Schnittstellen im Dreieck zwischen Journalismus, Informatik und Design, aber auch in der Verbindung zwischen Journalismus, empirischer Sozialwissenschaft, Statistik, Visualisierung und Webdesign (Coddington 2015; Gynnild 2014; Parasie/Dagiral 2013).

Als solches Konstrukt lässt sich der Datenjournalismus ferner unter dem Dach des ,Computational Journalism‘ verorten. Den Computational Journalism definieren Diakopoulos und Koliska (2017: 810) als „finding, telling and dissemination of news stories with, by, or about algorithms“; zu ihm zählen auch der automatisierte Journalismus (→ Roboterjournalismus) sowie die moderne Publikumsforschung (Haim 2019). Der Datenjournalismus wird nicht zuletzt auf die Möglichkeiten der Datenverarbeitung und multimedialen Aufbereitung im Internet zurückgeführt (→ Multimediales Storytelling). Entsprechend weisen datenjournalistische Weiterbildungen (→ Weiterbildung im Journalismus) häufig einen methodischen Fokus auf (Baack 2018: 682), vermitteln also die Handhabung großer Datenmengen, die schnelle Visualisierung gängiger Datenformate oder den Umgang mit Geo-Daten.

Geschichte:
Der Datenjournalismus wird häufig als Nachfolger des ‚computer-assisted reporting‘ (CAR) beschrieben (Zamith 2019a). Diese journalistische Bewegung findet ihren Ursprung im ‚precision journalism‘ (Meyer 1973), der sich in den 1970er Jahren in den USA etablierte. Ziel beider Bewegungen war es, sozialwissenschaftliche Methoden der Datenerhebung und statistischen Auswertung zu übernehmen, um den Journalismus wissenschaftlicher und faktenbasierter – mithin auch investigativer (Parasie/Dagiral 2013) – zu machen (Coddington 2015). Als zentrale Institution dafür hat sich bereits 1975 die US-Nichtregierungsorganisation ‚National Institute for Computer-Assisted Reporting‘ (NICAR) gebildet, die bis heute Foren, Leitlinien, Workshops und Konferenzen zum Thema bereitstellt.

Der moderne Datenjournalismus gewinnt indes seit dem Aufkommen des sogenannten → ,Web 2.0‘, also seit Beginn der 2000er Jahre, an Bedeutung (Zamith 2019a). Die Verbreitung von leistungsstarken Endgeräten, eine entsprechende Bandbreite sowie die Möglichkeiten der Interaktivität machten Infografiken und Geo-Daten, statistische Analysen und datenlastige Recherchen salonfähig.

Neben dieser technikdeterministischen Perspektive – also dem, was der Journalismus tun ‚kann‘ – ist in der Gesellschaft auch ein zunehmendes Datenbewusstsein gegenüber dem Journalismus – also dem, was der Journalismus tun ‚soll‘ – zu beobachten (Hammond 2017). So erlaubt die Digitalisierung einerseits Einblicke in gesellschaftliche Prozesse mit bislang ungekannter Detailtiefe, digitale Spuren und ,big data‘ sollen langfristig zu einem besseren Miteinander beitragen (z. B. in der Medizin, der modernen Städteplanung oder der politischen Entscheidungsfindung). Andererseits steckt in großen Datenmengen nur eine suggerierte Objektivität; algorithmische Verzerrungen und eine eingeschränkte Privatsphäre sind regelmäßig Thema des öffentlichen Diskurses (Boyd/Crawford 2012).

Vor diesem Hintergrund beschreibt Anderson (2018) die Entwicklung des Datenjournalismus auch als Reaktion auf ein geringes Vertrauen in den Journalismus: Konfrontiert mit Zweifeln an der eigenen Glaubwürdigkeit, versucht sich der Journalismus mit Zahlen und Fakten, mithin mit mehr empirischer Evidenz, gegen diesen Vorwurf zu wehren. Allerdings zeigt Anderson (ebd.) an historischen Vergleichen, dass ein solches Vorgehen die Angriffsfläche auch vergrößern kann, Zweifelnden also durch mehr Zahlen auch Anlass für weitere Zweifel bietet.

Gegenwärtiger Zustand:
War der Datenjournalismus anfangs eine Art bunte Spielwiese, so hat er sich mit Blick in die Redaktionen etwa seit 2010 deutlich institutionalisiert: Seither setzen einige Redaktionen auf die schnelle Integration von Diagrammen und Infografiken in die tägliche Beitragsproduktion, während andere Redaktionen eigene Ressorts geschaffen haben, die sich verstärkt um die Recherche und Analyse von Daten kümmern. Welchen Weg eine Redaktion wählt, ist dabei auch Teil der Strategie einer jeden Medienorganisation (vgl. Haim 2019: 251ff.), etwa im Rahmen der → Suchmaschinenoptimierung, für die datenjournalistische Inhalte Alleinstellungsmerkmale darstellen.

Die schnelle Datenintegration wird vielerorts von Journalisten selbst übernommen. Dafür haben sich Tools etabliert, die ohne große technologische Hürde die Visualisierung von Daten erlauben (z.B. Datawrapper, Infogram, Mapbox). Dem daraus erwachsenen Ruf nach veränderten Curricula in der → Journalismusausbildung (z.B. Hewett 2016; Donsbach 2014) sind mehrere Ausbildungsstätten gefolgt, so dass etwa in Dortmund und Leipzig eigene Studiengänge mit datenjournalistischen Schwerpunkten und an anderen Standorten (z.B. Hamburg, Mainz, München) regelmäßig entsprechende Seminare angeboten werden (Splendore et al. 2016).

Eigene Ressorts zur Datenverarbeitung haben etwa die öffentlich-rechtlichen Anstalten BR, MDR und WDR, überregionale Redaktionen wie der Spiegel, die Süddeutsche Zeitung und ZEIT online, aber auch vereinzelt regionale Angebote wie die Berliner Morgenpost etabliert. Die dabei entstehenden Projekte gehen in vielen Fällen über reine Visualisierungen hinaus und umfassen etwa die Organisation von eingereichten Daten durch Nutzer (sog. „Crowdsourcing“; Aitamurto 2016), die Verarbeitung großer Datenmengen im Rahmen von Investigativteams oder die Entwicklung von datengetriebenen Spielen mit Informationsgehalt (→ Newsgames; Ferrer-Conill 2018).

Trotz dieser Vielfalt und Institutionalisierung des Datenjournalismus lässt sich heute nur bedingt von einem flächendeckend professionalisierten Bereich sprechen: Zu experimentell ist vielerorts der Umgang mit Visualisierungen, zu wenig Normen haben sich bislang zur Datenqualität und dem Umgang mit Quellen etabliert, zu viel Kompetenz in den Redaktionen hängt noch an ausgewählten Individuen (Zamith 2019b).

Forschungsstand:
Die Forschung um den Datenjournalismus lässt sich grob in eine soziologisch und eine kommunikationswissenschaftlich geprägte Strömung aufteilen.

Aus soziologischer Perspektive beschäftigen sich mehrere Autoren mit der Frage nach dem professionellen Hintergrund verschiedener Redaktionsmitglieder und dem Zusammenspiel zwischen journalistischen und nicht-journalistischen Akteuren (insb. Holton/Belair-Gagnon 2018; Lewis/Usher 2016; Lewis/Westlund 2014). Hierbei wird nicht-journalistischen Akteuren häufig ein großes Datenverständnis attestiert, das sie von journalistischen Akteuren unterscheidet, ihnen aber gleichzeitig prägenden Einfluss auf journalistische Produkte zuspricht (Baack 2018; Cheruiyot/Ferrer-Conill 2018; Appelgren 2016).

Aus kommunikationswissenschaftlicher Perspektive dreht sich die Forschung vor allem um den Umgang mit journalistischen Normen und Werten. Dabei zeigt sich, dass Fragen der Praktikabilität und Realisierbarkeit im datenjournalistischen Alltag meist eine größere Rolle spielen als Fragen nach journalistischen Grundsätzen (Appelgren 2016; Fink/Anderson 2015). So finden Lowrey et al. (2019) nach qualitativen Leitfadeninterviews mit Datenjournalisten in den USA, dass diese zwar auf die Glaubwürdigkeit von Datenquellen achten, präsentierte Werte, Variablen oder Kategorien aus Mangel an Transparenz und Verständnis aber kaum hinterfragen.

Tandoc und Oh (2017) berichten von 260 analysierten Datenprojekten des britischen Guardian, dass die Verfügbarkeit von Daten bisweilen die Themensetzung beeinflusst, dass aber auf journalistische Grundsätze wie die Trennung von Information und Meinung oder die Nennung von Quellen weiterhin Wert gelegt wird. Craig et al. (2017) verweisen schließlich auf die Foren des NICAR, in denen Datenjournalisten ethische Aspekte vereinzelter Veröffentlichungen diskutieren (die Autoren untersuchten das Thema Waffenbesitz) und dabei auch maßgeblich zur Entwicklung und Umsetzung datenjournalistischer Werte beitragen.

Literatur:

Aitamurto, Tanja: Crowdsourcing as a knowledge-search method in digital journalism. In: Digital Journalism, 4(2), 2016, S. 280-297. https://doi.org/10.1080/21670811.2015.1034807

Anderson, Christopher W.: Apostles of Certainty: Data journalism and the politics of doubt. Oxford/New York [University Press] 2018.

Appelgren, Ester: Data Journalists Using Facebook. In: Nordicom Review, 37(1), 2016, S. 156-159. https://doi.org/10.1515/nor-2016-0007

Baack, Stefan: Practically engaged. The entanglements between data journalism and civic tech. In: Digital Journalism, 6(6), 2018, S. 673-692. https://doi.org/10.1080/21670811.2017.1375382

Boyd, Danah; Kate Crawford: Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon. In: Information, Communication & Society, 15(5), 2012, S. 662-679. https://doi.org/10.1080/1369118X.2012.678878

Cheruiyot, David; Raul Ferrer-Conill: „Fact-checking Africa“ Epistemologies, data and the expansion of journalistic discourse. In: Digital Journalism, 6(8), 2018, S. 964-975. https://doi.org/10.1080/21670811.2018.1493940

Coddington, Mark: Clarifying journalism’s quantitative turn. In: Digital Journalism, 3(3), 2015, S. 331-348. https://doi.org/10.1080/21670811.2014.976400

Craig, David; Stan Ketterer; Mohammad Yousuf: To Post or Not to Post: Online discussion of gun permit mapping and the development of ethical standards in data journalism. In: Journalism & Mass Communication Quarterly, 94(1), 2017, S. 168-188. https://doi.org/10.1177/1077699016684796

Diakopoulos, Nicholas; Michael Koliska: Algorithmic transparency in the news media. In: Digital Journalism, 5(7), 2017, S. 809-828. https://doi.org/10.1080/21670811.2016.1208053

Donsbach, Wolfgang: Journalism as the new knowledge profession and consequences for journalism education. In: Journalism, 15(6), 2014, S. 661-677. https://doi.org/10.1177/1464884913491347

Ferrer-Conill, Raul: Gamifying the news: Exploring the introduction of game elements into digital journalism. Karlstad [Karlstads universitet] 2018.

Fink, Katherine; Christopher W. Anderson: Data journalism in the United States. In: Journalism Studies, 16(4), 2015, S. 467-481. https://doi.org/10.1080/1461670X.2014.939852

Gynnild, Astrid: Journalism innovation leads to innovation journalism: The impact of computational exploration on changing mindsets. In: Journalism, 15(6), 2014, S. 713-730. https://doi.org/10.1177/1464884913486393

Haim, Mario: Die Orientierung von Online-Journalismus an seinen Publika: Anforderung, Antizipation, Anspruch. Wiesbaden [VS Verlag für Sozialwissenschaften] 2019. https://doi.org/10.1007/978-3-658-25546-6

Hammond, Philip: From computer-assisted to data-driven: Journalism and Big Data. In: Journalism, 18(4), 2017, S. 408-424. https://doi.org/10.1177/1464884915620205

Hewett, Jonathan: Learning to teach data journalism: Innovation, influence and constraints. In: Journalism, 17(1), 2016, S. 119-137. https://doi.org/10.1177/1464884915612681

Holton, Avery E.; Valerie Belair-Gagnon: Strangers to the Game? Interlopers, intralopers, and shifting news production. In: Media and Communication, 6(4), 2018, S. 70. https://doi.org/10.17645/mac.v6i4.1490

Lewis, Seth C.; Nikki Usher: Trading zones, boundary objects, and the pursuit of news innovation: A case study of journalists and programmers. In: Convergence, 22(5), 2016, S. 543-560. https://doi.org/10.1177/1354856515623865

Lewis, Seth C.; Oscar Westlund: Actors, actants, audiences, and activities in cross-media news work: A matrix and a research agenda. In: Digital Journalism, 3(1), 2015, S. 19-37. https://doi.org/10.1080/21670811.2014.927986

Lorenz, Mirko: Was (genau) ist „data-driven journalism“? Vortrag auf dem Rhein-Zeitung Volontärs-Workshop, 11.02.2014. https://de.slideshare.net/mirkolorenz/1-ddj-was-ist-datenjournalismus

Lowrey, Wilson; Ryan Broussard; Lindsey A. Sherrill: Data journalism and black-boxed data sets. In: Newspaper Research Journal, 40(1), 2019, S. 69-82. https://doi.org/10.1177/0739532918814451

Meyer, Philip: Precision journalism: A reporter’s introduction to social science methods. Bloomington [Indiana University Press] 1973.

Parasie, Sylvain; Eric Dagiral: Data-driven journalism and the public good: „Computer-assisted-reporters“ and „programmer-journalists“ in Chicago. In: New Media & Society, 15(6), 2013, S. 853-871. https://doi.org/10.1177/1461444812463345

Splendore, Sergio; Philip Di Salvo; Tobias Eberwein; Harmen Groenhart; Michal Kus; Colin Porlezza: Educational strategies in data journalism: A comparative study of six European countries. In: Journalism, 17(1), 2016, S. 138-152. https://doi.org/10.1177/1464884915612683

Stray, Jonathan: A computational journalism reading list. In: jonathanstray.com, 31.01.2011. http://jonathanstray.com/a-computational-journalism-reading-list (abgerufen am 22.07.2019)

Tandoc Jr., Edson C.; Soo-Kwang Oh: Small departures, big continuities? Norms, values, and routines in The Guardian’s big data journalism. In: Journalism Studies, 18(8), 2017, S. 997-1015. https://doi.org/10.1080/1461670X.2015.1104260

Zamith, Rodrigo: Algorithms and Journalism. In: Oxford Research Encyclopedia of Communication, 2019a. https://doi.org/10.1093/acrefore/9780190228613.013.779

Zamith, Rodrigo: Transparency, interactivity, diversity, and information provenance in everyday data journalism. In: Digital Journalism, 7(4), 2019b, S. 470-489. https://doi.org/10.1080/21670811.2018.1554409

Vorheriger ArtikelGrubenhund
Nächster ArtikelKonstruktiver Journalismus
Mario Haim
*1987, Prof. Dr., ist Professor am Institut für Kommunikationswissenschaft und Medienforschung an der Ludwig-Maximilians-Universität München. Zuvor studierte, lehrte und forschte er an den Universitäten Augsburg, Helsinki, Stavanger und Leipzig. Arbeitsschwerpunkte: Computational Journalism, algorithmische Informationsumgebungen und Methodenforschung.