ein standardprozess für den datenjournalismus?annabehrend.de/bachelorarbeit_behrend_ddj.pdf ·...
Post on 05-Sep-2020
3 Views
Preview:
TRANSCRIPT
Ein Standardprozess für den Datenjournalismus?
Journalistische Arbeitsweisen und
Data-Mining-Standardprozess im Vergleich
Bachelorarbeit im Fach Wissenschaftsjournalismus
vorgelegt beim Prüfungsausschuss des Instituts für Journalistik
Fakultät Kulturwissenschaften, Technische Universität Dortmund
Erstgutachter: Prof. Holger Wormer Zweitgutachter: Prof. Dr. Claus Weihs
Eingereicht von Anna Behrend
Matrikelnummer: 117385 Studiengang: Wissenschaftsjournalismus
Nebenfach: Physik
am 23.08.2013
2
Inhaltsverzeichnis
1 Einleitung ............................................................................................................... 5
1.1 Motivation ............................................................................................................. 5
1.2 Ziel dieser Arbeit .................................................................................................. 6
1.3 Forschungsstandrekonstruktion ........................................................................... 7
2 Theoretische Erschließung des Forschungsfeldes .......................................... 8
2.1 Begriffsdefinitionen .............................................................................................. 8 2.1.1 Arbeitsprozess, Arbeitsschritt und Handlung ................................................ 8 2.1.2 Daten ............................................................................................................. 9 2.1.3 Journalismus ............................................................................................... 10 2.1.4 Journalistische Recherche .......................................................................... 11 2.1.5 Wissenschaft ............................................................................................... 12 2.1.6 Statistik ........................................................................................................ 13 2.1.7 Data-Mining und Wissensentdeckung in Datenbanken ............................... 14 2.1.8 Datenjournalismus ...................................................................................... 16
2.2 Qualitätskriterien ................................................................................................ 23 2.2.1 Journalismus ............................................................................................... 23 2.2.2 Wissenschaft ............................................................................................... 25 2.2.3 Vergleich der Qualitätskriterien ................................................................... 27 2.2.4 Datenjournalismus ...................................................................................... 28
2.3 Arbeitsprozesse ................................................................................................. 31 2.3.1 Journalistischer Rechercheprozess ............................................................ 31 2.3.2 CRISP-DM: Ein Standardprozess für Data-Mining ...................................... 35 2.3.3 Datenjournalistischer Arbeitsprozess .......................................................... 41
2.4 Arbeitsweisen im Vergleich ................................................................................ 45 2.4.1 Datenjournalismus und herkömmliche journalistische Recherche .............. 45 2.4.2 Datenjournalistischer Arbeitsprozess und CRISP-DM ................................ 47
3 Forschungsfragen .............................................................................................. 49
4 Entwicklung der empirischen Methode ............................................................ 51
4.1 Das teilstandardisierte Experteninterview .......................................................... 51
4.2 Leitfragen und Operationalisierung .................................................................... 52
4.3 Entwicklung des Interviewleitfadens .................................................................. 54
4.4 Die Stichprobe .................................................................................................... 55 4.4.1 Wer ist ein Experte? .................................................................................... 55 4.4.2 Auswahl der Experten ................................................................................. 56
3
5 Durchführung der empirischen Erhebung ....................................................... 57
5.1 Regeln bei der Durchführung von teilstandardisierten Experteninterviews ........ 57
5.2 Ablauf der Befragungen ..................................................................................... 57
5.3 Vorgehensweise bei der Auswertung ................................................................ 58 5.3.1 Transkription ............................................................................................... 58 5.3.2 Extraktion .................................................................................................... 59
6 Ergebnisse der empirischen Erhebung ........................................................... 60
6.1 Der datenjournalistische Arbeitsprozess ............................................................ 60
6.2 Verhältnis von datenjournalistischer und herkömmlicher Recherche ................ 62
6.3 CRISP-DM und der datenjournalistische Arbeitsprozess ................................... 63
6.4 Fazit zu CRISP-DM-Vergleich und Einschätzung der Experten ........................ 67
7 Diskussion der Gesamtergebnisse und Ausblick ........................................... 68
7.1 Arbeitsweisen zwischen herkömmlicher Recherche und CRISP-DM ................ 68
7.2 Ansprüche an datenjournalistische Arbeitsweisen ............................................. 70
7.3 CRISP-DM als Leitlinien-Vorlage ....................................................................... 71
7.4 Reflexion des Forschungsprozesses ................................................................. 73
7.5 Fazit ................................................................................................................... 75
7.6 Ausblick und Forschungsdesiderate .................................................................. 76
8 Bibliographie ....................................................................................................... 77
Anhang I. Tabelle der Definitionskriterien ................................................................... i
Anhang II. Skizzen: Datenjournalistischer Arbeitsprozess und CRISP-DM ............... ii
Anhang III. Interviewleitfaden ..................................................................................... v
Anhang IV. Erläuterungen zu den Interviewfragen ................................................. viii
Anhang V. Fragebogen zu beruflichen Angaben ...................................................... xi
Anhang VI. CRISP-DM-Übersicht ............................................................................ xii
Anhang VII. Potentielle Interviewpartner ................................................................. xiii
Anhang IX. Regeln der Interviewführung nach Gläser und Laudel ......................... xiv
4
Anhang X. Häufige Fehler im Umgang mit Daten .................................................... xv
Anhang XI. Qualitätskriterien der amtlichen Statistik ............................................. xviii
Anhang XII. Hilfreiche Quellen für die Erstellung einer Leitlinie ............................... xx
5
1 Einleitung
„Data journalist. Computer-assisted reporter. Newsroom developer. Journo-geek. If those of
us who work in the field aren’t quite sure what to call ourselves, it’s little wonder that
sometimes even the people who work beside us are puzzled by what we do.“ 1 Troy Thibodeaux
1.1 Motivation
Seit einigen Jahren geistert das Schlagwort „Datenjournalismus“ durch die deutsche
Medienlandschaft. Was Datenjournalismus genau ist, bleibt umstritten. Viele
Definitionsversuche drehen sich um den Kernaspekt „Geschichten in Daten finden und diese
erzählen“. Seine Verfechter sind der Ansicht, dass Datenjournalismus die angemessene
Reaktion auf die ständig wachsende Datenflut in unserer Gesellschaft darstellt. Nur durch die
eigene Analyse von Daten sei es Journalisten auch in Zukunft möglich, Sachverhalte kritisch
zu hinterfragen, statt Vorgesetztem hinterherzuhecheln. Andere sehen in ihm nur eine Nische
für programmier-affine Journalisten-Nerds oder bestreiten, dass es sich überhaupt um ein
neues Phänomen handelt. Wie auch immer Datenjournalismus zu definieren und einzuordnen
ist: In deutschen Redaktionen gibt es eine Community von Journalisten, die auf diesem Gebiet
tagtäglich arbeitet. Es handelt sich also um ein real existierendes Phänomen, das jedoch bisher
weitestgehend unerforscht ist.
Dementsprechend gibt es eine Vielzahl bisher unbeantworteter Fragen: Sind Datenjournalisten,
da sie eigene Ergebnisse aus Daten extrahieren, eigentlich noch Journalisten oder eher kleine
„Feuerwehrforscher“ 2 ? Und wenn sie Forscher sind, müssten sie dann nicht auch
wissenschaftlichen Qualitätskriterien genügen? Könnten sie das überhaupt in Anbetracht der
stark unterschiedlichen Arbeitsbedingungen in Journalismus und Wissenschaft?
1 THIBODEAUX, Troy: 5 tips for getting started in data journalism. (06.10.2011) http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-in-data-journalism/ [abgerufen am 22.04.2013]. 2 ZEH, Jürgen: Journalismus als Präzisionsjournalismus. Sozialwissenschaftliche Methodenlehre in der Journalistenausbildung. In: WILKE, Jürgen (Hrsg.): Zwischenbilanz der Journalistenausbildung. München, 1987, S. 145–166, hier S. 147; vgl. auch LEßMÖLLMANN, Annette: Datenjournalismus: Chance für den Journalismus von morgen. (2012) http://www.halem-verlag.de/2012/datenjournalismus-chance-fur-den-journalismus-von-morgen/ [abgerufen am 17.04.2013].
6
Hinter diesen Fragen verbirgt sich eine übergeordnete Thematik: Wie arbeiten
Datenjournalisten und wie sollten sie arbeiten? Um diese extrem weite Fragestellung für den
Rahmen einer Bachelorarbeit fassbar zu machen, wird ein spezieller Ansatz gewählt: Der
datenjournalistische Arbeitsprozess wird mit einem Standardprozess für Data-Mining
verglichen. Als roter Faden wird dabei die Leitfrage verfolgt, ob dieser Standardprozess als
Vorlage für eine datenjournalistische Leitlinie geeignet ist. Diese Leitfrage enthält die
übergeordnete Thematik und gibt ihr gleichzeitig eine konkrete Form.
Unter einer Leitlinie wird in dieser Arbeit eine Handlungsempfehlung verstanden, die als
Orientierungshilfe dient und bei Befolgung dazu führt, dass bestimmte Qualitätskriterien
eingehalten werden. Um eine Orientierungshilfe geben zu können, müssen die typischen
Arbeitsabläufe bekannt sein. Hier findet sich demnach die Frage wieder, wie
Datenjournalisten arbeiten. Um zu beurteilen, ob eine Leitlinie sinnvoll ist, muss außerdem
geklärt sein, welche Qualitätskriterien gelten, also wie Datenjournalisten arbeiten sollten. Da
Datenanalyse sehr stark mit Wissenschaft assoziiert ist, muss für die Klärung der
Qualitätskriterien auch die Beziehung von Wissenschaft und Datenjournalismus reflektiert
werden. Somit schließt sich der Bogen zu den Ausgangsfragen, in denen diese Beziehung eine
wichtige Rolle spielt.
1.2 Ziel dieser Arbeit Ziel dieser Arbeit ist es herauszufinden, ob sich CRISP-DM als Ausgangspunkt für eine
datenjournalistische Best-Practice-Leitlinie eignet. Als Maß für die Eignung wird zum einen
die Ähnlichkeit von CRISP-DM und datenjournalistischem Arbeitsprozess betrachtet. Zum
anderen wird diskutiert, inwiefern CRISP-DM zur Erreichung datenjournalistischer
Qualitätskriterien beitragen kann. Durch Interviews mit erfahrenen Datenjournalisten werden
auch praktische Aspekte aus dem Arbeitsalltag in die Beurteilung der Eignung mit einbezogen.
Durch Literaturstudium werden im Theorieteil der Arbeit die Gemeinsamkeiten und
Unterschiede von datenjournalistischer Arbeitsweise und CRISP-DM herausgearbeitet.
Außerdem werden datenjournalistische Qualitätskriterien aus den Kriterien für Journalismus
und Wissenschaft abgeleitet. Durch die Ergebnisse der Experteninterviews werden im
empirischen Teil die Kenntnisse über Gemeinsamkeiten und Unterschiede von CRISP-DM
und datenjournalistischem Arbeitsprozess erweitert. Anschließend wird die Eignung von
7
CRISP-DM als Anhaltspunkt für eine Leitlinie mit Blick auf die theoretischen Überlegungen
sowie Einschätzungen der befragten Datenjournalisten diskutiert.
1.3 Forschungsstandrekonstruktion Soweit der Autorin nach ausführlicher Recherche bekannt ist, gibt es bisher kaum groß
angelegte Forschungsarbeiten zum Thema Datenjournalismus. Eines der wenigen größeren
Projekte wurde vom Zentrum für Journalismus und Kommunikationsmanagement (JoKom)
der Donau-Universität Krems durchgeführt. Insgesamt 1022 Journalistinnen und Journalisten
aus Deutschland, Österreich und der Schweiz wurden gefragt, wie sie mit Daten arbeiten und
wie sie das Potential von Daten für den Journalismus einschätzen.3 Aitamurto, Sirkkunen und
Lehtonen untersuchen in ihrer Studie für das Finnish Strategic Centre for Science, Technology
and Innovation in the field of ICT die Situation des Datenjournalismus in verschiedenen
Ländern mittels Literaturstudium und Experteninterviews. Dabei gehen sie auch auf den
datenjournalistischen Workflow sowie Best Practices ein.4 Das European Journalism Center in
Kooperation mit dem Datenjournalisten Mirko Lorenz untersucht derzeit in einer Online-
Umfrage, wie ein Curriculum für datenjournalistische Trainings aussehen sollte.5
Neben einigen Artikeln in Fachzeitschriften gibt es vor allem im Netz eine ganze Reihe von
Erläuterungen sowie Definitions- und Einordnungsversuchen zum Thema Datenjournalismus.
Als Standardwerke, die vor allem den Charakter von Handlungsanleitungen haben, könnten
vielleicht am ehesten das „Data Journalism Handbook“6 und Brant Houstons „Computer-
Assisted Reporting: A Practical Guide“ 7 bezeichnet werden. Die meisten Tipps und
Anleitungen finden sich jedoch auf Blogs und in Vortragsfolien im Internet.
Wissenschaftliche Arbeiten sind rar.
3 Vgl. DONAU-UNIVERSITÄT KREMS: Datenjournalismus in Österreich: Potentiale noch nicht ausgeschöpft. (05.10.2012) http://www.donau-uni.ac.at/de/department/wissenkommunikation/news/id/18611/index.php [abgerufen am 17.08.2013]. 4 Vgl. AITAMURTO, Tanja, Esa SIRKKUNEN und Pauliina LEHTONEN: Trends in Data Journalism. (2011) http://virtual.vtt.fi/virtual/nextmedia/Deliverables-2011/D3.2.1.2.B_Hyperlocal_Trends_In%20Data_Journalism.pdf [abgerufen am 22.04.2013] S. 11f. 5 Vgl. EUROPEAN JOURNALISM CENTRE und Mirko LORENZ: DATA-DRIVEN JOURNALISM: How should a curriculum for data journalism trainings look like? http://www.surveymonkey.com/s.aspx?sm=2jRFF7W5Re%2bj9s5jn3WJcvb9JzKs0HiuTX3JnhrJb3o%3d#q5 [abgerufen am 17.08.2013]; BONEGROU, Liliana: What are the training needs for data-driven journalism? (2011) Präsentation auf der Open Knowledge Conference, 2011, Berlin. 6 EUOPEAN JOURNALISM CENTRE und OPEN KNOWLEDGE FOUNDATION: The Data Journalism Handbook. http://datajournalismhandbook.org/ [abgerufen am 17.04.2013]. 7 HOUSTON, Brant: Computer-assisted reporting: a practical guide. Boston [u.a.], 2004.
8
Im deutschsprachigen Raum sind nach Kenntnis der Autorin vor allem einige
Abschlussarbeiten über Datenjournalismus entstanden.8 Thematisch kommt die Bachelorarbeit
von Alexander Haase an der Hochschule Mittweida der vorliegenden Arbeit am nächsten. In
seiner Arbeit geht er auf die Verwandtschaft von Datenjournalismus und Wissensentdeckung
in Datenbanken (KDD) ein und entwirft einen Workflow für Datenjournalisten, der an KDD-
Methoden angelehnt ist. Seine Handlungsempfehlungen sollen „ungeübten Journalisten den
Einstieg in komplexere, datenjournalistische Projekte erleichtern“9. Einen empirischen Teil
umfasst die Arbeit von Haase im Gegensatz zu der vorliegenden Arbeit nicht.
2 Theoretische Erschließung des Forschungsfeldes
2.1 Begriffsdefinitionen
2.1.1 Arbeitsprozess, Arbeitsschritt und Handlung
In dieser Arbeit werden verschiedene Arbeitsprozesse miteinander verglichen. Unter einem
Arbeitsprozess wird die zeitliche Abfolge verschiedener Handlungen zur Erfüllung einer
Aufgabe verstanden. Die Begriffe Arbeitsprozess, Arbeitsablauf und Workflow werden im
Folgenden äquivalent verwendet.
Arbeitsprozesse lassen sich in einzelne Schritte unterteilen, die der Erfüllung bestimmter
Aufgaben dienen. Diese Schritte beinhalten wiederum eine Abfolge mehrerer Handlungen, die
nochmals beliebig fein in Teilhandlungen zerlegt werden können. Hinter Handlungen verbirgt
sich also fast immer ein Verbund oder ein Netz von Teilhandlungen.10 Solche Handlungsnetze
oder -verbünde lassen sich entweder ganz allgemein oder sehr detailliert beschreiben. Balog
spricht vom „Akkordeoneffekt“, der „in jeder Handlungsbeschreibung latent enthalten ist, ‚da
8 BONS, Katharina: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien. Diplomarbeit an der TU Dortmund, 2012; KRAMPE, Anna-Lena: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus. Masterarbeit an der Hamburg Media School, 2011; IHLE, Anne: Datenjournalismus - ein neues journalistisches Arbeitsfeld? Bachelorarbeit an der TU Ilmenau, 2011; KAWALKOWSKI, Blasius: Trend oder Zukunft: Daten als zentraler Gegenstand der journalistischen Berichterstattung. Eine Untersuchung zu den Perspektiven und Möglichkeiten des Datenjournalismus. Bachelorarbeit an der Hochschule Bonn-Rhein-Sieg, 2012. 9 HAASE, Alexander: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus. Bachelorarbeit an der Hochschule Mittweida, 2011, S. 33. 10 Vgl. BUCHER, Hans-Jürgen: Journalismus als kommunikatives Handeln. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus: ein diskursives Handbuch. Wiesbaden, 2000, S. 245–273, hier S. 253; vgl. auch HÖFFE, Otfried (Hrsg.): Lexikon der Ethik. München, 1997, S. 123f.
9
eine Handlung, genau wie das besagte Musikinstrument, bis auf ein Minimum
zusammengedrängt, aber auch ganz weit auseinandergezogen werden kann.’“11
Dies hat unmittelbaren Einfluss auf die Vergleichbarkeit von Arbeitsprozessen, deren
Arbeitsschritte unterschiedlich detailliert beschrieben sein können. Während für den einen
Prozess vielleicht die Einzelheiten der Handlungsverbünde bekannt sind, liegt für einen
anderen Prozess eventuell nur eine sehr grobe Beschreibung vor. Auf diese Problematik wird
an den entsprechenden Stellen der vorliegenden Arbeit hingewiesen.
Bei der Beschreibung der Arbeitsprozesse in dieser Arbeit werden vor allem der Vollzug der
Handlungen und deren Ziele betrachtet.12 Die Werkzeuge der Handlungen sind vor allem beim
Vergleich von datenjournalistischer und herkömmlicher Recherche von Interesse. Um
übergeordnete Intentionen von Handlungen beziehungsweise ihre Prägung durch Wert- und
Normvorstellungen geht es in den Abschnitten über Qualitätskriterien.13
2.1.2 Daten
„Vor diesem Hintergrund der Omnipräsenz von Daten ist es erstaunlich, wie wenig die Frage
gestellt wird, was Daten, insbesondere wissenschaftliche Daten, eigentlich sind.“14
Sibylle Anderl
Daten kommen in vielen Kontexten unseres Lebens vor. Entsprechend vielfältig sind auch die
möglichen Perspektiven bei der Definition dieses Begriffs. In der Informationstechnologie
wird unter Daten „eine beliebige Aneinanderreihung von Zeichen, die nach definierten Regeln
verarbeitet, gespeichert oder transportiert werden“15 verstanden. Da Datenjournalismus meist
computergestützt arbeitet (siehe auch Abschnitt 2.1.8), trifft diese Definition für die
verwendeten Daten in der Regel zu. Sie vernachlässigt jedoch den für diese Arbeit
wesentlichen Aspekt, dass Daten stets einen Entstehungskontext haben. Zweckmäßiger für
diese Arbeit ist daher die Perspektive der wissenschaftlich erhobenen Daten. Diese sind das
Ergebnis von Messungen natürlicher Phänomene oder von Erhebungen über menschliches
11 Feinberg zit. nach BALOG, Andreas: Rekonstruktion von Handlungen: Alltagsintuitionen und soziologische Begriffsbildung. Opladen, 1989, S. 109. 12 Zu den formalen Elementen einer Handlung vgl. auch HÖFFE (Hrsg.): Lexikon der Ethik, S. 123f. 13 Zu den Wert- und Normvorstellungen journalistischen Handelns vgl. z.B. ALTMEPPEN, Klaus-Dieter: Entscheidungen und Koordinationen. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus: Ein diskursives Handbuch. Wiesbaden, 2004, S. 293–310, hier S. 300. 14 ANDERL, Sibylle: Der Datenmythos. In: Planckton. (2013) http://blogs.faz.net/planckton/2013/04/11/der-datenmythos-681/ [abgerufen am 22.04.2013]. 15 MAELICKE, Bernd (Hrsg.): Lexikon der Sozialwirtschaft. Baden-Baden, 2008, S. 213f.; vgl. auch FISCHER, Peter: Lexikon der Informatik. Berlin, Heidelberg, 2011, S. 207.
10
Verhalten. 16 Für die vorliegende Arbeit soll diese Definition noch um „Angaben über
Personen, Gegenstände oder Institutionen“17 ergänzt werden, die nicht in wissenschaftlichem
Rahmen erhoben wurden. Daten in diesem Sinne sind durch die Art der Erhebung immer
Störfaktoren ausgesetzt.18
2.1.3 Journalismus
Journalismus wird in dieser Arbeit als gesellschaftliches Teilsystem mit bestimmten Aufgaben
gesehen. Je nachdem, welchem Ansatz man folgt, hat dieses System entweder Funktionen, die
sich historisch entwickelt haben, beispielsweise die „Herstellung von Öffentlichkeit“19 und die
Sicherung der Partizipation aller am gesellschaftlichen Ganzen.20 Oder aber die Aufgaben des
Journalismus sind durch die fundamentalen Werte einer demokratisch-pluralistischen
Gesellschaft gegeben. Daraus ergeben sich Aufgaben wie Kritik und Kontrolle der Regierung
sowie ein Beitrag zur Meinungs- und Willensbildung.
Die Beschreibung der Aufgaben und Ziele reicht jedoch nicht aus, um das System
Journalismus hinreichend zu definieren. Wesentlich dafür ist auch die Kenntnis der in diesem
System wirkenden Akteure. Um das Verhältnis dieser Akteure zu verdeutlichen, bietet sich ein
abgeändertes Weischenbergsches Zwiebelmodell an, wie es auch Bons in ihrer Diplomarbeit
verwendet.21 Sie benutzt eine Kombination von Weischenberg-Adaptionen nach Esser und
Huber.22 Die äußere Schale dieses Modells symbolisiert den gesellschaftlichen Rahmen, in
dem Journalismus sich bewegt. Durch die darin liegende Schale wird der Einfluss der
Rezipienten symbolisiert. 23 Die wiederum darin enthaltene Medienstrukturschale
berücksichtigt rechtliche und ökonomische Einflussfaktoren auf den Journalismus. Noch
weiter innen spiegelt die Institutionsschale die Einflüsse am Arbeitsplatz von Journalisten
wider. Im Inneren dieser Zwiebelschalenstruktur steht das Subjekt, also der Journalist. Für die
16 Vgl. HILLMANN, Karl-Heinz: Wörterbuch der Soziologie. Stuttgart, 1994, S. 135. 17 MAELICKE (Hrsg.): Lexikon der Sozialwirtschaft, S. 213f. 18 Vgl. ANDERL: Der Datenmythos. 19 PÖTTKER, Horst: Öffentlichkeit durch Wissenschaft. Zum Programm der Journalistik. In: Publizistik. 43 (1998), S. 229–249, hier S. 237. 20 Vgl. PÖTTKER, Horst: Kompensation von Komplexität. Journalismustheorie als Begründung journalistischer Qualitätsmaßstäbe. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus. Ein diskursives Handbuch. Wiesbaden, 2000, S. 375–390, hier S. 377f.; WEISCHENBERG, Siegfried, Maja MALIK und Armin SCHOLL: Journalismus in Deutschland 2005. Zentrale Befunde der aktuellen Repräsentativbefragung deutscher Journalisten. In: Media Perspektiven. 7 (2006), S. 346–361, hier S. 346. 21 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 6; vgl. auch WEISCHENBERG, Siegfried: Mediensysteme, Medienethik, Medieninstitutionen. Opladen, 1992, S. 67f. 22 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 6. 23 Vgl. HUBER, Christian: Das Journalismus-Netzwerk: wie mediale Infrastrukturen journalistische Qualität beeinflussen. Innsbruck [u.a.], 1998, S. 48f.
11
vorliegende Arbeit wird im Inneren der Subjektschale noch die journalistische Handlung
hinzugefügt. Damit soll verdeutlicht werden, dass nicht nur die äußeren Schalen auf den
Journalisten wirken,24 sondern auch er als Subjekt seine Handlungen durch seine persönlichen
Einstellungen und Ziele beeinflusst. Außerdem betont diese Anordnung die zentrale Stellung
der journalistischen Handlung in dieser Arbeit. Auch wenn auf die Einflüsse der umgebenden
Schalen im Rahmen dieser Arbeit nicht im Einzelnen eingegangen werden kann, so ist es doch
elementar, die Handlungen in ihrem Kontext zu sehen. Nur so können sie eingeordnet und
weiterführende Fragestellungen im Hinblick auf die verschiedenen Schalen entwickelt werden.
Abbildung 1 Abgeändertes Zwiebelmodell nach Weischenberg
2.1.4 Journalistische Recherche
Das Kernstück journalistischer Arbeit ist die Recherche – zumindest sollte sie es nach
Auffassung des Netzwerks Recherche sein. 25 Eine einheitliche Definition des Begriffs
„Recherche“ existiert nicht. Konsens herrscht lediglich darüber, dass sie das Einholen von
Informationen umfasst.26 Dazu zählt insbesondere auch, dass bereits vorliegendes Material
24 Vgl. ESSER, Frank: Die Kräfte hinter den Schlagzeilen. Englischer und deutscher Journalismus im Vergleich. Freiburg [u.a.], 1998, S. 27; vgl. auch BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 5f. 25 Vgl. NETZWERK RECHERCHE: Leitlinien Recherche-Journalismus. (2010) http://www.netzwerkrecherche.de/nr-Positionen--Positionen-des-netzwerk-recherche/Leitlinien-Recherche-Journalismus/ [abgerufen am 20.08.2013]; vgl. auch LEIF, Thomas (Hrsg.): Mehr Leidenschaft: Recherche. Skandal-Geschichten und Enthüllungs-Berichte. Ein Handbuch zur Recherche und Informationsbeschaffung. Wiesbaden, 2003, S. 17. 26 Vgl. BRENDEL, Detlef und Bernd E. GROBE: Journalistisches Grundwissen: Darstellung der Formen und Mittel journalistischer Arbeit und Einführung in die Anwendung empirischer Daten in den Massenmedien. München, 1976, S. 33; HALLER, Michael: Recherchieren: ein Handbuch für Journalisten. Konstanz, 2000, S. 39; MACHILL, Marcel, Markus BEILER und Martin ZENKER: Journalistische Recherche im Internet: Bestandsaufnahme journalistischer Arbeitsweisen in Zeitungen, Hörfunk, Fernsehen und Online. Berlin, 2008, S. 32; BRENDEL, Matthias und Frank BRENDEL: Richtig recherchieren: wie Profis Informationen suchen und besorgen. Ein Handbuch für Journalisten, Rechercheure und Öffentlichkeitsarbeiter. Frankfurt am Main, 2000, S. 11; ebd., S. 14.
12
ergänzt wird27 und solche Informationen offengelegt werden, „die für das Verständnis eines
Themas und seiner Einordnung wichtig sind“28. Weitere Merkmale, die in der Literatur als
Definitionskriterien genannt werden, sind die Überprüfung und Bewertung von
Informationen,29 die Evaluation der Relevanz eines Themas,30 das Ziel der Veröffentlichung31
oder das zutage förden von bisher Unbekanntem.32 In der vorliegenden Arbeit werden die
charakteristischen Arbeitsschritte journalistischer Recherche betrachtet. Es scheint daher
sinnvoll, die folgende, eher weite Definition zu wählen, die vordergründig die Handlungen des
Journalisten bei der Recherche umfasst:
Ein Vorgang wird als journalistische Recherche bezeichnet, wenn mit dem direkten oder
indirekten Ziel einer journalistischen Veröffentlichung Informationen eingeholt, überprüft und
beurteilt werden.
Diese sehr allgemein gehaltene Definition gibt die Mindestanforderungen an eine
journalistische Recherche an. Sie lässt offen, wie umfangreich die beschafften Informationen
sind und wie tiefgreifend das Verständnis der zugrunde liegenden Zusammenhänge ist.
2.1.5 Wissenschaft
Wie der Journalismus kann auch die Wissenschaft als gesellschaftliches Teilsystem betrachtet
werden.33 Diesem kommen jedoch andere Aufgaben zu. Das Ziel von Wissenschaft ist „die
Erkenntnisgewinnung“34 und die Formulierung von „als intersubjektiv wahr anerkannte[n]
Aussagen über die Welt“35. Manche Forscher betrachten neue Erkenntnisse als Selbstzweck,36
doch der Wissenschaft kommt auch die Aufgabe zu, Ergebnisse zu produzieren, die zur
Weiterentwicklung der Gesellschaft beitragen.
27 Vgl. LEIF, Thomas: Leidenschaft: Recherche. Skandal-Geschichten und Enthüllungs-Berichte. Opladen [u.a.], 1998, S. 16; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 28 KLAMMER, Bernd: Empirische Sozialforschung: eine Einführung für Kommunikationswissenschaftler und Journalisten. Konstanz, 2005, S. 31. 29 Vgl. BRENDEL/GROBE: Journalistisches Grundwissen, S. 33; LEIF: Leidenschaft, S. 16f.; HALLER, Michael: Recherchieren. Konstanz, 2004, S. 39; BRENDEL/BRENDEL: Richtig recherchieren, S. 14; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34; ebd., S. 32; HALLER: Recherchieren, S. 40. 30 Vgl. MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 31 Vgl. ebd., S. 32; HALLER: Recherchieren, S. 51. 32 Vgl. LEIF: Leidenschaft, S. 16f. 33 Vgl. SCHIMANK, Uwe: Wissenschaft als gesellschaftliches Teilsystem. In: MAASEN, Sabine (Hrsg.): Handbuch Wissenschaftssoziologie. Wiesbaden, 2012, S. 113–124, hier S. 113ff. 34 KLAMMER: Empirische Sozialforschung, S. 61. 35 SCHIMANK: Wissenschaft als gesellschaftliches Teilsystem, S. 114f.; vgl. auch KLAMMER: Empirische Sozialforschung, S. 61. 36 Vgl. SCHIMANK: Wissenschaft als gesellschaftliches Teilsystem, S. 116.
13
Ein charakteristisches Merkmal des Wissenschaftssystems ist seine Selbstreferentialität:
Publikationen dürfen nur auf als wahr erachteten Aussagen aus anderen Publikationen
aufbauen.37 Auch eine „eklatante Ineffizienz“38 ist charakteristisch für den wissenschaftlichen
Forschungsprozess. Von den zahlreichen Publikationen wird nur eine äußerst geringe Zahl
Teil des von der „Fachgemeinschaft anerkannten Wissenskanons“39. Wissenschaft folgt bei
der Erkenntnissuche bestimmten Regeln. Darunter fallen spezielle technische Vorschriften wie
etwa „Signifikanzniveaus bei statistischen Tests“40 oder auch generelle forschungsethische
Maximen.41
Um die Funktionsweise des Wissenschaftssystems zu verstehen, muss klar sein, dass es – wie
auch der Journalismus – äußeren Einflüssen unterliegt. Dazu gehören ethische, administrative,
ökonomische und politische Faktoren. Zur Bewältigung dieser äußeren Ansprüche hat die
Wissenschaft verschiedene Prozeduren der Selbstkontrolle wie „Promotions- und
Habilitationsverfahren, peer review, Evaluationen, Begutachtungen von Drittmittelanträgen,
Preise und Auszeichnungen, wissenschaftliche Beiräte“ 42 entwickelt. Ähnlich wie der
Journalist im Weischenbergschen Zwiebelmodell ist also auch der Forscher durch
gesamtgesellschaftliche Normen, rechtliche Vorgaben, ökonomische Zwänge, Strukturen des
eigenen Systems und der Institutionen sowie durch die eigenen Vorstellungen beeinflusst.
2.1.6 Statistik
Statistik wird in dieser Arbeit als Wissenschaft43 bzw. Hilfswissenschaft44 angesehen.45 Als
solche beschäftigt sie sich mit dem Sammeln, Analysieren, Präsentieren und Interpretieren
von Daten.46 Hudec und Neumann sehen in Modellen „zur Gewinnung, Beschreibung und
37 Vgl. ebd. 38 Ebd. 39 Ebd. 40 Ebd. 41 Vgl. ebd., S. 116f. 42 BARLÖSIUS, Eva: Wissenschaft als Feld. In: MAASEN, Sabine (Hrsg.): Handbuch Wissenschaftssoziologie. Wiesbaden, 2012, S. 125–136, hier S. 127. 43 Vgl. ANDERSON, David R., Dennis J. SWEENEY und Thomas A. WILLIAMS: statistics (science). In: Encyclopedia Britannica. (2007) http://www.britannica.com/EBchecked/topic/564172/statistics [abgerufen am 03.07.2013]; DUDEN: Statistik. http://www.duden.de/rechtschreibung/Statistik [abgerufen am 03.07.2013]. 44 Vgl. KLAMMER: Empirische Sozialforschung, S. 17; KLAMMER, Bernd: Journalistik und Statistik. In: SCHÄFER, Ulrich P. (Hrsg.): Journalismus in Theorie und Praxis: Beiträge zur universitären Journalistenausbildung. Festschrift für Kurt Koszyk. Konstanz, 1999, S. 227–242, hier S. 230; FERSCHL, Franz: Deskriptive Statistik. Würzburg [u.a.], 1978, S. 13. 45 Manchmal wird Statistik auch als Zusammenfassung von Methoden oder als Teilbereich der Mathematik bezeichnet. Vgl. dazu KAMPS, Udo: Definition»Statistik«. Gabler Wirtschaftslexikon. http://wirtschaftslexikon.gabler.de/Definition/statistik.html [abgerufen am 03.07.2013]; KLAMMER: Empirische Sozialforschung, S. 90; von diesem Bedeutungsfeld abzugrenzen ist die „schriftlich fixierte Zusammenstellung, Aufstellung der Ergebnisse von Massenuntersuchungen“ (DUDEN: Statistik.), die ebenfalls mit Statistik bezeichnet wird. 46 Vgl. ANDERSON/SWEENEY/WILLIAMS: statistics (science).
14
Analyse von Daten“47 den Gegenstand der Statistik. Statistische Modelle geben den Daten
eine Struktur und beinhalten eine Verteilung der Daten um diese Struktur. So muss
beispielsweise das Modell einer linearen Gleichung zwangsläufig eine Fehlerverteilung
beinhalten.48
Eingesetzt wird die Statistik in „Politik, Wirtschaft und Gesellschaft und allen Geistes-,
Sozial- und Naturwissenschaften einschließlich Medizin und Technik, in denen mit Zahlen
oder Bewertungen gearbeitet wird“49. In der Wirtschaft bietet sie eine ganze Reihe von
Möglichkeiten von der Marktforschung bis hin zur Hilfe bei strategischen Entscheidungen von
Unternehmen.50 Zu den stark wachsenden Bereichen in diesem Feld gehört das Data-Mining,
mit dessen Hilfe beispielsweise aus Kundendaten Erkenntnisse gewonnen werden können, die
für den Erfolg des Betriebs von Interesse sind.51
2.1.7 Data-Mining und Wissensentdeckung in Datenbanken
„We are drowning in information and starving for knowledge.“ 52
Rutherford D. Rogers
Technische Neuerungen haben in den vergangenen Jahren die Produktion und Analyse von
Daten schnell vorangetrieben. Ester schreibt: „Kommerzielle Geräte wie etwa Scannerkassen
sowie wissenschaftliche Instrumente wie z.B. Erdbeobachtungssatelliten oder
Gensequenzierungsautomaten generieren immer größere Mengen von immer komplexeren
Daten.“ 53 Aus diesen Daten durch „(semi)automatische Extraktion“ 54 gültiges, bisher
unbekanntes und potenziell nützliches Wissen zu gewinnen, ist Motivation und Aufgabe des
Knowledge Discovery in Databases (KDD).55
In der Literatur herrscht Uneinigkeit darüber, wie die Begriffe Data-Mining und Knowledge-
Discovery in Databases (KDD, zu dt. Wissensentdeckung in Datenbanken) zu differenzieren
47 HUDEC, Marcus und Christian NEUMANN: Was ist Statistik? Geschichte, Grundlagen, Anwendungen. http://www.stat4u.at/download/1417/WasIstStatistik.pdf [abgerufen am 20.08.2013]. 48 Nach Erläuterungen von Prof. Claus Weihs, Fakultät Statistik, TU Dortmund. 49 KAMPS: Definition»Statistik«. Gabler Wirtschaftslexikon. 50 Vgl. HUDEC/NEUMANN: Was ist Statistik? Geschichte, Grundlagen, Anwendungen. 51 Vgl. ebd. 52 Zit. nach HASTIE, Trevor, Robert TIBSHIRANI und Jerome H. FRIEDMAN: The elements of statistical learning: data mining, inference, and prediction. New York, NY, 2009, S. xi. 53 ESTER, Martin und Jörg SANDER: Knowledge discovery in databases: Techniken und Anwendungen. Berlin [u.a.], 2000, S. 1. 54 Ebd. 55 Vgl. ebd.; vgl. dazu auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32.
15
sind.56 Ester sieht Data-Mining als den eigentlichen Analyseschritt im KDD-Prozess, der
zusätzlich noch Phasen wie Vorverarbeitung der Daten oder Evaluation der Ergebnisse
enthält.57 Andere Quellen hingegen verwenden die Begriffe KDD und Data-Mining synonym58
oder scheinen unter Data-Mining eher das zu verstehen, was bei Ester als KDD bezeichnet
wird.59 Letzteres trifft auch für den in Abschnitt 2.3.2 beschriebenen Standardprozess für
Data-Mining zu, der nach Fayyad et al. eher als Standardprozess für KDD bezeichnet werden
müsste.
Da die Schritte des KDD-Prozesses nach Ester stark denen des in Abschnitt 2.3.2
beschriebenen Standardprozesses ähneln, wird an dieser Stelle nicht näher auf sie eingegangen.
Angemerkt werden soll jedoch, dass Fayyad et al. KDD als nichttrivialen Prozess bezeichnen
und betonen, dass es sich nicht lediglich um eine geradlinige Berechnung vordefinierter
Größen, wie zum Beispiel Mittelwerten handelt. 60 Es muss darüber hinaus eine Art
Recherche oder Schlussfolgerung („some search or inference“) geben.61
Data-Mining und KDD befinden sich an der Schnittstelle von maschinellem Lernen,
Mustererkennung, Datenbanken, Statistik, künstlicher Intelligenz, Datenvisualisierung und
High-Performance-Computing.62 Anwendung finden sie in den verschiedensten Bereichen in
Wissenschaft und Industrie,63 beispielsweise bei der Berechnung von Luftströmungen aus
Satellitendaten in den Erdwissenschaften oder der Betrugserkennung bei
Kreditkartentransaktionen.64
56 Da es für Data-Mining keinen befriedigenden deutschen Begriff gibt (verwendet wird manchmal Datenmustererkennung) und das englische Wort auch in der deutschen Fachliteratur Verwendung findet, wird in dieser Arbeit der englische Begriff beibehalten. 57 Vgl. ESTER/SANDER: Knowledge discovery in databases, S. 2; FAYYAD, Usama, Gregory PIATETSKY-SHAPIRO und Padhraic SMYTH: From Data Mining to Knowledge Discovery in Databases. In: AI Magazine. 17 (1996), S. 37–54, hier S. 37. 58 Vgl. ENYCLOPAEDIA BRITANNICA: data mining (computer science). In: Encyclopedia Britannica http://www.britannica.com/EBchecked/topic/1056150/data-mining [abgerufen am 29.04.2013]. 59 Vgl. HASTIE/TIBSHIRANI/FRIEDMAN: The elements of statistical learning, S. xi; JAESUNG, SIM: Critical success factors in data mining projects. Dissertation an der University of North Texas, 2003, S. 6; CHAKRABARTI, Soumen u. a.: Data Mining Curriculum: A proposal (Version 0.91). (2004) http://www.cs.uiuc.edu/~hanj/kdd_curriculum.pdf [abgerufen am 20.08.2013]; BISSANTZ, Nicolas und Jürgen HAGEDORN: Data Mining (Datenmustererkennung). In: Wirtschaftsinformatik. 51/1 (2009), S. 139–144, hier S. 139. 60 Vgl. FAYYAD/PIATETSKY-SHAPIRO/SMYTH: From Data Mining to Knowledge Discovery in Databases, S. 41. 61 Vgl. ebd. 62 Vgl. ebd., S. 39; vgl. auch ebd., S. 40; ESTER/SANDER: Knowledge discovery in databases, S. 1f.; CHAKRABARTI u. a.: Data Mining Curriculum: A proposal (Version 0.91), S. 1ff.; JAESUNG, SIM: Critical success factors in data mining projects, S. 6. 63 Vgl. FAYYAD/PIATETSKY-SHAPIRO/SMYTH: From Data Mining to Knowledge Discovery in Databases, S. 37f.; ESTER/SANDER: Knowledge discovery in databases, S. 6ff.; JAESUNG, SIM: Critical success factors in data mining projects, S. 5f.; CHAKRABARTI u. a.: Data Mining Curriculum: A proposal (Version 0.91), S. 3. 64 Vgl. ESTER/SANDER: Knowledge discovery in databases, S. 6ff.
16
2.1.8 Datenjournalismus
„Is data journalism? Is it journalism to publish a raw database? Here, at last, is the definitive,
two-part answer: 1. Who cares? 2. I hope my competitors waste their time arguing about this
for as long as possible.“ 65
Adrian Holovaty
Es gibt einige Beispiele, die immer wieder genannt werden, wenn es zu erklären gilt, was
Datenjournalismus ist. Aus der deutschsprachigen Medienwelt gehören dazu die interaktive
ZEIT ONLINE-Anwendung „Verräterisches Handy“66 und die Fluglärmkarte der TAZ.67 Doch
was der Kern des Datenjournalismus ist, wird durch das bloße Nennen von Beispielen68 nicht
klar, zumal datenjournalistische Produkte sehr unterschiedlich sein können. Im Folgenden
wird ein kurzer Überblick über die historische Entwicklung des Datenjournalismus gegeben
und anschließend aus verschiedenen Definitionsansätzen eine eigene für diese Arbeit gültige
Definition entworfen.
Daten spielen schon sehr lange eine Rolle in der journalistischen Berichterstattung,
beispielsweise in Form des Stau- oder Wetterberichts, Börsenkursen oder
Tabellenplatzierungen im Sportjournalismus.69 Hier soll die Entwicklung des Phänomens
Datenjournalismus jedoch erst ab dem Aufkommen des Computer-Assisted Reporting (CAR)
betrachtet werden.
Computer-Assisted Reporting
CAR wird im englischsprachigen Raum verstärkt seit den 60er Jahren praktiziert.70 Bei dieser
computergestützten Recherche werden Auffällig- und Unregelmäßigkeiten in großen
Datensätzen gesucht, „die als möglicher Anlass für eine tiefergehende Recherche dienen
65 ROGERS, Simon: Facts are sacred: the power of data. London, 2013, S. 10. 66 Der Grünenpolitiker Malte Spitz hatte seine Vorratsdaten bei der Telekom eingeklagt und ZEIT ONLINE zur Verfügung gestellt. Die Redaktion erstellte daraus ein Tool, mit dem man das Bewegungsprofil des Politikers nachvollziehen kann. Vgl. ZEIT ONLINE: Verräterisches Handy. (2011) http://www.zeit.de/datenschutz/malte-spitz-vorratsdaten [abgerufen am 20.08.2013]. 67 Die Fluglärmkarte zeigt die voraussichtliche Lärmbelästigung durch den neuen Flughafen BBI an. In dem Zeitraum, in dem diese Arbeit geschrieben wurde, war nur der Verweis auf die Fluglärmkarte, nicht jedoch die Fluglärmkarte selbst, abrufbar. Vgl. dazu TAZ: Flughafen BER. (2013) http://www.taz.de/Fluglaerm-BBI/!t195/ [abgerufen am 20.08.2013]. 68 Mehr Beispiele gibt es beispielsweise auf der Seite http://www.datenjournal.de/dossier/beispiele.html [abgerufen am 20.08.2013] von Online-Journalismus-Studierenden der Hochschule Darmstadt. Laufende Entwicklungen im Datenjournalismus verfolgt Lorent Matzat auf seinem Blog http://datenjournalist.de/ [abgerufen am 20.08.2013]. 69 Vgl. MATZAT, Lorenz: Datenjournalismus vor dem Internet: Wetterbericht, Finanzdaten und Co. (2010) http://datenjournalist.de/datenjournalismus-vor-dem-internet-wetterbericht-finanzdaten-und-co/ [abgerufen am 20.08.2013]. 70 Vgl. MATZAT, Lorenz: Datenjournalismus. In: Bundeszentrale für politische Bildung. (2011) http://www.bpb.de/gesellschaft/medien/opendata/64069/datenjournalismus?p=all [abgerufen am 04.08.2013].
17
könnten.“71 Als eine wegweisende CAR-Recherche wird häufig die des CBS-Korrespondenten
Walter Cronkite während der Präsidentschaftswahl 1952 genannt.72 Entgegen den damaligen
Medienberichten sagte Cronkite den Sieg von Eisenhower anhand von vorläufigen Briefwahl-
Ergebnissen („early returns“) korrekt voraus.73 In den USA wurde CAR durch die Gründung
der Society of Investigative Reporters and Editors (IRE) im Jahr 1975 weiter gefördert.74
Präzisionsjournalismus
Ein weiterer CAR-Pionier, der zudem den Begriff vom Präzisionsjournalismus prägte, ist
Philip Meyer. Er schrieb 1973 das Buch Precision Journalism, in dem er die Nutzung
statistischer Methoden durch die Medien anpreist. Präzisionsjournalismus bedeutet, dass
sozial- und verhaltenswissenschaftliche Forschungsmethoden auf die journalistische Praxis
angewandt werden.75 Nach Meyers Vorstellung sollen Journalisten selbst Daten erheben und
zu Meinungsforschern werden.76 Auf diese Weise sollen sie „in die Lage versetzt werden,
gesellschaftliche Veränderungsprozesse wissenschaftlich fundiert zu beschreiben und zu
beurteilen, anstatt sie spekulativ zu interpretieren.“77 Solche Vorteile werden heute vielfach
auch dem Datenjournalismus zugesprochen.78
Meyers Ansatz ist umstritten. Kritiker bemängeln, dass der Zeit- und Aktualitätsdruck sowie
der organisatorische Rahmen im Journalismus diesen verwissenschaftlichen Arbeitsansatz
behindern.79 Haas geht so weit zu sagen, dass das System Journalismus sich mit diesem
Ansatz selbst aufgibt, „indem es versucht, das zu tun, was professionelle Wissenschaftler in
jedem Falle besser können. Es übernimmt also Aufgaben, die es nicht erfüllen kann, und gibt
dafür seine systematischen Stärken auf.“80 Haas befürchtet nicht nur die Selbstaufgabe des
Journalismus, sondern auch „Verwässerung von Sozialwissenschaft“81. Die Diskussion über
71 Ebd. 72 Vgl. COX, Melisma: The development of computer-assisted reporting. (2000) http://com.miami.edu/car/cox00.pdf [abgerufen am 17.04.2013]. 73 Vgl. ebd. 74 Vgl. WORMER, Holger: Figures, statistics and the journalist: an affair between love and fear. Some perspectives of statistical consulting in journalism. In: Advances in Statistical Analysis. 91/4 (2007), S. 391–397, hier S. 394; INVESTIGATIVE REPORTERS AND EDITORS: About IRE. http://www.ire.org/about/ [abgerufen am 04.08.2013]; heute gibt es in den USA sogar ein National Institute of Computer Assisted Reporting (NICAR) an der Missouri School of Journalism. Vgl. dazu INVESTIGATIVE REPORTERS AND EDITORS: NICAR. http://www.ire.org/nicar/ [abgerufen am 17.04.2013]. 75 Vgl. MEYER, Philip: Precision journalism: a reporter’s introduction to social science methods. Lanham [u.a.], 2002, S. 2. 76 Vgl. ebd., S. 2f. 77 KLAMMER: Empirische Sozialforschung, S. 20. 78 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 8. 79 Vgl. KLAMMER: Empirische Sozialforschung, S. 20. 80 HAAS, Hannes: Empirischer Journalismus: Verfahren zur Erkundung gesellschaftlicher Wirklichkeit. Wien [u.a.], 1999, S. 111. 81 Ebd.
18
den Präzisionsjournalismus wirft eine grundlegende Debatte über das Verhältnis von
Journalismus und Wissenschaft, insbesondere das ihrer Methoden, auf.82
Der Begriff des Data-Driven Journalism wurde in Europa vor allem durch die britische
Zeitung THE GUARDIAN geprägt, die 2009 mit dem Crowdsourcing-Projekt „Investigate your
MP’s expenses“83 sowie kurze Zeit später mit der Aufbereitung der Afghanistan- und Irak-
War-Logs84 viel beachtete datenjournalistische Projekte schuf.85 Im deutschen Sprachraum hat
sich als Äquivalent zum Data-Driven Journalism der Begriff Datenjournalismus durchgesetzt,
auch wenn die Übersetzung Datengetriebener Journalismus von manchen Journalisten
bevorzugt wird.86
Der Datenjournalismus ist also nicht aus heiterem Himmel entstanden, sondern hat seine
Wurzeln im Computer-Assisted Reporting und im Präzisionsjournalismus. Ob es zwischen
diesen Begriffen überhaupt eine klare Trennung gibt, ist umstritten. Datenjournalismus steht
im Verdacht, nur ein „Buzzword“87, also ein Modewort für etwas zu sein, was es schon lange
gibt. Der deutsche Datenjournalist Mirko Lorenz räumt ein, dass man darüber streiten kann,
ob es sich wirklich um ein neues Phänomen handelt, sagt aber zugleich: „there is something in
the air that hints that this new trend might be bigger and lasting for some time.“88 Der
Journalist Marc Patzwald meint, die Grundidee sei zwar gar nicht so neu, die Vorgehensweise
habe sich allerdings im Zeitalter des Internets geändert.89 Diese Idee eines alten und eines
neuen Datenjournalismus vertreten auch die Datenjournalisten Lorenz Matzat und Simon
Rogers. Der neue Datenjournalismus hat für sie immer etwas mit dem Internet90 bzw. einer
82 Klammer beschäftigt sich in Empirische Sozialforschung eingehend mit dem Verhältnis von Journalismus und Wissenschaft. 83 ROGERS, Simon: How to crowdsource MPs’ expenses. In: the Guardian. (18.06.2009) http://www.theguardian.com/news/datablog/2009/jun/18/mps-expenses-houseofcommons [abgerufen am 21.08.2013]. Zahlreiche Leser des Guardian halfen dabei, auf hunderttausenden Seiten mit Spesenabrechnungen von Parlamentsmitgliedern Unregelmäßigkeiten zu finden. 84 Afghanistan: the war logs. In: the Guardian. (04.08.2010) http://www.theguardian.com/world/the-war-logs [abgerufen am 21.08.2013]; Iraq: The war logs. In: the Guardian. (22.10.2010) http://www.theguardian.com/world/iraq-war-logs [abgerufen am 21.08.2013]; die „Afghanistan-Protokolle“ wurden auch vom Spiegel aufbereitet: GEBAUER, Matthias u. a.: Enthüllung brisanter Kriegsdokumente: Die Afghanistan-Protokolle. In: Spiegel Online. (25.07.2010) http://www.spiegel.de/politik/ausland/enthuellung-brisanter-kriegsdokumente-die-afghanistan-protokolle-a-708311.html [abgerufen am 21.08.2013]. 85 Der Guardian betreibt ein eigenes Data-Blog und hat ein eigenständiges Datenressort. 86 Vgl. z.B. MATZAT: Datenjournalismus. 87 LORENZ, Mirko: Status and Outlook for data-driven Journalism. (2010) http://de.slideshare.net/duarteromero/datadriven-journalism-what-is-there-to-learn-12056926 [abgerufen am 21.08.2013]. 88 Ebd. 89 Vgl. PATZWALD, MARC: Erzählen nach Zahlen. http://www.epd.de/fachdienst/fachdienst-medien/schwerpunktartikel/erz%C3%A4hlen-nach-zahlen [abgerufen am 13.06.2013]. 90 Vgl. MATZAT, Lorenz: Man macht sich überprüfbar. In: medium - magazin für journalisten. (2011) http://www.mediummagazin.de/archiv/2011-2/ausgabe-01022011/man%20-macht-sich-uberprufbar/ [abgerufen am 18.04.2013].
19
speziellen Verwendung von Computern zu tun.91 Ob sich Datenjournalismus eindeutig von
CAR und Präzisionsjournalismus abgrenzen lässt, oder ob es sich um eine Weiterentwicklung
des gleichen Phänomens handelt, kann an dieser Stelle nicht abschließend geklärt werden.
Sicher ist aber, dass sich die Methoden im Umgang mit Daten sowie der Zugang zu
Datenquellen mit den wachsenden technischen Möglichkeiten stets weiterentwickelt haben.92
Im Folgenden wird eine für diese Arbeit gültige Definition hergeleitet. Dazu werden zunächst
Kriterien herausgearbeitet, die datenjournalistische Stücke charakterisieren.
Unstrittig ist, dass Daten beim datenjournalistischen Stück in irgendeiner Form eine Rolle
spielen.93 Matzat und Langer definieren Datenjournalismus als „Journalismus, der durch Daten
ermöglicht und vorangetrieben wird“ 94 und bei dem „Datensätze zum Gegenstand des
Berichts“95 gemacht werden. Es geht jedoch nicht darum, Daten um ihrer selbst willen zu
präsentieren. Sie dienen dazu, eine Geschichte zu finden, die dann dem Rezipienten vermittelt
wird. 96 Lorenz gibt als Kurzdefinition für Datenjournalismus sogar an: „Aus Daten
Geschichten machen“97.
Häufig wird im Zusammenhang mit Datenjournalismus das Erzeugen eines Mehrwerts
erwähnt. 98 Lorenz spricht von einem Verfeinerungsprozess, bei dem Rohdaten in etwas
Bedeutsames verwandelt werden und für das Publikum an Wert gewinnen.99
Die Bereinigung, Analyse und Kombination von Daten sind weitere wichtige Kriterien für das
Vorliegen eines datenjournalistischen Produkts. 100 Nach Langer ist für Datenjournalismus
91 Vgl. ROGERS: Facts are sacred, S. 12. 92 Vgl. LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen. 93 Vgl. z.B. ELMER, Christina: Kleine Einführung Datenjournalismus. Vortragsfolien WPK-Workshop: Data Stories I, Berlin, 2013. 94 MATZAT, Lorenz und Ulrike LANGER: Aus Zahlen werden Informationen: Datenjournalismus. In: JAKUBETZ, Christian, Ulrike LANGER und Ralf HOHLFELD (Hrsg.): Der Universalcode. Journalismus im digitalen Zeitalter. München, 2011, S. 333–358, hier S. 333. 95 MATZAT: Man macht sich überprüfbar. 96 Hirst gibt auf seinem Blog unterschiedliche Definitionsvorschläge, die alle den Aspekt des Geschichtenerzählens beinhalten: HIRST, Tony: Several Takes on Defining Data Journalism. (2013) http://schoolofdata.org/2013/06/11/several-takes-on-defining-data-journalism/ [abgerufen am 13.06.2013]; vgl. auch MATZAT: Man macht sich überprüfbar.; LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen.; WALTER, Nicole: Goldschürfer im Netz. Ein Gespräch mit den Datenjournalisten Matzat und Venohr. In: Fluter. (19.03.2013) http://www.fluter.de/de/120/berufe/11408/ [abgerufen am 13.06.2013]; LORENZ: Status and Outlook for data-driven Journalism., S. 10; EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism? http://datadrivenjournalism.net/about/faq [abgerufen am 17.04.2013]. 97 LORENZ, Mirko: Datenjournalismus: Lohnt der Aufwand? (18.10.2011) http://de.slideshare.net/mirkolorenz/datenjournalismus-lohnt-der-aufwand [abgerufen am 18.04.2013]. 98 Vgl. MATZAT, Lorenz: Data Driven Journalism: Versuch einer Definition. (2010) http://datenjournalist.de/data-driven-journalism-versuch-einer-definition/ [abgerufen am 18.04.2013]; HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32. 99 Vgl. LORENZ: Status and Outlook for data-driven Journalism., S. 12.
20
charakteristisch, dass er Daten „nicht bloß kursorisch, sondern systematisch auswertet“101. Für
den Datenjournalisten Sebastian Mondial bedeutet Datenjournalismus, „sich nicht mit selektiv
vorgefertigten Daten zufriedenzugeben, sondern möglichst alle Rohdaten auszuwerten [...]“102.
Charakteristisch ist außerdem die Nutzung bestimmter Programme und Techniken bei
Beschaffung, Analyse und grafischer Aufbereitung der Daten. Häufig liegen diese im Netz im
Excel- oder CSV-Format vor und können direkt weiterverarbeitet werden. Datenjournalisten
sammeln aber auch Daten von Webseiten mit sogenannten Scraper-Programmen103 oder lesen
sie mittels Software aus PDF-Dokumenten aus. Die gängigsten Analyse-Instrumente sind
Tabellenkalkulationsprogramme wie Excel oder OpenCalc. Auch bei der Visualisierung von
Daten, egal ob interaktiv oder nicht, spielen Programme eine wichtige Rolle. Häufig
verwendet werden beispielsweise QGIS oder GoogleFusionTables für die räumliche
Darstellung von Daten auf Landkarten.
Einzelne datenjournalistische Akteure erwähnen, dass sie sich mit großen Datenmengen
beschäftigen. Dies scheint also ein nicht unbedingt zwingendes, aber doch typisches Merkmal
datenjournalistischer Produkte zu sein.104
Umstritten ist die Frage, ob datenjournalistische Stücke zwangsläufig interaktiv sein müssen105
und somit auf das Medium Internet begrenzt sind. Laut Leßmöllmann sind „die Komponenten
des Interaktiven und des eigenen Nachrecherchierens“106 nur online zu finden, jedoch könne
auch jeder Printjournalist sich datenjournalistischer Methoden bedienen und am Ende daraus
„eine wunderbare Print-Grafik“107 erstellen.
100 Vgl. z.B. MATZAT, Lorenz: Einführung in Datenjournalismus. (16.04.2010) http://de.slideshare.net/wir_sie/einfhrung-in-datenjournalismus-data-driven-journalism [abgerufen am 18.04.2013] Folie 5; DATENJOURNAL: Ein Einstieg in den Datenjournalismus. Interview mit Bernd Helfert. (2011) http://www.datenjournal.de/dossier/einstieg.html [abgerufen am 17.04.2013]; EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?. 101 LANGER, Ulrike: Schaubild statt Klickstrecke. In: Medium Magazin. (2011) http://www.mediummagazin.de/archiv/2011-2/ausgabe-01022011/schaubild-statt-klickstrecke/ [abgerufen am 21.08.2013]. 102 Zit. nach ebd. 103 Vgl. EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?. 104 Vgl. DATENJOURNAL: Ein Einstieg in den Datenjournalismus. Interview mit Bernd Helfert.; WALTER: Goldschürfer im Netz. 105 Vgl. ELMER: Kleine Einführung Datenjournalismus.; MATZAT: Einführung in Datenjournalismus. Folie 5; BUNZ, Mercedes: Das offene Geheimnis: Zur Politik der Wahrheit im Datenjournalismus. In: GEISELBERGER, Heinrich und Dirk BAECKER (Hrsg.): WikiLeaks und die Folgen. Netz, Medien, Politik. Berlin, 2011, S. 134–151, hier S. 137; LANGER: Schaubild statt Klickstrecke.; WALTER: Goldschürfer im Netz; MATZAT: Data Driven Journalism: Versuch einer Definition. 106 Zit. nach PATZWALD, MARC: Erzählen nach Zahlen. 107 Ebd.
21
Ob Visualisierung überhaupt zwingend für einen datenjournalistischen Beitrag ist, bleibt
ebenfalls umstritten. Sie wird zwar sehr häufig als Charakteristikum angeführt,108 manche
Datenjournalisten vertreten jedoch die Auffassung, dass sie kein zentrales Merkmal ist.
Rogers beispielsweise schreibt: „It’s (still) all about the stories. Data journalism is not
graphics and visualisations. It’s about telling the story in the best way possible. Sometimes
that will be a visualisation or map. [...] But sometimes it’s a news story. Sometimes, just
publishing the number is enough. If data journalism is about anything, it’s the flexibility to
search for new ways of storytelling.“109
Die Veröffentlichung von Rohdaten grenzt den Datenjournalismus von anderen
Journalismusformen ab. 110 Da die Veröffentlichung der kompletten Daten aus
Datenschutzgründen nicht immer möglich ist, kann die Veröffentlichung von Rohdaten jedoch
keine zwangsläufige Eigenschaft datenjournalistischer Stücke sein. Eine weitere optionale
Eigenschaft von Datenjournalismus ist die Einbeziehung von Rezipienten bei der Beschaffung
oder Auswertung von Daten, das sogenannte Crowdsourcing.111
Der Online-Journalist Andreas Griess unterscheidet grundlegende und optionale Aspekte, die
ein datenjournalistisches Stück ausmachen.112 Auch Bons und Krampe treffen eine solche
Unterscheidung.113 Welche Kriterien allerdings grundlegend und welche optional sind, darüber
herrscht Uneinigkeit. Tabelle 2 in Anhang I gibt eine Übersicht darüber, wie die oben
erläuterten Kriterien bei Krampe, Bons und Griess verwendet werden und wie sie in die
Datenjournalismus-Definition der vorliegenden Arbeit einfließen.
Je nachdem, welcher Aspekt des Phänomens betont wird, kann Datenjournalismus eher
recherche- oder darstellungsbetont definiert werden. So wird Datenjournalismus einerseits
manchmal als „Recherche-Ansatz“, „(Arbeits)-prozess“ oder „Recherche-
108 Vgl. z.B. ELMER: Kleine Einführung Datenjournalismus.; LANGER: Schaubild statt Klickstrecke.; MATZAT: Data Driven Journalism: Versuch einer Definition.; MATZAT: Man macht sich überprüfbar.; EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?; MATZAT: Einführung in Datenjournalismus. Folie 5. 109 ROGERS, Simon: Data journalism at the Guardian: what is it and how do we do it? In: the Guardian. (28.07.2011) http://www.theguardian.com/news/datablog/2011/jul/28/data-journalism [abgerufen am 21.08.2013]. 110 Vgl. ELMER: Kleine Einführung Datenjournalismus.; LANGER: Schaubild statt Klickstrecke.; MATZAT: Man macht sich überprüfbar.; EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?; DATENJOURNAL: Ein Einstieg in den Datenjournalismus. Interview mit Bernd Helfert.; MATZAT: Einführung in Datenjournalismus. Folie 5. 111 Vgl. MATZAT: Data Driven Journalism: Versuch einer Definition.; MATZAT: Einführung in Datenjournalismus. Folie 5. 112 Vgl. GRIESS, Andreas: Datenjournalismus in Deutschland. (27.06.2012) http://de.slideshare.net/agriess/datenjournalismus-in-deutschland [abgerufen am 13.06.2013] Folie 3. 113 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 14; KRAMPE: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus, S. 22.
22
methode“ bezeichnet. Andererseits werden „Veröffentlichungs-„ oder
„Darstellungsform“ sowie „Genre“ als mögliche Kategorien genannt. 114 Ein etwas
abweichender Ansatz konzentriert sich stärker auf die verwendeten Techniken im
Datenjournalismus und beschreibt ihn eher als Menge von Werkzeugen oder Fähigkeiten.115
Matzat sieht Datenjournalismus in der Schnittmenge von visuellem Journalismus oder
Infografiken, multimedialem und interaktivem Storytelling sowie investigativem
Journalismus.116 Da in dieser Arbeit hauptsächlich der datenjournalistische Arbeitsprozess und
der Umgang mit Daten betrachtet werden soll, wird der Datenjournalismus vorläufig als
Recherchemethode klassifiziert. Für diese Arbeit ergibt sich damit folgende Definition:
Datenjournalismus ist eine Recherchemethode, bei der Daten Quelle und
Berichterstattungsgegenstand sind. Die oft großen Datenmengen werden einer
computergestützten Analyse (inklusive Bereinigung, Strukturierung und evtl. Verknüpfung)
unterzogen. Durch diese Analyse in Kombination mit klassischen journalistischen
Recherchemethoden (z.B. der Befragung) entsteht ein Mehrwert. Dieser kann im Endprodukt
entweder in Form einer journalistischen Geschichte enthalten sein oder dem Rezipienten zum
individuellen Entdecken z.B. in interaktiver Form angeboten werden. Datenjournalistische
Produkte sind hinsichtlich ihrer Veröffentlichungsform nicht festgelegt, auch wenn interaktive
Visualisierungen im Internet typisch sind. Die Datenquellen werden im fertigen Produkt so
weit wie möglich transparent gemacht und die Rohdaten im Idealfall veröffentlicht.
Die Beschaffung von Daten wurde in der Definition implizit vorausgesetzt und daher nicht
extra erwähnt. In der Realität kann sie aber einen erheblichen Aufwand bedeuten und
bestimmte, für den Datenjournalismus typische Techniken erfordern. Der Aspekt des
„Crowdsourcing“ wurde in die Definition nicht mit aufgenommen, da er der
Literaturrecherche nach kein Schlüsselelement des Datenjournalismus zu sein scheint.
114 Vgl. MATZAT: Data Driven Journalism: Versuch einer Definition.; LORENZ: Status and Outlook for data-driven Journalism.; BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 13; ebd., S. 3; PATZWALD, MARC: Erzählen nach Zahlen.; IHLE: Datenjournalismus - ein neues journalistisches Arbeitsfeld?, S. 63f. 115 Vgl. THIBODEAUX: 5 tips for getting started in data journalism.; VERMANEN, Jerry: Why Is Data Journalism Important? Updating Your Skills Set. In: The Data Journalism Handbook http://datajournalismhandbook.org/1.0/en/introduction_2.html [abgerufen am 21.08.2013]. 116 Vgl. MATZAT: Man macht sich überprüfbar.
23
2.2 Qualitätskriterien
2.2.1 Journalismus
Qualität im Journalismus ist ein schwieriges Thema. Um das zu verdeutlichen, wird häufig ein
Zitat von Ruß-Mohl bemüht: „Qualität im Journalismus definieren zu wollen, gleicht dem
Versuch, einen Pudding an die Wand zu nageln.“117 Das Thema ist so problematisch, da
Qualität im Journalismus immer perspektivabhängig und multidimensional ist.118
Klammer bemerkt, dass sich journalistische Qualität entweder auf das fertige Produkt oder auf
den Arbeitsprozess von Journalisten beziehen kann.119 Da die Qualität des Endprodukts das
Ergebnis der „Qualitätssicherung in jeder Vorstufe“120 ist, betrachtet er die Qualität in Bezug
auf den Arbeitsprozess. Dieser Ansatz wird auch in der vorliegenden Arbeit verfolgt.
Arnold beschreibt drei Perspektiven, aus denen heraus sich journalistische Qualität
bestimmen lässt: Bei der marktnahen, publikumsorientierten Perspektive gilt die Maxime:
„Gut ist, was sich gut verkauft“121. Bei der funktional-systemorientierten Perspektive werden
Qualitätskriterien aus der Funktion des Journalismus in der Gesellschaft abgeleitet. Im
normativ-demokratieorientierten Ansatz werden die Qualitätskriterien „mit bestimmten
fundamentalen Werten einer demokratisch-pluralistischen Gesellschaft“ 122 begründet. So
besteht die Aufgabe der Medien nach der Rechtsprechung des Bundesverfassungsgerichts
darin, zum Prozess öffentlicher Meinungs- und Willensbildung beizutragen, die im Volk
117 RUß-MOHL, Stefan: Am eigenen Schopfe ... Qualitätssicherung im Journalismus - Grundfragen, Ansätze, Näherungsversuche. In: Publizistik. 37 (1992), S. 83–96, hier S. 85. 118 Vgl. KLAMMER: Empirische Sozialforschung, S. 68; LUBLINSKI, Jan: Einführung. Pudding an der Wand. In: KIENZLEN, Grit, Jan LUBLINSKI und Volker STOLLORZ (Hrsg.): Fakt, Fiktion, Fälschung. Trends im Wissenschaftsjournalismus. Konstanz, 2007, S. 21–24, hier S. 22; LEHMKUHL, Markus: „Die Wissenschaft hat festgestellt ...“ - zur Qualität der Berichterstattung in der Regionalpresse. In: KIENZLEN, Grit, Jan LUBLINSKI und Volker STOLLORZ (Hrsg.): Fakt, Fiktion, Fälschung. Trends im Wissenschaftsjournalismus. Konstanz, 2007, S. 50–55, hier S. 50; BECK, Klaus: Journalistische Qualität in der Wirtschaftskrise. Konstanz, 2010, S. 16; BUCHER, Hans-Jürgen: Journalistische Qualität und Theorien des Journalismus. In: BUCHER, Hans-Jürgen (Hrsg.): Qualität im Journalismus: Grundlagen - Dimensionen - Praxismodelle. Wiesbaden, 2003, S. 11–34, hier S. 11f.; HELD, Barbara und Stefan RUß-MOHL: Qualitätsmanagement als Mittel der Erfolgssicherung. In: FASEL, Christoph (Hrsg.): Qualität und Erfolg im Journalismus. Konstanz, 2005, S. 49–63, hier S. 55; WORMER, Holger: Improving Health Care Journalism. In: GIGERENZER, Gerd und John A. MUIR GRAY (Hrsg.): Better doctors, better patients, better decisions. Envisioning health care 2020. Cambridge, Mass. [u.a.], 2011, S. 169–188, hier S. 172; ARNOLD, Klaus: Qualitätsjournalismus: die Zeitung und ihr Publikum. Konstanz, 2009, S. 134ff. 119 Vgl. KLAMMER: Empirische Sozialforschung, S. 67. 120 Ebd., S. 68. 121 KRASSUSKI, Lisa: Qualitätskriterien in der Umweltberichterstattung, Bachelorarbeit an der TU Dortmund 2010, S. 8; vgl. auch ARNOLD, Klaus: Qualität im Journalismus – ein integratives Konzept. In: Publizistik. 53/4 (2008), S. 488–508, hier S. 499. 122 ARNOLD: Qualität im Journalismus – ein integratives Konzept, S. 496.
24
vertretenen Meinungen widerzuspiegeln und das Parlament und die Regierung der Kritik und
Kontrolle zu unterziehen.123
Trotz der vielen unterschiedlichen Ansätze und Theorien zur Qualitätsfrage im Journalismus
gibt es doch einige Kriterien, die sehr häufig genannt werden. Im Wesentlichen handelt es sich
dabei um die vier Qualitätsdimensionen nach Rager. Sie umfassen Aktualität, Relevanz,
Richtigkeit und Vermittlung.124 Aktualität bezieht sich zum einen auf den Neuigkeitswert
einer Information,125 zum anderen auf die „Zeit, die zwischen Ereignis und Berichterstattung
über das Ereignis vergeht.“ 126 Rager sieht in der Aktualität „die zentrale Dimension
journalistischen Handelns überhaupt“, die den Journalismus von anderen gesellschaftlichen
Systemen, zum Beispiel Wissenschaft und Politik, abhebt.127 Das Kriterium der Relevanz
fordert von Journalisten „eine professionelle und möglichst wenig willkürliche Auswahl“128
von Themen und Nachrichten. 129 In der Praxis haben sich dafür bestimmte Kriterien
herausgebildet, die durch die Nachrichtenwerttheorie beschrieben werden.130 Da der Anspruch
auf Wahrheit und Objektivität in der Berichterstattung heute erkenntnistheoretisch nicht mehr
haltbar ist, wird heute in der Journalistik eher von Richtigkeit und intersubjektiver
Wahrhaftigkeit oder Nachprüfbarkeit gesprochen. 131 Für Rager bedeutet Richtigkeit,
„möglichst fehlerfrei und frei von logischen Widerspru ̈chen zu berichten und Meinungen
möglichst unverfälscht wiederzugeben.“132 Sorgfalt und Transparenz, so Klammer, sind zwei
wichtige Aspekte von Richtigkeit. 133 In der journalistischen Praxis wird meist eher
pragmatisch versucht, Richtigkeit dadurch zu gewährleisten, dass mindestens zwei
unabhängige Quellen befragt werden. 134 Laut Rager muss der Journalismus relevanten
123 Vgl. ebd.; BRANAHL, Udo: Recht und Moral im Journalismus. Der Beitrag des Rechts zur Förderung von „gutem“ beruflichen Verhalten des Journalisten in der Bundesrepublik Deutschland. Medien-Ethik. Beschreibungen, Analysen, Konzepte für den deutschsprachigen Journalismus. In: HALLER Michael und Helmut HOLZHEY (Hrsg.): Medien-Ethik. Beschreibungen, Analysen, Konzepte für den deutschsprachigen Journalismus. Opladen, 1992, S. 224–241, hier S. 231. 124 Vgl. RAGER, Günther: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen? In: BENTELE, Günter und Manfred RÜHL (Hrsg.): Publizistik in der Gesellschaft. Konstanz, 1994; vgl. dazu auch KLAMMER: Empirische Sozialforschung, S. 30; HALLER: Recherchieren, S. 84. 125 Vgl. KLAMMER: Empirische Sozialforschung, S. 68. 126 Ebd., S. 68–69. 127 Vgl. RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 196. 128 Ebd., S. 198. 129 Vgl. auch KLAMMER: Empirische Sozialforschung, S. 70. 130 Vgl. RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 198. 131 Vgl. KLAMMER: Empirische Sozialforschung, S. 70; LUBLINSKI, Jan: Wissenschaftsjournalismus im Hörfunk: Redaktionsorganisation und Thematisierungsprozesse. Konstanz, 2004, S. 86; RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 200. 132 RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 200; vgl. auch KRASSUSKI: Qualitätskriterien in der Umweltberichterstattung, S. 11. 133 Vgl. KLAMMER: Empirische Sozialforschung, S. 71. 134 Vgl. ebd.; MAST, Claudia: ABC des Journalismus: ein Handbuch. Konstanz, 2008, S. 242.
25
Themen durch eine gelungene Vermittlung zu der ihnen gebührenden Beachtung verhelfen.135
Klammer weist darauf hin, dass zwischen diesen Qualitätskriterien allerlei Zielkonflikte
bestehen. „Richtigkeit kann beispielsweise leicht mit der Qualitätsdimension Aktualität in
Konflikt geraten, wenn abzuwägen ist, ob ein noch nicht ausrecherchiertes Thema
veröffentlicht werden soll.“ 136 Grundsätzlich wird von Journalisten eine skeptische
Grundhaltung sowie die ständige Überprüfung der vorliegenden Informationen gefordert.137
2.2.2 Wissenschaft
„Ein Naturwissenschaftler wird durch seine Arbeit dazu erzogen, an allem, was er tut und
herausbringt, zu zweifeln, ... besonders an dem, was seinem Herzen nahe liegt.“ 138
Forschung ist im idealisierten Sinne eine Suche nach Wahrheit. 139 Einen Anhaltspunkt dafür,
welche Qualitätskriterien es bei dieser Suche zu beherzigen gilt, liefert die Deutsche
Forschungsgemeinschaft (DFG). Sie ist die Selbstverwaltungsorganisation der Wissenschaft
in Deutschland140 und hat als solche 1998 sechzehn Empfehlungen zur Sicherung guter
wissenschaftlicher Praxis veröffentlicht.141 Die im Folgenden präsentierten Qualitätskriterien
beruhen im Wesentlichen auf den Empfehlungen der DFG, den zehn wissenschaftlichen
Qualitätskriterien bei Balzert142 sowie den Erläuterungen von Klammer zu Gütekriterien in der
empirischen Sozialforschung.143
Die Gültigkeit oder Validität gibt an, ob bei einer wissenschaftlichen Untersuchung das
gemessen wird, was gemessen werden soll.144 Sie zeigt also an, „wie angemessen eine
Fragestellung bearbeitet, wie genau das zu bestimmende Merkmal tatsächlich gemessen
wird.“145 Zuverlässigkeit oder Reliabilität ist ein Kriterium dafür, dass „bei Wiederholung des
135 Vgl. RAGER: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen?, S. 202. 136 KLAMMER: Empirische Sozialforschung, S. 72. 137 Vgl. HALLER: Recherchieren, S. 58; vgl. auch MEIER, Klaus: Internet-Journalismus. Konstanz, 2002, S. 327. 138 MAIER-LEIBNITZ, Heinz: Der geteilte Plato: ein Atomphysiker zum Streit um den Fortschritt. Zürich, 1981, S. 12. 139 Vgl. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice. (1998) http://www.dfg.de/download/pdf/dfg_im_profil/reden_stellungnahmen/download/empfehlung_wiss_praxis_0198.pdf [abgerufen am 21.08.2013]. 140 Vgl. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Wer wir sind. http://www.dfg.de/dfg_profil/aufgaben/wer_wir_sind/index.html [abgerufen am 27.07.2013]. 141 Vgl. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice. 142 Vgl. BALZERT, Helmut: Wissenschaftliches Arbeiten: Wissenschaft, Quellen, Artefakte, Organisation, Präsentation. Herdecke [u.a.], 2008, S. 9ff. 143 Vgl. KLAMMER: Empirische Sozialforschung, S. 29ff. 144 Vgl. BALZERT: Wissenschaftliches Arbeiten, S. 23. 145 KLAMMER: Empirische Sozialforschung, S. 63; vgl. auch BALZERT: Wissenschaftliches Arbeiten, S. 23.
26
Vorgehens gleiche Ergebnisse erzielt werden.“146 Man bezeichnet sie auch als „Maß für die
Reproduzierbarkeit von Meßergebnissen [sic!].“147 Je höher der Grad an Reliabilität, desto
zuverlässiger messen die Messinstrumente und desto stabiler sind die gewonnen
Messergebnisse.148 Im Zusammenhang mit wissenschaftlichen Qualitätskriterien ist oft von
Objektivität die Rede. 149 Damit ist gemeint, dass die Wertvorstellungen, Vorurteile,
Meinungen und Erwartungen des Forschers „möglichst keinen Einfluss bei der Gewinnung
von Erkenntnissen haben“150 sollen. Objektivität wird hier also im Sinne von intersubjektiver
Überprüfbarkeit verstanden. Um diese so weit wie möglich zu gewährleisten, ist die
Offenlegung der Methode in der Wissenschaft eine wichtige Forderung.151 Die Prinzipien der
Transparenz und Nachvollziehbarkeit spielen in der Wissenschaft eine zentrale Rolle.152
Damit Ergebnisse in der wissenschaftlichen Gemeinschaft diskutiert werden können, muss der
Weg der Informationsgewinnung transparent gemacht und die Methoden müssen offengelegt
werden.153 Nur Ergebnisse, die durch Veröffentlichung der „Kritik und Überprüfung“154
ausgesetzt wurden, gelten in der Wissenschaft als anerkannt. Eigene und fremde Vorarbeiten
müssen dabei vollständig und korrekt nachgewiesen werden. 155 Ehrlichkeit ist „das
Fundament der Wissenschaft als eines sozialen Systems“156. Dies gilt für die Ehrlichkeit
gegenüber anderen ebenso wie gegenüber sich selbst. Bei der eigenen Arbeit sind ständige
Selbstkritik und die Überprüfung der eigenen Vorurteile unerlässlich.157 In den Empfehlungen
der DFG wird Originalität als das bezeichnet „was die Qualität wissenschaftlicher Leistung
ausmacht“ 158. Die Autoren sprechen auch von der „Innovationshöhe“ 159 eines Beitrags.
Relevanz können Forschungsergebnisse zum einen für das Forschungsgebiet und zum
anderen für die praktische Anwendung besitzen. Balzert stuft als relevant ein, „was im
Fachgebiet neues Wissen schafft“ oder hilft, „Praxisprobleme zu lösen“160.
146 KLAMMER: Empirische Sozialforschung, S. 64. 147 Ebd., S. 65. 148 Vgl. BALZERT: Wissenschaftliches Arbeiten, S. 22. 149 Vgl. ebd., S. 13. 150 KLAMMER: Empirische Sozialforschung, S. 28. 151 Vgl. ebd., S. 61. 152 Vgl. ebd., S. 28 Klammer bezieht sich hier auf die empirische Sozialforschung. Nach Auffassung der Autorin lässt sich dieser Grundsatz jedoch auf alle wissenschaftlichen Bereiche übertragen. 153 Vgl. ebd., S. 29. 154 DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice, S. 30. 155 Vgl. ebd., S. 19. 156 Ebd., S. 27. 157 Vgl. ebd.; ebd., S. 30. 158 DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice, S. 11. 159 Ebd. 160 BALZERT: Wissenschaftliches Arbeiten, S. 29.
27
Wie diese Qualitätskriterien zu messen sind, ist unklar.161 Die Wissenschaft hat jedoch einige
Grundsätze und Strategien entwickelt, welche die Einhaltung der Kriterien anstreben. Ein
Grundsatz, der in den Empfehlungen der DFG immer wieder genannt wird, ist „Qualität vor
Quantität“. 162 Qualität, so die DFG, lässt sich nicht an der Zahl der Veröffentlichungen oder
dem Impact Factor der Zeitschriften, in denen veröffentlicht wurde, messen.163 Daher ist eine
intensive inhaltliche Auseinandersetzung mit den Veröffentlichungen, wie sie im Peer-
Review-Verfahren angestrebt wird, unersetzlich.164
Anders als beim Journalismus gibt es unter den Gütekriterien der Wissenschaft keine
Zielkonflikte, denn sie bauen aufeinander auf. Nach Klammer ist Objektivität Voraussetzung
für Zuverlässigkeit, welche wiederum Voraussetzung für Gültigkeit ist.165
2.2.3 Vergleich der Qualitätskriterien
Auch wenn Journalismus und Wissenschaft zwei gesellschaftliche Systeme mit
unterschiedlichen Zielen und Aufgaben sind (siehe Abschnitte 2.1.3 und 2.1.5), so weisen die
Qualitätskriterien dieser Systeme doch einige Überschneidungen auf. Das Ziel von
Wissenschaft ist die Erkenntnisgewinnung166 bzw. die Suche nach Wahrheit.167 Objektivität,
Gültigkeit und Zuverlässigkeit sind dabei die angestrebten Kriterien. Journalisten wollen
bisher Unbekanntes ans Licht fördern168 und überprüfen dabei im Idealfall stets die Richtigkeit
der aufgedeckten Fakten. In beiden Fällen ist ein intersubjektiv nachprüfbares Ergebnis das
Ziel. Relevanz spielt, wenn auch in unterschiedlicher Weise, ebenfalls in beiden Systemen
eine wichtige Rolle. Im Journalismus soll die Information dem Rezipienten dienen. In seiner
klassischen Funktion als Gatekeeper wählt der Redakteur gemäß der Nachrichtenwerttheorie
diejenigen Informationen aus, die er als besonders wichtig für das Publikum erachtet. Die
Relevanz einer wissenschaftlichen Arbeit wird an ihrem Beitrag zur Wissenserweiterung und
ihren Anwendungsmöglichkeiten gemessen. Gemein ist Forschern und Journalisten außerdem
eine skeptische Grundhaltung sowie im Idealfall eine ständige Selbstreflektion und
Selbstkritik.
161 Vgl. KRASSUSKI: Qualitätskriterien in der Umweltberichterstattung, S. 11. Krassuski bezieht sich an dieser Stelle auf ein unveröffentlichtes Manuskript von Wormer. 162 DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice, S. 10. 163 Vgl. ebd., S. 11. 164 Vgl. ebd. 165 Vgl. KLAMMER: Empirische Sozialforschung, S. 66f. 166 Vgl. ebd., S. 61. 167 Vgl. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice, S. 27. 168 Vgl. LEIF: Leidenschaft, S. 16f.
28
Sehr unterschiedlich ist die Rolle des Faktors Zeit in beiden Systemen. Während im
Journalismus Aktualität von zentraler Bedeutung ist, betonen die Empfehlungen der DFG,
dass die Qualität nicht dem Publikationsdruck zum Opfer fallen darf. In der Wissenschaft
herrscht de facto auch Zeitdruck (schließlich gebührt demjenigen der Ruhm, der die
Entdeckung als Erster macht). Dennoch arbeiten beiden Systeme auf unterschiedlichen
Zeitskalen: Journalistische Produkte werden meist innerhalb von Stunden, Tagen oder
höchstens Wochen produziert. Wissenschaftliche Forschung benötigt oft Monate und Jahre,
bis sie zu einer Veröffentlichung gereift ist.
Damit der Journalismus seiner Aufgabe nachkommen und alle Menschen zur
gesellschaftlichen Teilhabe befähigen kann, muss er Themen verständlich und ansprechend
darstellen. Die Art der Vermittlung ist also elementar. Zwar spielt Verständlichkeit auch in der
Wissenschaft eine Rolle, jedoch nur im Rahmen eines ohnehin schon interessierten
Fachpublikums. 169
Die Vorgehensweise in der Wissenschaft ist insgesamt stärker reglementiert als diejenige im
Journalismus, was sich beispielsweise im Peer-Review-Verfahren niederschlägt.170 Zudem
haben Transparenz und die Offenlegung des Erkenntniswegs in der Wissenschaft einen enorm
hohen Stellenwert.171 Im Journalismus hingegen steht das Endprodukt im Fokus des Interesses.
Der Rechercheweg wird in der Regel nicht angegeben.172 Die Angabe von Quellen ist im
Journalismus nur teilweise üblich und nur, sofern dies nicht im Widerspruch zum Schutz der
Informanten steht.
2.2.4 Datenjournalismus
Die in Abschnitt 2.1.8 eingeführte Definition von Datenjournalismus erfüllt alle in Abschnitt
2.1.4 genannten Kriterien einer journalistischen Recherche. Als solche wird sie von
Journalisten in oder für Redaktionen betrieben und spielt sich somit im System Journalismus
ab. Diese Punkte legen nahe, dass für den Datenjournalismus die in Abschnitt 2.2.1
eingeführten Qualitätskriterien des Journalismus gelten.173
169 Vgl. KLAMMER: Empirische Sozialforschung, S. 31. 170 Vgl. ebd., S. 29. 171 Vgl. ebd., S. 62. 172 zit. nach ebd., S. 31. 173 Anna-Lena Krampe betrachtet in ihrer Masterarbeit sogenannte primäre Qualitätskriterien, die sich in großen Teilen mit den hier betrachteten Kriterien Decken und sekundäre Qualitätskriterien, die sich auf die äußeren Umstände, beispielsweise die Ausbildung im Bereich des Datenjournalismus beziehen. Diese sekundären Aspekte werden in dieser
29
In Abschnitt 2.1.8 wurde die Nähe des Datenjournalismus zum Präzisionsjournalismus
erläutert, bei dem der Journalist die Rolle eines Sozialforschers einnimmt. In Anbetracht
dieser Verortung kann man sich also fragen, ob für Datenjournalisten zusätzlich auch
wissenschaftliche Qualitätskriterien gelten sollten. Oben wurde bereits erläutert, dass
Journalismus und Wissenschaft den Wahrheits- und den Neuigkeitsgedanken teilen. Im
Journalismus spielen darüber hinaus Aktualität und Vermittlung eine Rolle. In der
Wissenschaft taucht vor allem die Transparenz als zusätzliches Kriterium auf. Muss sie für
den Datenjournalismus also einfach zum Kanon der Qualitätskriterien hinzugefügt werden?
Dass dieser Schritt sinnvoll ist, ergibt sich aus den folgenden Überlegungen.
Die Qualitätskriterien von Journalismus und Wissenschaft weichen, wie in Abschnitt 2.2.3
erläutert wurde, zumindest im Hinblick auf den Wahrheitsgedanken nicht sehr weit
voneinander ab. Was sich wirklich stark unterscheidet, sind die Anforderungen, die erfüllt sein
müssen, damit ein Qualitätskriterium als zufriedenstellend umgesetzt angesehen wird.
Während in der Wissenschaft Ergebnisse erst nach einem Peer-Review-Verfahren und der
Diskussion durch die Community als halbwegs gesichert gelten, reicht dafür im Journalismus
oft die Aussage zweier unabhängiger Quellen. Die Frage ist also weniger, ob
wissenschaftliche Qualitätskriterien für Datenjournalisten gelten, sondern ob man von ihnen
einen ebenso stark reglementierten Prozess zur Qualitätssicherung verlangen sollte wie von
Wissenschaftlern. In der Praxis ist ein solcher Prozess allein aufgrund des Aktualitätsdrucks
nicht umsetzbar. Die Forderung nach der Befolgung eines solchen Prozesses würde
Datenjournalismus also unmöglich machen. Was bedeutet das für datenjournalistische
Ergebnisse? Dürfen sie nicht veröffentlicht werden, weil sie mit wissenschaftlichen
Werkzeugen gewonnen wurden, aber nicht den reglementierten Prozess wissenschaftlicher
Überprüfung durchlaufen haben? Dies ist klar zu verneinen. Ergebnisse dürfen lediglich nicht
so präsentiert werden, als wären sie wissenschaftlich geprüft. So wie im Journalismus
allgemein die Sorgfaltspflicht die Pflicht zur Wahrheit ersetzt, sollte daher im
Datenjournalismus die Offenlegung der eigenen Vorgehensweise den wissenschaftlichen
Überprüfungsprozess ersetzen. Das wissenschaftliche Qualitätskriterium der Transparenz gilt
also auch für den Datenjournalismus. Dass Rohdaten bei datenjournalistischen Projekten in
der Regel veröffentlicht werden, trägt zur Erfüllung dieses Kriteriums bei.174
Arbeit aus forschungsökonomischen Gründen außer Acht gelassen. Vgl. KRAMPE: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus, S. 67. 174 Vgl. dazu auch IHLE: Datenjournalismus - ein neues journalistisches Arbeitsfeld?, S. 67.
30
Weiter oben wurde argumentiert, dass die Nähe des Datenjournalismus zu wissenschaftlichen
Methoden die Forderung nach einem wissenschaftlichen Überprüfungsprozess nahelegt. Es
könnte jedoch auch argumentiert werden, dass unabhängig von den Methoden alle anderen
journalistischen Bereiche ebenfalls eines solchen Überprüfungsprozesses bedürfen. Da aber
auch hier ein solcher Prozess nicht geleistet werden kann, folgt aus dieser Überlegung für
nicht-datenjournalistische Projekte ebenfalls die Forderung nach maximaler Transparenz
(sofern mit dem Informantenschutz vereinbar).
Gelten für den Datenjournalismus also überhaupt andere Qualitätsmaßstäbe als für den
Journalismus im Allgemeinen? Wenn, dann nur insofern, als die Transparenz aus zwei
Gründen eine besonders wichtige Rolle spielt: Zum einen verwendet Datenjournalismus
Methoden, die bisher nicht zu den journalistischen Kernkompetenzen zählten. Transparenz
kann helfen, eventuelle Zweifel an dieser neuen Vorgehensweise auszuräumen. Zum anderen
kommt dem Datenjournalismus aufgrund seiner Faktenbasiertheit ein besonderer
Wahrhaftigkeitsanspruch zu. Dass dieser aber nicht unbedingt der gleiche ist wie bei
wissenschaftlichen Ergebnissen, gilt es durch die Offenlegung der Methoden klarzustellen.
In die Frage danach, ob Datenjournalisten wissenschaftlich arbeiten sollten, mischt sich häufig
eine Skepsis, ob sie die Methoden, deren Beherrschung nicht zu den klassischen
journalistischen Kernkompetenzen gehört, korrekt anwenden können. Die Beherrschung der
Analysemethoden stellt in der Tat besondere Anforderungen an Datenjournalisten. Im Grunde
gilt hier aber nur das, was für alle Journalisten gilt: Man muss seine Werkzeuge
beherrschen.175 Grundsätzlich gilt es, mit größtmöglicher Sorgfalt vorzugehen und im Zweifel
einen Fachmann zu fragen.
Zusammenfassend lässt sich sagen, dass für Datenjournalisten die gleichen Qualitätskriterien
gelten wie für andere Journalisten auch. Eine Umsetzung der Qualitätskriterien wie sie in der
Wissenschaft üblich ist, kann im System Journalismus nicht gefordert werden. So wie bereits
die Pflicht zur Sorgfalt im Journalismus die Pflicht zur Wahrheit ersetzt, sollte die Pflicht zur
Transparenz die Pflicht zur wissenschaftlichen Vorgehensweise ersetzen. Dies gilt nicht nur,
aber insbesondere für den Datenjournalismus.
175 Bei Klammer finden sich einige Aussagen dazu, was Journalisten generell über den Umgang mit Daten wissen sollten. Vgl. z.B. KLAMMER: Empirische Sozialforschung, S. 10, 17, 18. Welche Anforderungen Datenjournalisten im Einzelnen erfüllen müssen, kann in dieser Arbeit nicht weiter behandelt werden. Vgl. dazu z.B. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 28f.
31
2.3 Arbeitsprozesse
2.3.1 Journalistischer Rechercheprozess
2.3.1.1 Schritte des journalistischen Rechercheprozess
Wie in Abschnitt 2.2.4 dargelegt wurde, ist Datenjournalismus nach den Definitionen dieser
Arbeit ein journalistischer Rechercheprozess. Es stellt sich daher die Frage, in wie weit sich
die in der Literatur genannten Arbeitsschritte des herkömmlichen (nicht-datenjournalistischen)
Rechercheprozesses auf den Datenjournalismus anwenden lassen. Im Folgenden werden
zunächst die typischen Arbeitschritte der herkömmlichen journalistischen Recherche erläutert.
Inwieweit diese mit dem Datenjournalismus kompatibel sind, wird später in Abschnitt 2.4.1
diskutiert.
Recherche variiert von Fall zu Fall in einer Weise, die es schwierig macht, ein allgemeines
Schema für sie zu finden. Mast schreibt: „Recherche ist ein lebendiger und oft auch spontaner
Prozess, der kaum jemals nach einem einheitlichen Muster ablaufen kann“176. Ludwig spricht
von einer „rollenden Planung“177, die sich im Verlauf je nach Bedarf stärker oder schwächer
ändern kann. Wie die Recherche aussieht, hängt vom Berufsbild des einzelnen Journalisten,178
vom Rechercheziel, der Thematik sowie von finanziellen und zeitlichen Einschränkungen
ab.179 Es gibt jedoch gewisse Muster „die oftmals wiederkehren und an denen sich ein
Journalist orientieren kann“ 180 . Leif beispielsweise stellt einen Acht-Punkte-Plan der
Recherche vor und fügt relativierend hinzu: „Dieses systematische Vorgehen ist keine
Musterlösung [...]. Dennoch ist das dargestellte Verfahren eine sehr gute und mannigfach
erprobte Variante, um zeitlich und qualitativ zu einem wesentlich effektiveren Arbeitsergebnis
zu kommen“181.
Im Folgenden werden einige dieser typischen Rechercheschritte erläutert. Sie lassen sich
letztlich alle auf drei zentrale Handlungen zurückführen, die auf die Beantwortung der sechs
W-Fragen (Wer? Was? Wann? Wo? Wie? Warum?) abzielen: 1) Das Einholen von
Informationen 2) Die Bewertung und Einordnung von Informationen, Quellen und
Hypothesen 3) Reflektion über Zusammenhänge, Motive und Ursachen. Die im Folgenden
176 MAST: ABC des Journalismus, S. 240; vgl. auch KLAMMER: Empirische Sozialforschung, S. 29. 177 LUDWIG, Johannes: Investigativer Journalismus. Konstanz, 2007, S. 81. 178 Vgl. MAST: ABC des Journalismus, S. 239. 179 Vgl. ebd., S. 240; vgl. auch LUDWIG: Investigativer Journalismus, S. 81. 180 MAST: ABC des Journalismus, S. 240. 181 LEIF: Leidenschaft, S. 22.
32
erläuterten Arbeitsschritte überlappen sich teilweise inhaltlich. Dennoch können sie als
Anhaltpunkt bei der Vorgehensweise dienen. Wie die kombinierbaren Bausteine eines
Baukastens, müssen sie nicht immer alle im Arbeitsprozess vorkommen.182 Einen Anspruch
auf Vollständigkeit der aufgelisteten Schritte kann es angesichts der Flexibilität des Prozesses
nicht geben.
I) Recherche-Impuls / Ausgangsfrage
Laut Leif kann eine Recherche auf vier unterschiedliche Weisen angestoßen werden. Der
Impuls kann aus dem Alltagsgeschäft, zum Beispiel aus einer Agenturmeldung stammen.
Recherchen können auch durch Redaktionskonferenzen oder externe Informanten angestoßen
werden. Oder aber man widmet sich der Frage: „Was ist eigentlich aus dem damaligen Thema
XY geworden“183. Haller sieht die Rolle des Journalisten bei der Themenfindung eher
passiv. 184 Für Machill hingegen ist die Themenwahl „immer eine aktive Suche mit
gleichzeitiger Bewertung der Relevanz“185.
II) Einschätzung der Relevanz des Themas/ der Informationen
Laut Leif dient die Einschätzung der Themen-Relevanz zum einen dazu, „die grobe
Stoßrichtung“ vorzugeben. Zum anderen soll sie helfen, „die meist knapp bemessenen
redaktionellen Mittel angemessen einzusetzen“186. Der Journalist muss sich also fragen, ob das
Thema wichtig und interessant genug ist, um den Aufwand einer Recherche zu
rechtfertigen.187
III) Sich einen Überblick über das Thema/ die Akteure verschaffen
Schon vor der eigentlichen Recherche sollte der Journalist sich „Gedanken über die für die
Recherche notwendigen Basiskenntnisse machen. Auf welchen Gebieten muss er sich
Grundlagenwissen verschaffen, um überhaupt einigermaßen kompetente Gespräche führen zu
können, um wesentliche von überflüssigen Dokumenten unterscheiden zu können?“188 Meier
empfiehlt, sich zu Beginn der Recherche einen Überblick über die Konfliktparteien zu
verschaffen.189
182 Vgl. ebd., S. 22f. 183 Ebd., S. 17; vgl. auch HALLER: Recherchieren, S. 84. 184 Vgl. MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 35. 185 Ebd. 186 LEIF: Leidenschaft, S. 17. 187 Vgl. ebd.; vgl. auch HALLER: Recherchieren, S. 84; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 188 BRENDEL/BRENDEL: Richtig recherchieren, S. 81. 189 Vgl. MEIER: Internet-Journalismus, S. 326.
33
IV) Planung der Recherche
In jedem Fall sollten zu Beginn die Kernfragen der Recherche identifiziert werden.190 Jeker
schreibt: „Bei der konkreten Recherche ist zunächst am Schreibtisch – und ohne Computer –
zu überlegen: Welche Frage will ich in den Griff bekommen?“191 Außerdem gilt es, sofern
nicht bereits geschehen, sich „über mögliche Quellen und Interessen bewusst werden“192. Auf
Basis dieser Überlegungen kann dann das passende Werkzeug für die Recherche ausgewählt
und ein absehbarer Recherchetypus bestimmt werden.193 Ludwig empfiehlt zudem, Kosten-
Nutzen-Überlegungen anzustellen und einen konkreten Rechercheplan bzw. eine
Planungsskizze zu erstellen.194
V) Überprüfung der Sachinformationen
Nach Leif beginnt grundsätzlich jede Recherche „mit der Überprüfung der dem jeweiligen
Thema zugrunde liegenden ersten Sachverhalts-Informationen“195. Dieser Schritt umfasst
sowohl die Fakten- als auch die Quellenkontrolle und orientiert sich an den „den ersten vier
der sechs berühmten, uralten ‚W’-Fragen“196: Wer? Was? Wann? Wo? Der Journalist sollte
sich fragen, ob sich die Informationen objektivierbar belegen lassen und wie distanziert die
Quelle zum Sachverhalt ist.197
VI) Erweiterung der Sachinformationen
In diesem Schritt werden die Sachverhaltsinformationen erweitert, vertieft und
vervollständigt.198 Dazu muss der Journalist zunächst den eigenen Erkenntnisstand einschätzen
und offene Fragen erkennen. Nach Leif geht es darum, eine „genauere Beschreibung des
Geschehens zustande zu bringen“ und die so „verdichteten Informationen so präzis wie
möglich miteinander zu verknüpfen“199. In diesem Schritt geht es maßgeblich um die Wie-
Frage.200
190 Vgl. ebd., S. 348. 191 JEKER, Rebecca: Online-Recherche. Strategien für die journalistische Recherche im Internet. In: Medienheft. (2001) http://www.medienheft.ch/uploads/media/k16_JekerRebecca.pdf [abgerufen am 21.08.2013]. 192 Ebd. 193 Vgl. BRENDEL/BRENDEL: Richtig recherchieren, S. 101; JEKER: Online-Recherche. Strategien für die journalistische Recherche im Internet.; LUDWIG: Investigativer Journalismus, S. 82. 194 Vgl. LUDWIG: Investigativer Journalismus, S. 82. 195 LEIF: Leidenschaft, S. 18; vgl. auch HALLER: Recherchieren, S. 84; HALLER, Michael (Hrsg.): Recherche-Werkstatt. Konstanz, 2001, S. 11; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34; MEIER: Internet-Journalismus, S. 326; ebd., S. 348. 196 HALLER: Recherchieren, S. 59. 197 Vgl. LEIF: Leidenschaft, S. 18; vgl. auch HALLER: Recherchieren, S. 59. 198 Vgl. HALLER: Recherchieren, S. 84; MAST: ABC des Journalismus, S. 240ff.; MEIER: Internet-Journalismus, S. 348; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 199 LEIF: Leidenschaft, S. 19. 200 Vgl. ebd.; HALLER (Hrsg.): Recherche-Werkstatt, S. 35.
34
VII) Aufstellen von Hypothesen
In diesem Arbeitsschritt werden die kausalen Zusammenhänge ergründet und in Hypothesen
über die Verantwortlichen und Betroffenen sowie die Ursachen, Folgen, Ziele und Gründe
ihres Handelns formuliert.201 Der Journalist beschäftigt sich nun mit der Deutungsebene,202
beleuchtet die Hintergründe und versucht herauszufinden, warum die am Geschehen
Beteiligten so gehandelt haben.203 Machill fordert, nicht nur für die Warum-Frage, sondern für
alle offenen W-Fragen Hypothesen auf Basis der vorliegenden Informationen zu bilden.204
VIII) Hypothesenüberprüfung
In diesem Schritt werden die Hypothesen durch weitere Recherchehandlungen überprüft.205
Gelingt dies nicht anhand des vorliegenden Materials, muss die Informationsbasis erweitert
werden, beispielsweise durch Interviews mit den am Geschehen Beteiligten.206
IX) Recherche-Abschluss
Die Recherche zu einem Abschluss zu bringen ist manchmal schwierig, denn offene Fragen
gibt es immer. Mast zitiert das Projektteam Lokaljournalisten: „Die Recherche ist nicht dann
zu Ende, wenn der Journalist alles weiß (dann dauert sie nämlich ewig), sondern wenn alle
naheliegenden Fragen beantwortet und die Zusammenhänge plausibel gemacht werden
können.“207 Ludwig rät abschließend zu einer rechtlichen Bewertung der Ergebnisse „im
Hinblick auf potentielle Gegenwehr“ sowie zu einer strategischen und ethischen Beurteilung
der geplanten Veröffentlichung.208
X) Produktion und Veröffentlichung des journalistischen Beitrags
Hauptziel des journalistischen Rechercheprozesses ist letztendlich die Umsetzung der
Nachforschungen, beispielsweise als Meldung, Bericht, Feature oder Reportage.209 Wie die
Produktionsschritte im Detail aussehen, unterscheidet sich nicht nur je nach Darstellungsform,
sondern auch je nach Art des verwendeten Mediums (Print, Online, Radio, Fernsehen).
201 Vgl. MAST: ABC des Journalismus, S. 240ff.; LEIF: Leidenschaft, S. 20; vgl. auch MEIER: Internet-Journalismus, S. 326. 202 Vgl. LEIF: Leidenschaft, S. 20. 203 Vgl. HALLER (Hrsg.): Recherche-Werkstatt, S. 65; vgl. auch HALLER: Recherchieren, S. 84. 204 Vgl. MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34. 205 Vgl. z.B. HALLER: Recherchieren, S. 84. 206 Vgl. LEIF: Leidenschaft, S. 21; MEIER: Internet-Journalismus, S. 326; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34; BRENDEL/BRENDEL: Richtig recherchieren, S. 15. 207 MAST: ABC des Journalismus, S. 249; vgl. auch LEIF: Leidenschaft, S. 21f. 208 Vgl. LUDWIG: Investigativer Journalismus, S. 82. 209 Vgl. LEIF: Leidenschaft, S. 22; vgl. auch HALLER: Recherchieren, S. 84; MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 34.
35
XI) Begleitende Dokumentation
Als wichtiger Bestandteil des Rechercheprozesses wird in der Literatur die Dokumentation der
einzelnen Arbeitsschritte genannt.210 Zum einen wappnet der Journalist sich auf diese Art
gegen eventuelle spätere Anfeindungen oder Zweifel. Zum anderen kann somit bei folgenden
Recherchen auf die schriftlich festgehaltenen Informationen und Quellenangaben
zurückgegriffen werden.211
Der Ablauf und die Umsetzung der Rechercheschritte sind bestimmt durch Strategien wie
„von außen nach innen“ und „in die Tiefe, nicht in die Breite“ recherchieren. 212 Zudem gibt
es unterschiedliche Methoden, wie beispielsweise das „Pendeln“ oder das „Puzzlespiel“. 213
Der Recherchetyp kann von einer einfachen Basis- und Erweiterungsrecherche214 bis hin zur
verdeckten Recherche oder Enthüllung reichen. 215
Die Schritte des journalistischen Rechercheprozesses können mit verschiedenen Werkzeugen
umgesetzt werden. Dazu gehören heutzutage die E-Mail-Korrespondenz, das Gespräch
(persönlich oder per Telefon) sowie das Konsultieren von Online-Quellen, Büchern,
Zeitschriften oder Datenbanken. 216 Wie diese Werkzeuge während der journalistischen
Recherche genutzt werden, war und ist Gegenstand verschiedener Untersuchungen.217 Die
Frage nach den unterschiedlichen Werkzeugen von herkömmlicher und datenjournalistischer
Recherche wird in Abschnitt 2.4.1 aufgegriffen.
2.3.2 CRISP-DM: Ein Standardprozess für Data-Mining
Wie in den Abschnitten 1.1 und 1.2 erläutert, wird in dieser Arbeit ein Vergleich zwischen
datenjournalistischer Arbeitsweise und einem Standardprozess für Data-Mining vorgenommen.
Für den späteren Vergleich wird im Folgenden dieser Standardprozess beschrieben.
CRISP-DM ist ein Akronym für „CRoss-Industry Standard Process for Data Mining“, was in
etwa übersetzt werden kann mit „Industrieübergreifender Standard-Prozess für Data-
210 Vgl. LUDWIG: Investigativer Journalismus, S. 79; LEIF: Leidenschaft, S. 23. 211 Vgl. z.B. BRENDEL/BRENDEL: Richtig recherchieren, S. 69. 212 Vgl. MEIER: Internet-Journalismus, S. 325. 213 Vgl. MAST: ABC des Journalismus, S. 242; BRENDEL/BRENDEL: Richtig recherchieren, S. 104; ebd., S. 121. 214 Vgl. HALLER: Recherchieren, S. 69. 215 Vgl. MAST: ABC des Journalismus, S. 242; Erläuterungen zu verschiedenen Recherchetypen finden sich auch ebd., S. 244, 246; HALLER (Hrsg.): Recherche-Werkstatt, S. 97, 125, 159, 169, 189. 216 Vgl. z.B. BRENDEL/BRENDEL: Richtig recherchieren, S. 14; KLAMMER: Empirische Sozialforschung, S. 31. 217 Machill et al. beispielsweise untersuchen, wie Zeitungs-, Fernseh- und Hörfunkjournalisten das Internet bei der Recherche nutzen. Für eine Übersicht über weitere Studien siehe auch STIGLER, SOPHIE: Recherchestrategien im Netz. Das Suchvorgehen von Fachexperten, Netzexperten und Laien im Test. Masterarbeit an der TU Dortmund, 2013, S. 26ff..
36
Mining“.218 Der Standardprozess wurde Ende der 90er Jahre von drei Pionieren des Data-
Mining-Marktes (NCR, SPSS und Daimler AG) entwickelt. 219 Industrielle Data-Mining-
Projekte werden meist von einem Datenanalysten für Unternehmen durchgeführt, die aus den
eigenen Daten Erkenntnisse gewinnen und daraus einen Nutzen für das Unternehmen ziehen
möchten. Ziel eines solchen Projekts kann es zum Beispiel sein, Kunden vom Wechsel zu
einem anderen Anbieter abzuhalten.220 Die Erschaffer von CRISP-DM wollten durch die
Einführung eines Standards verhindern, dass jeder Neuling im Bereich Data-Mining immer
wieder alles durch Versuch und Irrtum von neuem herausfinden muss.221Außer CRISP-DM
wurden noch einige andere Standardprozesse entwickelt. 222 Mehrere Umfragen auf der
Internetseite des KDD-Pioniers Piatetsky-Shapiro weisen jedoch darauf hin, dass CRISP-DM
der meist genutzte Standardprozess sein könnte.223 Die Erfinder des Konzepts schreiben
dessen Erfolg dem starken Anwendungsbezug zu.224
Die vier Ebenen von CRISP-DM
Das CRISP-DM-Konzept ist in vier Ebenen gegliedert, die den Data-Mining-Prozess vom
allgemeinen bis hin zum speziellen Vorgehen beschreiben. Auf der ersten, allgemeinsten
Ebene stehen die Phasen des Data-Mining-Prozesses. Sie bestehen jeweils aus mehreren
generischen Aufgaben, die möglichst alle denkbaren Data-Mining-Prozesse und –
Anwendungen abdecken sollen und somit die zweite Ebene bilden. Die dritte Ebene
beschreibt, wie diese Aufgaben sich in jeweils unterschiedlichen Situationen unterscheiden.225
„Auf der vierten Ebene, der Ebene der Prozessinstanz, werden die Aktionen, Entscheidungen
und Ergebnisse eines tatsächlichen Data-Mining-Projekts aufgezeichnet. Eine Prozessinstanz
ist entsprechend den Aufgaben strukturiert, die auf den höheren Ebenen definiert sind, stellt
jedoch dar, was in einem bestimmten Projekt tatsächlich geschehen ist, statt allgemein zu
bleiben.226 Die vier Ebenen sind in Abbildung 2 dargestellt.
218 Unter Data-Mining wird hier offenbar der gesamte Prozess der Wissensgewinnung in Datenbanken verstanden (siehe dazu auch Kapitel 2.1.7). 219 Vgl. CHAPMAN, Pete u. a.: CRISP-DM 1.0. (2000) http://www.the-modeling-agency.com/crisp-dm.pdf [abgerufen am 21.08.2013]. 220 Vgl. ebd., S. 14. 221 Vgl. ebd., S. 1. 222 Dazu zählt beispielsweise der SEMMA-Prozess der Software-Firma SAS: http://www.sas.com/offices/europe/uk/technologies/analytics/datamining/miner/semma.html [abgerufen am 5.8.2013] 223 Vgl. PIATETSKY-SHAPIRO, Gregory: Poll: Data Mining Methodology. In: KDnuggets. (2007) http://www.kdnuggets.com/polls/2007/data_mining_methodology.htm [abgerufen am 21.08.2013]. 224 Vgl. CHAPMAN u. a.: CRISP-DM 1.0, S. 2. 225 Vgl. IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - ein Leitfaden. (2011) ftp://public.dhe.ibm.com/common/ssi/ecm/de/ytw03084dede/YTW03084DEDE.PDF [abgerufen am 21.08.2013]. 226 Vgl. IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden., S. 3; vgl. auch CHAPMAN u. a.: CRISP-DM 1.0, S. 6.
37
Abbildung 2 Die vier Ebenen von CRISP-DM (eigene Darstellung nach Chapman et al.227)
Zu der Phase „Datenaufbereitung“ gehört zum Beispiel die generische Aufgabe „Daten
bereinigen“. Bei den speziellen Aufgaben muss dann unterschieden werden, ob zum Beispiel
„numerische oder kategoriale Werte bereinigt werden sollen“228. Auf der vierten Ebene
könnte dann zum Beispiel festgehalten werden, dass dem vorliegenden Projekt
Beobachtungen mit fehlenden oder unsinnigen Werten ausgeschlossen wurden.229
Die sechs Phasen von CRISP-DM
Im letzten Abschnitt wurden bereits die Phasen von CRISP-DM als oberste von vier Ebenen
eingeführt. In Abbildung 3 sind die sechs Phasen von CRISP-DM in einem Flussdiagramm
dargestellt. Die Pfeile bezeichnen dabei die häufigsten Beziehungen zwischen ihnen.230 Die
Autoren betonen jedoch, dass Beziehungen prinzipiell zwischen allen Phasen bestehen
können.231 Der äußere Kreis symbolisiert die zyklische Natur von Data-Mining insgesamt.232
Im Folgenden werden die generischen Aufgaben der sechs Phasen erläutert.
227 Vgl. CHAPMAN u. a.: CRISP-DM 1.0, S. 6. 228 IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden., S. 3. 229 Vgl. WEIHS, CLAUS: Data Mining Konzept CRISP-DM. Skript TU Dortmund SoSe 2003, 2003, S. 24. 230 Vgl. CHAPMAN u. a.: CRISP-DM 1.0, S. 10. 231 Vgl. ebd. 232 Vgl. ebd.
38
Abbildung 3 Die sechs iterativen Phasen von CRISP-DM (Eigene Darstellung nach Capman et al.233)
I) Untersuchung der Geschäftsziele (Business Understanding)234
Geschäftsziele bestimmen
Situation beurteilen
Data-Mining-Ziele bestimmen
Projektplan erstellen
In dieser Phase müssen die Ziele und Anforderungen des Projekts aus geschäftlicher
Perspektive („business perspective“235) verstanden werden. Aus diesem Verständnis heraus
wird das konkrete Data-Mining-Problem definiert und ein vorläufiger Plan zum Erreichen der
Ziele formuliert.
II) Datenuntersuchung (Data Understanding)
Anfangsdaten erfassen
Daten beschreiben
Daten untersuchen
Datenqualität prüfen
233 Vgl. ebd., S. 10. 234 Deutsche Übersetzung der Phasenbezeichnungen nach IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden. 235 CHAPMAN u. a.: CRISP-DM 1.0, S. 14.
39
Diese Phase beginnt mit der Datenerfassung. Die weiteren Arbeitsschritte dienen dazu, mit
den Daten vertraut zu werden, die Qualität der Daten zu beurteilen, erste Einblicke in die
Daten zu gewinnen und interessante Teilmengen in den Daten zu entdecken. Unter der
Aufgabe „Daten beschreiben“ verstehen Chapman et al. , dass die oberflächlichen
Eigenschaften der Daten wie Format, Umfang, Art der Einträge untersucht und dokumentiert
werden.236 Beim Erkunden der Daten werden erste einfache Analysen durchgeführt, die sich
entweder direkt auf die Data-Mining-Aufgabe des Projekts beziehen, oder der Aufbereitung
der Daten dienen. Erste Visualisierungen können hierbei hilfreich sein.237 Bei der Überprüfung
der Datenqualität sollte geklärt werden, ob die Daten vollständig sind sowie ob und – wenn ja
– wie häufig Fehler auftreten.238
III) Datenaufbereitung (Data Preparation)
Daten auswählen
Daten bereinigen
Daten erstellen
Daten integrieren
Daten formatieren
Diese Phase umfasst alle Schritte, die nötig sind, um aus den Rohdaten den Datensatz zu
erstellen, der letztendlich zur Modellierung oder der eigentlichen Analyse dienen soll (Zur
Definition des Modell-Begriffs in der Statistik, siehe Abschnitt 2.1.6). „Zu den Aufgaben
gehören die Auswahl von Tabellen, Datensätzen und Attributen sowie die Transformation und
Bereinigung von Daten für Modellierungstool[s]“239.
IV) Modellierung (Modeling)
Modellierungsverfahren auswählen
Testdesign generieren
Modell erstellen
Modell beurteilen
236 Vgl. ebd., S. 18. 237 Vgl. ebd., S. 19. 238 Vgl. ebd. 239 IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden., S. 5.
40
In dieser Phase werden Modellierungstechniken wie zum Beispiel Clustering, künstliche
neuronale Netzwerke oder Nächste-Nachbarn-Algorithmen entsprechend des Problemtyps
ausgewählt und angewendet. 240 Mit ihrer Hilfe wird ein Modell erstellt und dessen Parameter
so gut wie möglich angepasst. Da manche Techniken bestimmte Anforderungen an die Daten
stellen, ist häufig eine erneute Datenaufbereitung erforderlich.
V) Auswertung (Evaluation)
Ergebnisse auswerten
Prozess prüfen
Weitere Schritte festlegen
Um sicherzugehen, dass das in IV) entwickelte Modell die geschäftlichen Anforderungen
erfüllt, wird es in dieser Phase sorgfältig ausgewertet und die einzelnen Schritte, die zu seiner
Entwicklung geführt haben, werden überprüft. Dabei wird insbesondere kontrolliert, ob ein
wichtiges Geschäftsziel nicht genug berücksichtigt wurde. Am Ende dieser Phase wird
entschieden, wie die Ergebnisse des Data-Mining genutzt werden sollen.
VI) Bereitstellung (Deployment)
Bereitstellung planen
Monitoring und Wartung planen
Schlussbericht erstellen
Projekt prüfen
Das vom Modell erzeugte Wissen wird in dieser Phase so organisiert und präsentiert, dass der
Kunde es verwerten kann. In manchen Fällen reicht es, einen Bericht über das Projekt zu
schreiben. In anderen Fällen muss vielleicht ein Computerprogramm geschrieben werden, mit
dem der Data-Mining-Prozess jederzeit im Unternehmen wiederholbar ist. Oft nimmt nicht
der Datenanalyst, sondern der Kunde die Bereitstellung vor.241
240 Einen Überblick über typische Data-Mining-Probleme und Lösungsansätze bietet CHAPMAN u. a.: CRISP-DM 1.0, S. 66ff. 241 Vgl. ebd., S. 28 f.
41
2.3.3 Datenjournalistischer Arbeitsprozess
Für den anstehenden Vergleich von Datenjournalismus mit klassischer journalistischer
Recherche und CRISP-DM soll hier nun der datenjournalistische Arbeitsprozess beschrieben
werden. Diese Beschreibung beruht auf der Extraktion typischer Arbeitsschritte aus
Literaturquellen.242 Wie schon bei der journalistischen Recherche, können manche dieser
Arbeitsschritte wegfallen mehrfach oder in unterschiedlicher Reihenfolge erfolgen.243
I) Ausgangsfrage oder -hypothese haben
Häufig werden in der Literatur zwei verschiedene Ausgangspunkte für eine
datenjournalistische Recherche genannt. Entweder die Fragestellung oder das Thema existiert
schon und soll anhand von Daten überprüft werden, oder die Recherche wird „durch den
Datensatz selbst angestoßen“244. Laut Thibodeaux beginnen großartige datenjournalistische
Projekte meist nicht mit großartigen Datensätzen, sondern mit bedeutsamen Fragen.245 Meyer
geht so weit zu sagen, dass man ohne Theorie in den ungeordneten Rohdaten zu ersticken
droht.246
II) Daten beschaffen
Die Beschaffung von Daten kann auf die unterschiedlichsten Weisen geschehen, sei es durch
öffentlich zugängliche Quellen im Netz, durch Inanspruchnahme des
Informationsfreiheitsgesetzes oder sonstige Informanten.247 Manche Datenjournalisten lesen
auch mit Hilfe von „Scraper“-Programmen gezielt Daten aus dem Netz aus.248 Manchmal kann
es sogar nötig sein, die Daten für eine bestimmte Story selbst zu erheben.249 Dabei kann in
manchen Fällen das Crowdsourcing, also die Online-Mitarbeit vieler Freiwilliger an einem
242 Die hier beschriebenen Arbeitsschritte haben teilweise Ähnlichkeiten mit dem von Alexander Haase in Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32 ff. in Anlehnung an den KDD-Prozess entwickelten Workflow. Allerdings ist bei Haase nicht ganz klar, ob es sich bei dem Workflow um einen Ist- oder Soll-Arbeitsprozess handelt. 243 Vgl. BRADSHAW, Paul und Liisa ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age. Harlow, Essex, New York, 2011, S. 51. 244 BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 23; vgl. auch BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 52; AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 10; THE GUARDIAN: How to be a data journalist. http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide [abgerufen am 17.04.2013]; HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 33. 245 Vgl. THIBODEAUX: 5 tips for getting started in data journalism. 246 Vgl. MEYER: Precision journalism, S. 13. 247 Vgl. z.B. HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 35ff.; ROGERS: Facts are sacred, S. 286. 248 Vgl. z.B. BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 56; THE GUARDIAN: How to be a data journalist. 249 Vgl. BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 55.
42
Projekt, von Nutzen sein.250 Liegt der Recherche eine Hypothese zugrunde, sollte bei der
Datenbeschaffung stets geprüft werden, ob die Daten geeignet sind, um die Hypothese zu
überprüfen.251
III) Daten vorbereiten und bereinigen
Liegen die Daten vor, so gilt es, sie in eine „einheitliche, maschinenlesbare Form“ zu bringen
und zu bereinigen.252 Beispielsweise müssen uneinheitliche Benennungen innerhalb eines
Datensatzes geändert werden. 253 Leßmöllmann spricht davon, die Daten „journalistisch
urbar“ zu machen und zitiert damit den britischen Datenjournalisten Simon Rogers.254 Zu
diesem Arbeitsschritt gehört auch, dass die Daten in das richtige Format gebracht werden.255
Manchmal müssen Daten beispielsweise erst aus einem PDF extrahiert und beispielsweise in
ein CSV-Format überführt werden, bevor mit dem eigentlichen bereinigen begonnen werden
kann.256
IV) Daten verstehen
Vor der weiteren Verarbeitung ist es wichtig, die Daten und ihren Kontext genau zu
verstehen.257 Dazu gehört beispielsweise, sich zu vergegenwärtigen, welche Definitionen bei
der Erhebung verwendet und welche Fälle dadurch ein- bzw. ausgeschlossen wurden.258 Im
Idealfall gibt es ein „data dictionary“ zu den Daten, also eine Datei, die viele dieser
Informationen enthält. 259 In den Bereich „Daten verstehen“ fällt auch der von Elmer
angegebene Arbeitsschritt „Aussagekraft und Vollständigkeit prüfen“.260 Dabei kann auch
bereits ersichtlich werden, dass für ein besseres Verständnis des Themas weitere Daten
beschafft werden müssen.261
250 Das Projekt Harassmap beispielsweise sammelt Berichte über sexuelle Übergriffe gegen Frauen in Ägypten auf einer interaktiven Landkarte. http://harassmap.org/en/ [abgerufen am 5.8.2013] 251 Vgl. AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 11. 252 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 24; vgl. auch ELMER: Kleine Einführung Datenjournalismus.; AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 10f. 253 Vgl. ROGERS: Facts are sacred, S. 291ff.; vgl. dazu auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 38f. 254 Vgl. LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen. 255 Vgl. BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 56. 256 Vgl. z.B. ROGERS: Facts are sacred, S. 290 f.; HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 37 f. 257 Vgl. z.B. THE GUARDIAN: How to be a data journalist. 258 Vgl. EGAWHARY, Elena und Cynthia O’MURCHU: Data Journalism (CAR). (2012) http://issuu.com/tcij/docs/data_journalism_book [abgerufen am 22.04.2013]; vgl. auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 34. 259 Vgl. DOIG, Steve: Basic Steps in Working with Data. In: Data Journalism Handbook. (2012) http://datajournalismhandbook.org/1.0/en/understanding_data_2.html [abgerufen am 21.08.2013]. 260 Vgl. ELMER: Kleine Einführung Datenjournalismus. 261 Vgl. ROGERS: Facts are sacred, S. 288.
43
V) Daten analysieren und verknüpfen
Die Analyse und Auswertung von Daten ist vielleicht das Kernstück des datenjournalistischen
Arbeitsprozesses. Sie scheint für die Erzeugung eines Mehrwerts unentbehrlich. „Analysieren
heißt, die Daten zu sortieren, Veränderungen, Durchschnitte, Verhältnisse, Kennzahlen oder
Mittelwerte auszurechnen und nach Auffälligkeiten zu suchen“ 262, schreibt Bons. Um solche
Auffälligkeiten zu finden, werden Daten häufig visualisiert263 (siehe auch Schritt X). Auch das
Berechnen vergleichbarer Parameter264 und das Filtern von Daten265 sind in dieser Phase von
Bedeutung. In manchen Fällen kann es nötig sein, mehrere Datensätze miteinander zu
verknüpfen.266 Typisches Beispiel für solch eine Verknüpfung (engl. Mash-up) ist das
Zusammenführen von ortsabhängigen Informationen mit den entsprechenden Geodaten.
VI) Daten in einen Kontext setzen und interpretieren
Laut Leßmöllmann ist die Einordnung und Interpretation der Daten unerlässlich für die
Erarbeitung einer journalistischen Geschichte: „Dazu gehört auch, sie [die Daten] mit anderen
Daten, aber auch mit Kontextinformationen und Hintergrundwissen in Beziehung zu setzen,
sie also einzuordnen [...], um dann schließlich Schlüsse daraus zu ziehen, die gesellschaftlich
relevant sind.“267
VII) Die journalistische Geschichte in den Daten identifizieren
Die Identifikation der journalistischen Geschichte in den Daten ist nicht klar von Aspekten
wie Daten verstehen, analysieren und in einen Kontext setzen abzugrenzen. Es handelt sich
hier vermutlich eher um einen Findungsprozess innerhalb des Arbeitsprozesses als um einen
einzelnen Schritt. Obwohl er schwer fassbar ist, scheint dieser Aspekt doch zentral zu sein.
Datenjournalisten erwähnen Aspekte wie „journalistische Themen finden“268, „Recherche-
Thesen identifizieren“269 oder „gesellschaftlich relevante Schlüsse ziehen“270. Bradshaw und
262 BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 24. 263 Vgl. auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32. 264 Vgl. ELMER: Kleine Einführung Datenjournalismus. 265 Vgl. ebd.; LORENZ: Status and Outlook for data-driven Journalism., S. 13. 266 Vgl. AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 10f.; THE GUARDIAN: How to be a data journalist.; BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 51; ROGERS: Facts are sacred, S. 290f.; MATZAT: Data Driven Journalism: Versuch einer Definition. 267 LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen.; vgl. auch ROGERS: Facts are sacred, S. 288; BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 58; HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 40f. 268 SÖFJER, Jan: Journalist: Datenjournalismus - Sprich mit Daten. In: Journalist. (2010). 269 ELMER: Kleine Einführung Datenjournalismus. 270 LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen.
44
Rohumaa schreiben: „Once you got the data, you need to see if there is a story buried within
it.“271
VIII) Recherche jenseits der Daten
Dieser Arbeitsschritt ist von dem Punkt „Daten in einen Kontext setzen und
interpretieren“ nicht unbedingt zu trennen. Er wird jedoch einzeln aufgeführt, um die
journalistische Komponente des datenjournalistischen Arbeitens hervorzuheben. Oft stößt die
Analyse von Daten eine Recherche mit klassischen journalistischen Methoden wie Interviews
und Befragungen an.272
IX) Ergebnisse überprüfen
Wichtiger Teil des datenjournalistischen Arbeitsprozesses ist die Überprüfung der Ergebnisse
und Berechnungen. Bradshaw und Rohumaa schreiben: „As a journalist you should double-
check your findings whenever possible with statisticians in the field you’re covering.“273 Zur
Überprüfung kann beispielsweise das Hinzuziehen einer zweiten Quelle gehören oder die
Überprüfung eines Ergebnisses vor Ort.274
X) Daten visualisieren
Die Visualisierung von Daten wurde für diese Arbeit nicht zur Bedingung für das Vorliegen
eines datenjournalistischen Erzeugnisses gemacht. Dieser Schritt muss also nicht zum
Arbeitsprozess gehören, wird es in der Regel aber tun. Wie unter Punkt V) erwähnt, ist
Visualisierung nicht nur bei der Veröffentlichung ein wichtiges Instrument, sondern kann
auch schon bei der Analyse hilfreich sein, „um Muster oder Auffälligkeiten zu entdecken“275.
Je nach Ressourcen des datenjournalistischen Projekts kann dieser Schritt sehr unterschiedlich
ausfallen. Von ihnen hängt unter anderem ab, ob der Datenjournalist selbst die Visualisierung
umsetzt oder ob sich ein Designer oder Programmierer des Projekts annimmt.276
271 BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 56; vgl. auch ROGERS: Facts are sacred, S. 293. 272 Im Workshop „Data Stories“, der im April 2013 in Hamburg stattfand, betonte Elmer diesen Aspekt. 273 BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 58; vgl. auch ROGERS: Facts are sacred, S. 288, 293; BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 24. 274 Vgl. LAFLEUR, Jennifer: A guide to Bulletproofing Your Data. In: GitHub https://github.com/propublica/guides [abgerufen am 17.08.2013]. 275 BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 24; vgl. auch BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 60. 276 Vgl. AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 10f.; THE GUARDIAN: How to be a data journalist.; BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 60.
45
XI) Endprodukt erstellen und veröffentlichen
Dieser Arbeitsschritt kann sich stark mit dem Punkt „Daten visualisieren“ überschneiden,
muss es aber nicht. Am Ende des Prozesses kann eine Geschichte, eine Grafik oder eine
andere Art der Visualisierung stehen. 277 Dabei können die Daten entweder eher im
Hintergrund stehen oder sie erzählen selbst die Geschichte und der Journalist muss sie nur so
aufbereiten, dass diese Geschichte möglichst klar zum Vorschein kommt.278 Sofern die Daten
nicht ohnehin mit veröffentlicht werden, sollte die Quelle der Daten genannt werden.279
XII) Rohdaten veröffentlichen und archivieren
Die Veröffentlichung von Rohdaten wird von vielen Datenjournalisten und Forschern als
wichtiger Arbeitsschritt angegeben. 280 Dieser Arbeitsschritt kann aber manchmal aus
datenschutzrechtlichen Gründen nicht oder nur bedingt umsetzbar sein. Bons weist darauf hin,
dass die Archivierung von Daten und Rechercheergebnissen bisher oft noch zu kurz kommt,
für Recherchen zu einem späteren Zeitpunkt aber sehr nützlich sein könnte.281
2.4 Arbeitsweisen im Vergleich
2.4.1 Datenjournalismus und herkömmliche journalistische Recherche
In Abschnitt 2.3.1 wurde die Frage aufgeworfen, inwiefern die Grundzüge der herkömmlichen
journalistischen Recherche auf den Datenjournalismus übertragbar sind. Dieser Frage soll hier
weiter nachgegangen werden. Tabelle 1 listet noch einmal die herausgearbeiteten Schritte
beider Prozesse auf.
Als vielleicht wichtigster Punkt lässt sich zunächst festhalten, dass die herkömmliche
journalistische Recherche, also die „Recherche jenseits der Daten“, im datenjournalistischen
Arbeitsprozess stets als Teilmenge enthalten ist. Doch in welchem Verhältnis steht der
gesamte datenjournalistische Ablauf zur herkömmlichen Recherche? Recherche-Impuls am
Anfang und Veröffentlichung eines Produkts am Ende jedenfalls haben beide Prozesse
gemeinsam.
277 Vgl. ROGERS: Facts are sacred, S. 293; vgl. auch ebd., S. 288; LEßMÖLLMANN: Datenjournalismus: Chance für den Journalismus von morgen. 278 Vgl. BRADSHAW/ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age, S. 50. 279 Vgl. MATZAT: Data Driven Journalism: Versuch einer Definition.; LANGER: Schaubild statt Klickstrecke. 280 Vgl. KRAMPE: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus, S. 14; BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 25; MATZAT: Data Driven Journalism: Versuch einer Definition.; AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 11. 281 Vgl. BONS: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien, S. 25.
46
Tabelle 1 Vergleich allgemeiner Rechercheprozess und datenjournalistischer Arbeitsprozess
Herkömmliche journalistische Recherche Datenjournalistischer Arbeitsprozess
1. Recherche-Impuls / Ausgangsfrage
2. Einschätzung der Relevanz
3. Schaffen eines Überblicks
4. Planung der Recherche
5. Überprüfung der Sachinformationen
6. Erweiterung der Sachinformationen
7. Hypothesenbildung
8. Hypothesenüberprüfung
9. Recherche-Abschluss
10. Produktion und Veröffentlichung
11. Begleitende Dokumentation
I. Ausgangsfrage oder –hypothese
haben
II. Daten beschaffen
III. Daten vorbereiten und bereinigen
IV. Daten verstehen
V. Daten analysieren und verknüpfen
VI. Daten in Kontext setzen und
interpretieren
VII. Journalistische Geschichte in den
Daten identifizieren
VIII. Recherche jenseits der Daten
IX. Ergebnisse überprüfen
X. Daten visualisieren
XI. Endprodukt erstellen und
veröffentlichen
XII. Rohdaten veröffentlichen und
archivieren
Im Folgenden werden daher vor allem die Schritte diskutiert, durch welche sich die
datenjournalistische von der herkömmlichen Recherche abhebt. Für diese Diskussion muss
klar sein, dass die Schritte beider Prozesse unterschiedlich komplex und daher nicht direkt
miteinander vergleichbar sind. Die Schritte 2 bis 8 des herkömmlichen Rechercheprozesses
beinhalten jeweils ein bestimmtes Ziel, zum Beispiel die Überprüfung einer Hypothese (Die
Nummerierung gibt keine Reihenfolge der Schritte an, sondern dient nur der Benennung). Die
Überschrift gibt also an, was am Ende des Schrittes erreicht worden sein soll, nicht aber auf
welche Weise. Die Schritte II, III, IV, V, VI, X und XII des datenjournalistischen Prozesses
hingegen beschreiben die durchgeführte Handlung, zum Beispiel Daten vorbereiten und
bereinigen, nicht aber das übergeordnete Ziel im Rechercheprozess. Bis auf die
Veröffentlichung der Rohdaten (Schritt XII) lassen sich jedoch alle diese datenjournalistischen
Schritte den Schritten des allgemeinen Rechercheprozesses unterordnen. So kann
beispielsweise das Analysieren und Verknüpfen von Daten dabei helfen, sich einen Überblick
über ein Thema zu verschaffen oder die gegebenen Informationen durch neu berechnete
47
Größen zu erweitern. Außerdem ist die Analyse Grundlage für die Bildung von Hypothesen
und kann auch zu deren Überprüfung dienen.
Das Veröffentlichen von Rohdaten (Schritt XII) ist eine Besonderheit des Datenjournalismus.
Bei nicht-datenjournalistischen Projekten werden in der Regel die Originaldokumente
bestenfalls archiviert, nicht aber mitveröffentlicht. Auch der Punkt VII „Journalistische
Geschichte in den Daten identifizieren“ fällt aus der Reihe. Obwohl er ein Ziel und keine
konkrete Handlung beschreibt, gibt es im herkömmlichen Rechercheprozess kein direktes
Äquivalent dazu. Eher ist dieser Schritt eine Mischung aus Recherche-Impuls, Relevanz-
Einschätzung und Hypothesenbildung.
Die datenjournalistischen Arbeitsschritte lassen sich im Wesentlichen den Schritten des
klassischen Rechercheprozesses zuordnen, da sie die gleichen Ziele verfolgen. Im
Datenjournalismus werden jedoch spezielle Mittel bei der Informationsbeschaffung und
Vermittlung angewandt. Die grundlegende Übereinstimmung bestätigt die Einordnung von
Datenjournalismus als journalistischem Rechercheprozess. Dass Datenjournalisten nach
Prinzipien wie „von außen nach innen“ vorgehen, kann aus dem Vergleich nicht abgeleitet,
sondern nur in Konsequenz gemutmaßt werden. Alleinstellungsmerkmal des
Datenjournalismus ist die Veröffentlichung der Rohdaten sowie das Auffinden von
Geschichten in den Daten. Über den Ablauf und die Beschaffenheit der speziell
datenjournalistischen Arbeitsschritte gibt der herkömmliche Rechercheprozess keine Auskunft.
Diese Schritte lassen sich eher im Data-Mining-Standardprozess CRISP-DM wiederfinden.
2.4.2 Datenjournalistischer Arbeitsprozess und CRISP-DM
Mit CRISP-DM wurde ein sehr detaillierter Standardprozess entwickelt. Über den
datenjournalistischen Arbeitsprozess hingegen gibt es in der Literatur eher bruchstückhafte
Informationen. Die unterschiedliche Informationslage macht einen Vergleich allein auf
Literaturbasis schwierig. Die zu diesem Vergleich angestellten Überlegungen sind im Detail in
Anhang II in Form von Schaubildern dargestellt. Im Folgenden werden die aus den
Überlegungen resultierenden Thesen über die Zusammenhänge zwischen beiden Prozessen
vorgestellt. Diese werden in Abschnitt 6.3 um die Aussagen von Experten ergänzt.
In Abschnitt 2.1.7 wurde Data-Mining als die Extraktion von gültigem, bisher unbekanntem
und potentiell nützlichem Wissen bezeichnet. Diese Beschreibung erinnert an die Definition
von Datenjournalismus, die in Abschnitt 2.1.8 für diese Arbeit aufgestellt wurde. Dort war
48
von der Generierung eines Mehrwerts aus den Daten die Rede. Allein in ihrer Definition
weisen Data-Mining und Datenjournalismus also eine gewisse Ähnlichkeit auf. Auch bei den
Begrifflichkeiten gibt es einige Übereinstimmungen. So ist beispielweise in beiden Fällen von
„Daten verstehen“ bzw. „Data Understanding“ die Rede. Geschäftsziele (Business Objectives)
hingegen tauchen im datenjournalistischen Arbeitsprozess nicht auf und die journalistische
Geschichte kommt als Begriff bei CRISP-DM nicht vor. Da der eine Prozess in der Industrie,
der andere im Journalismus beheimatet ist, überraschen die unterschiedlichen
Begrifflichkeiten nicht weiter.
Auch wenn die Kontexte der Prozesse sowie die Begriffe teilweise unterschiedlich sind, so ist
zu vermuten, dass sich viele Arbeitsschritte in analoger oder ähnlicher Weise auf den jeweils
anderen Prozess übertragen lassen. So ist beispielsweise anzunehmen, dass die journalistische
Geschichte oder das journalistische Produkt für Journalisten eine Art Geschäftsziel darstellt.
In ähnlicher Weise könnte die Veröffentlichung als Analogon zur Bereitstellung interpretiert
werden. Unklar ist, welcher Analysetechniken Datenjournalisten sich bedienen und ob diese
Techniken als Modellierung im Data-Mining-Sinn bezeichnet werden können. Aus den
unterschiedlichen Kontexten der beiden Prozesse resultiert, dass die journalistischen Aspekte
wie „Recherche jenseits der Daten“ oder „journalistische Geschichte in den Daten finden“ bei
CRISP-DM nicht zu finden sind. Auch die Veröffentlichung der Rohdaten scheint eine
Eigenheit des Datenjournalismus zu sein.
Im CRISP-DM-Prozess spielt insgesamt die Dokumentation der einzelnen Arbeitsschritte eine
wichtige Rolle. Es ist vorgesehen, dass Entscheidungen, Ergebnisse und Erfahrungen
sorgfältig protokolliert werden. Inwiefern Datenjournalisten ihre Arbeit durch Notizen,
Berichte oder Protokolle dokumentieren, lässt sich aus den vorliegenden Informationen nicht
befriedigend ersehen. Da Recherche als kreativer und spontaner Prozess gilt (siehe Abschnitt
2.3.1), ist zu vermuten, dass bei datenjournalistischen Projekten weniger strukturiert und
geplant vorgegangen wird als bei CRISP-DM, sondern eher dynamisch reagierend und kreativ.
Aus dem gleichen Grund fallen vermutlich auch Dokumentation, Planung und selbstreflexive
Prüfung im Datenjournalismus weniger ausführlich und reglementiert aus. Da es bisher keinen
Standardprozess für den Datenjournalismus gibt, könnte es sein, dass Datenjournalisten
bestimmte Schritte im Ansatz zwar ausführen, diese jedoch nicht bewusst als eigenständige
Schritte wahrnehmen und benennen.
49
Zusammenfassend lässt sich sagen, dass viele Schritte von CRISP-DM sich auf den
Datenjournalismus übertragen zu lassen scheinen. Zu einigen speziell journalistischen
Schritten enthält CRISP-DM kein Äquivalent. An manchen Stellen reicht die Literatur nicht
aus, um einen aussagekräftigen Vergleich anzustellen. Ob beispielsweise Datenjournalisten
Modellierung im Sinne von CRISP-DM anwenden, soll durch den empirischen Teil dieser
Arbeit geklärt werden.
3 Forschungsfragen
„Nur wer weiß, was er herausbekommen möchte, kann auch danach fragen.“ 282
Jochen Gläser, Grit Laudel
Im Theorieteil der Arbeit wurde der datenjournalistische Arbeitsprozess mit einem
Standardprozess für Data-Mining und der herkömmlichen journalistischen Recherche
verglichen (Kapitel 2.4.1 und 2.4.2, Abbildung 4).
Abbildung 4 Im Theorieteil vorgenommene Vergleiche
Die Leitfrage dieser Arbeit ist die nach der Eignung von CRISP-DM als Vorlage für eine
datenjournalistische Leitlinie. Der empirische Teil der Arbeit konzentriert sich daher auf den
linken Teil dieses Dreiecks (Abbildung 1). Beide Seiten dieses Dreiecks in einer empirischen
Untersuchung detailliert behandeln zu wollen, würde nicht nur den Rahmen dieser Arbeit,
sondern auch den zeitlichen Rahmen einer einzelnen Befragung sprengen (Zur Wahl des
Erhebungsinstruments siehe Kapitel 4.1). Es werden daher folgende Forschungsfragen
formuliert:
282 GLÄSER, Jochen und Grit LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen. Wiesbaden, 2010.
50
Forschungsfrage 1: Welche Schritte sind typisch für den datenjournalistischen
Arbeitsprozess?
Aussagen über den datenjournalistischen Arbeitsprozess kommen in der Literatur zwar vor,
oft allerdings nur in Form einzelner Fragmente oder einer sehr groben Unterteilung des
Arbeitsprozesses. Eine systematische Betrachtung wie bei Rogers 283 ist selten zu finden.
Insbesondere im theoretischen Vergleich mit CRISP-DM fehlten daher Detailinformationen
über das datenjournalistische Vorgehen. Die Forschungsfrage soll helfen, diese Wissenslücke
zu schließen und den Weg für weitere Untersuchungen des datenjournalistischen
Arbeitsprozesses ebnen.
Forschungsfrage 2: Welche Übereinstimmungen und welche Unterschiede existieren
zwischen dem datenjournalistischen Arbeitsprozess und CRISP-DM?
Wie in Kapitel 2.4.2 beschrieben wurde, legt der theoretische Vergleich nahe, dass sich einige
der CRISP-DM-Schritte im datenjournalistischen Arbeitsprozess in ähnlicher Form
wiederfinden. Um einschätzen zu können, ob der sorgfältig ausgearbeitete Data-Mining-
Standardprozess ein Anhaltspunkt für eine datenjournalistische Leitlinie sein könnte, müssen
die Übereinstimmungen und Unterschiede genauer herausgearbeitet werden.
Forschungsfrage 3: Ist CRISP-DM als Ausgangspunkt für die Entwicklung eines
datenjournalistischen Leitfadens geeignet?
Das Literaturstudium legt nahe, dass CRISP-DM in abgewandelter Form als Leitfaden für
datenjournalistische Projekte dienen könnte. Aber sehen das auch jene so, die Praxiserfahrung
auf diesem Gebiet haben? Diese Frage soll Aufschluss darüber geben, ob Datenjournalisten
CRISP-DM als hilfreich für ihr Arbeitsgebiet erachten.
Forschungsfrage 4: In welchem Verhältnis stehen herkömmliche und
datenjournalistische Recherche zueinander?
Die theoretischen Überlegungen legen nahe, dass datenjournalistische und herkömmliche
Recherche sich weniger in ihren Zielen, sondern mehr in ihren Methoden unterscheiden. Diese
Hypothese soll um die Einschätzung der Experten ergänzt werden. Aus
forschungsökonomischen Gründen wird dieser Aspekt im empirischen Teil jedoch weniger
ausführlich behandelt als die ersten drei Forschungsfragen.
283 Vgl. ROGERS: Facts are sacred, S. 288.
51
Diese Forschungsfragen dienen der Erkundung und Beschreibung 284 eines noch relativ
unbekannten empirischen Sachverhalts.285 Sie sollen einerseits helfen, Wissenslücken über den
datenjournalistischen Arbeitsprozess zu verkleinern.286 Andererseits sollen sie eine Idee davon
liefern, welche Wissenslücken es in zukünftigen Forschungsvorhaben zu schließen gilt.
Insbesondere Forschungsfrage 3 ist über das wissenschaftliche Interesse hinaus auch im
Verwertungszusammenhang begründet: 287 Könnte man mit Hilfe von CRISP-DM eine
Leitlinie des Datenjournalismus entwickeln, die praktische Anwendung in Redaktionen
findet?
4 Entwicklung der empirischen Methode 4.1 Das teilstandardisierte Experteninterview
Als empirische Methode für die Beantwortung der aus dem Theorieteil entwickelten
Forschungsfragen wurde das teilstandardisierte Experteninterview gewählt. Teil- und
nichtstandardisierte Interviews sind in der Durchführung und Auswertung wesentlich
aufwendiger als standardisierte Befragungen, haben dafür aber bestimmte Vorteile: „Die
Befragten selbst teilen in ihren Ausführungen mit, was sie über den Untersuchungsgegenstand
wissen, welche Aspekte sie für bedeutsam halten, welche Gefühle und Einstellungen sie
hegen.“288 Wenn über den Untersuchungsgegenstand noch wenig bekannt ist, bildet dies einen
entscheidenden Vorteil gegenüber dem standardisierten Interview: Da „der Forscher [beim
standardisierten Interview] nicht mehr herausbekommt, als er in den Fragebogen
hineingesteckt hat“289 läuft er Gefahr, wichtige Aspekte zu übersehen. Da der Arbeitsprozess
von Datenjournalisten bisher noch kaum erforscht ist, die Forschungsfragen jedoch die
Beantwortung konkreter Fragen erforderlich machen, ist also das teilstandardisierte Interview
das Mittel der Wahl.
Teilstandardisierte Befragungen basieren auf einem Interview-Leitfaden, in dem die zu
stellenden Fragen festgehalten sind. Man spricht daher auch von Leitfadeninterviews. In
welcher Reihenfolge die Fragen gestellt werden, bleibt dem Interviewer und dem
284 Vgl. KROMREY, Helmut: Empirische Sozialforschung: Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung. Stuttgart, 2009, S. 107f. 285 Vgl. ebd., S. 108. 286 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 65. 287 Vgl. dazu auch MIKOS, Lothar: Qualitative Medienforschung: ein Handbuch. Konstanz, 2005, S. 175. 288 WAGNER, Hans: Qualitative Methoden in der Kommunikationswissenschaft: ein Lehr- und Studienbuch. München, 2008, S. 319f. 289 Ebd., S. 319.
52
Gesprächsverlauf überlassen.290 Es müssen nicht alle Fragen in jedem Interview gestellt
werden. Auf die potenziellen Fehler bei der Durchführung von Leitfadeninterviews mit
Experten soll in Abschnitt 5.1 eingegangen werden.
4.2 Leitfragen und Operationalisierung Von den noch recht allgemeinen Forschungsfragen gilt es, eine Brücke zum
Erhebungsinstrument, in diesem Fall dem Interviewleitfaden, zu schlagen. Im Folgenden
werden dazu die Gegenstände der Forschungsfragen auf ihre Bedeutungsdimensionen hin
untersucht.291 Es wird diskutiert, mittels welcher Variablen die für diese Arbeit relevanten
Dimensionen 292 gemessen werden können. Der Untersuchungsgegenstand wird also
operationalisiert, d.h. messbar gemacht. Aufbauend auf diesen Überlegungen werden die
Forschungsfragen in konkretere Leitfragen übersetzt. Diese Leitfragen dienen sowohl zur
Orientierung bei der Entwicklung der konkreten Interviewfragen als auch bei der Auswertung
der durch die Interviews gewonnenen Ergebnisse.293 Für die Forschungsfragen dieser Arbeit
ergeben sich folgende Überlegungen:
Forschungsfrage 1: Welche Arbeitsschritte sind typisch für den datenjournalistischen
Arbeitsprozess?
Leitfrage 1.1: Welche Arbeitsschritte kommen immer oder häufig bei der Produktion
datenjournalistischer Beiträge vor?
Ob ein Arbeitsschritt typisch ist, soll in dieser Untersuchung durch die Variable
„Häufigkeit“ gemessen werden. Als typisch sollen solche Handlungen gelten, die immer oder
häufig in datenjournalistischen Projekten vorkommen. Von Interesse sind vor allem die Art
der Durchführung und das Ziel der Handlung. Um eine möglichst gute Vergleichbarkeit mit
CRISP-DM herzustellen, sollten die genannten Arbeitsschritte in etwa den Komplexitätsgrad
der generischen Aufgaben von CRISP-DM haben. Je nachdem, wie das Antwortverhalten der
Experten ausfällt, muss dieser Komplexitätsgrad durch Nachfragen angestrebt werden.
290 Vgl. ebd. 291 Vgl. KROMREY: Empirische Sozialforschung, S. 116. 292 Vgl. ebd. 293 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 91.
53
Forschungsfrage 2: Welche Übereinstimmungen und Unterschiede existieren zwischen
dem datenjournalistischen Arbeitsprozess und CRISP-DM?
Leitfrage 2.1: Welche generischen Aufgaben des CRISP-DM Prozesses stimmen ganz oder
teilweise mit Arbeitsschritten des Datenjournalismus über ein?
Leitfrage 2.2: Wie übertragen Datenjournalisten die generischen Aufgaben von CRISP-DM
in ihren Alltag?
Leitfrage 2.3: Welche typischen Arbeitsschritte des datenjournalistischen Arbeitsprozesses
kommen nicht in CRISP-DM vor?
Zum einen soll unabhängig von der Betitelung der Arbeitsphasen geprüft werden, inwiefern
die Handlungen der beiden Arbeitsprozesse übereinstimmen. Zum anderen sollen die
Interviews Auskunft darüber geben, welche Aktivitäten die Datenjournalisten mit den
Überschriften der CRISP-DM-Phasen assoziieren. Diese Interpretation der verwendeten
Begriffe ist für eine eventuelle Übertragbarkeit des Prozesses als Leitfaden wichtig.
Die Schritte von CRISP-DM werden auf dem Level der generischen Aufgaben betrachtet.
Dieser Ansatz scheint sinnvoll, da die generischen Aufgaben formuliert wurden, um sich gut
auf unterschiedliche Data-Mining Projekte übertragen zu lassen. Somit ist der Prozess auf
dieser Ebene möglicherweise auch auf den datenjournalistischen Arbeitsprozess gut
übertragbar. Ein Vergleich auf Ebene der sechs übergeordneten Phasen von CRISP-DM
scheint nicht aussagekräftig genug.
Als erwarteter Antwortbereich werden verschiedene Ausprägungen der Variablen „Grad der
Übereinstimmung“ sowie die Schilderungen ähnlicher oder analoger Handlungen im
Datenjournalismus erwartet. Die Frage nach Gründen für Gemeinsamkeiten und Unterschiede
wurde aus forschungsökonomischer Sicht nicht mit in die Forschungsfrage aufgenommen.
Sofern die Interviews Hinweise auf die Gründe für abweichende oder übereinstimmende
Handlungen enthalten, werden diese jedoch in der Auswertung berücksichtigt.
Forschungsfrage 3: Ist CRISP-DM als Ausgangspunkt für die Entwicklung einer
datenjournalistischen Leitlinie geeignet?
Leitfrage 3.1: Kann für Datenjournalismus überhaupt eine Leitlinie entwickelt werden?
54
Leitfrage 3.2: Wie hoch ist der Grad der Übereinstimmung zwischen CRISP-DM und dem
datenjournalistischen Arbeitsprozess?
Leitfrage 3.3: Würde eine höhere Übereinstimmung des datenjournalistischen
Arbeitsprozesses mit CRISP-DM gemäß den Qualitätskriterien des Datenjournalismus eine
Verbesserung bedeuten?
Leitfrage 3.4: Welche Gründe sprechen für oder gegen CRISP-DM als Ausgangspunkt für die
Entwicklung einer Leitlinie?
Nur wenn Leitfrage 3.1 bejaht wird, ergibt es Sinn, mit der eigentlichen Forschungsfrage
fortzufahren. Wie in Abschnitt 1.2 erläutert wurde, werden in dieser Arbeit zwei Kriterien für
die Beurteilung der Eignung von CRISP-DM herangezogen. Zum einen kann der Grad der
Übereinstimmung als Indikator gelten (Leitfrage 3.2). Zum anderen ist von Interesse, ob
CRISP-DM zur Erfüllung datenjournalistischer Qualitätskriterien beitragen könnte (Leitfrage
3.3). Leitfrage 3.4 zielt auf weitere, bislang nicht berücksichtigte Indikatoren ab, die für oder
gegen für die Eignung von CRISP-DM sprechen könnten.
Forschungsfrage 4: In welchem Verhältnis stehen herkömmliche und
datenjournalistische Recherche zueinander?
Leitfrage 4.1: Inwiefern unterscheiden sich die Ziele und Methoden von herkömmlicher und
datenjournalistischer Recherche?
Aus den theoretischen Überlegungen ergab sich die Hypothese, dass sich die Ziele von
herkömmlicher und datenjournalistischer Recherche weitestgehend decken, die verwendeten
Methoden jedoch unterschiedlich sind. Leitfrage 4.1 zielt auf die Verfeinerung dieser These ab.
4.3 Entwicklung des Interviewleitfadens Laut Gläser und Laudel können pro Stunde je nach Komplexität des Themas 8 bis 15 Fragen
behandelt werden.294 Im vorliegenden Leitfaden wurden 11 Fragen für 45 Minuten angesetzt.
Dabei wurden für den CRISP-DM-Vergleich mehrere Nachfragen eingeplant.
Nach dem Prinzip der „informierten Einwilligung“ wurden die Befragten zu Beginn des
Interviews über das Ziel der Arbeit, die Funktion des Interviews dabei und den Umgang mit 294 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 144.
55
ihren persönlichen Daten aufgeklärt. 295 Durch Überleitungen wurde versucht, einen
natürlichen Gesprächsverlauf zu erzeugen. 296 Außerdem wurden häufiger sogenannte
Plattformfragen verwendet. Sie enthalten einen oder mehrere Aussagesätze und eine inhaltlich
anschließende Frage, womit vermieden wird, alle „Informationen in den Fragesatz zu
stopfen“297. Insgesamt wurde darauf geachtet, die Fragen möglichst offen,298 neutral,299 klar
und einfach zu formulieren.300 Es wurden möglichst häufig unterstellende Fragen verwendet,
die den Interviewpartner von Entscheidungen entlasten und „umständliche und den
Gesprächsfluss zerstörende Filterfragen“301 vermeiden. „Eine Ablehnung der Unterstellungen“,
so Gläser und Laudel, „liegt meist im Spektrum der normalen Antwortmöglichkeiten und
erfordert keinen zusätzlichen Aufwand“.302 Der für diese Arbeit verwendete Interviewleitfaden
ist in Anhang III beigefügt. Anhang IV beinhaltet Erläuterungen zu den Formulierungen der
einzelnen Fragen sowie zu ihrer Positionierung innerhalb des Leitfadens.
4.4 Die Stichprobe
4.4.1 Wer ist ein Experte?
Um eine Stichprobe für die Experteninterviews auszuwählen, muss zwangsläufig definiert
sein, wer als Experte für das zu erforschende Thema gilt. Bogner und Menz leiten aus drei
verschiedene Zugängen zum Expertenbegriff eine eigene Definition her, die auch für diese
Arbeit sinnvoll erscheint. Ein Experte verfügt laut dieser Definition über drei Arten von
Wissen: technisches, Prozess- und Deutungswissen, „das sich auf sein spezifisches
professionelles oder berufliches Handlungsfeld bezieht“303. Nur ein geringer Teil davon ist
„reflexiv zugängliches Fach- und Sonderwissen“304. Außerdem ist der Einfluss des Experten
entscheidend: „[...] der Experte besitzt die Möglichkeit zur (zumindest partiellen)
Durchsetzung seiner Orientierungen.“ 305 Es gilt für den Forscher also zu identifizieren,
welche Personen auf dem betrachteten Gebiet Macht- und Einflusspotentiale besitzen.
295 Vgl. ebd. 296 Vgl. ebd., S. 143. 297 Ebd., S. 140. 298 Vgl. ebd., S. 131. 299 Vgl. ebd., S. 135. 300 Vgl. ebd., S. 140f. 301 Ebd., S. 133. 302 Ebd. 303 BOGNER, Alexander (Hrsg.): Das Experteninterview: Theorie, Methode, Anwendung. Wiesbaden, 2005, S. 46. 304 Ebd. 305 Ebd.
56
4.4.2 Auswahl der Experten
Die Gruppe derer, die sie beruflich intensiv mit Datenjournalismus befassen, ist in
Deutschland bisher noch recht überschaubar. Bei der Literaturrecherche in gedruckten
Veröffentlichungen sowie im Internet werden häufig die gleichen Namen genannt. Auch in
den bisherigen Forschungsarbeiten zum Thema Datenjournalismus wird ein ähnlicher
Personenkreis erwähnt. Viele Datenjournalisten nutzen den Kurznachrichtendienst Twitter
und erwähnen oder folgen sich dort gegenseitig. Dieser Dienst konnte somit als Instrument
genutzt werden, um einen Überblick über die Szene zu gewinnen. Hilfreich waren auch Blogs,
wie zum Beispiel DATENJOURNALIST.DE von der Datenjournalismus-Agentur OPENDATACITY,
auf dem aktuelle Entwicklungen im Datenjournalismus kommentiert werden.
Auf diese Art wurde ein Pool potenzieller Interviewpartner erstellt (siehe Tabelle 1 in Anhang
VII). Daraus wurden diejenigen Personen ausgewählt, die bisher noch möglichst selten zu
Forschungszwecken befragt wurden, gleichzeitig aber über eine möglichst umfassende
Berufserfahrung verfügen. Um in den Interviews Angaben über typische datenjournalistische
Arbeitsschritte erhalten zu können, war ein großer Erfahrungsschatz – möglichst aus mehreren
Jahren Berufsalltag – besonders wichtig. Alle drei in dieser Arbeit befragten Experten erfüllen
diese Voraussetzung.
Christina Elmer ist nach eigenen Angaben seit 2007 als Datenjournalistin tätig. Derzeit ist sie
als Redakteurin im Ressort Wissenschaft bei SPIEGEL ONLINE angestellt und verwendet etwa
50 Prozent ihrer Arbeitszeit auf datenjournalistische Projekte. Zuvor arbeitete sie als
Datenjournalistin bei der DPA, der DPA-INFOGRAFIK und beim STERN.
Julius Tröger gibt an, seit 2011 als Datenjournalist tätig zu sein. Als fest angestellter Reporter
im Lokal-Ressort der BERLINER MORGENPOST verwendet er etwa 75 Prozent seiner Arbeitszeit
auf datenjournalistische Projekte.
Sascha Venohr führt seit etwa drei Jahren datenjournalistische Projekte bei ZEIT ONLINE durch.
In der Entwicklungsredaktion ist er als Head of Data Journalism angestellt und betreibt als
solcher während seiner Arbeitszeit zu etwa 60 Prozent Datenjournalismus.
Alle drei Experten verfügen über das von Bogner und Menz erwähnte Einflusspotenzial auf
ihrem Gebiet. Christina Elmer beispielsweise wird häufig als Referentin zum Thema
57
Datenjournalismus zu Konferenzen und Workshops eingeladen. Das ZEIT ONLINE-Projekt
„Verräterisches Handy“, an dem Sascha Venohr maßgeblich beteiligt war, wird in zahlreichen
Veröffentlichungen als Paradebeispiel für Datenjournalismus genannt und erhielt unter
anderem den Grimme Online Award. Auch Julius Trögers erhielt bereits zahlreiche
Auszeichnungen, unter anderem wurde er 2012 vom MEDIUM MAGAZIN unter die Top 30
Nachwuchsjournalisten gewählt.
5 Durchführung der empirischen Erhebung
5.1 Regeln bei der Durchführung von teilstandardisierten
Experteninterviews Bei der Befragung wurde versucht, die Regeln der Interviewführung für qualitative
Forschungsinterviews nach Gläser und Laudel einzuhalten.306 Eine Übersicht der beachteten
Regeln befindet sich in Anhang IX. In einem Interview-Pretest mit einer Person, die nicht zum
Expertenkreis für diese Studie zählt, fiel der Autorin auf, dass sie durch die ausführlichen
theoretischen Vorüberlegungen sehr konkrete Ideen von der datenjournalistische Arbeitsweise
mitbrachte. Daraus entstand die Versuchung, bestimmte Antworten zu raten und dem
Interviewten nahezulegen.307 Die Autorin war sich durch den Pretest dieser Tendenz bewusst
und versuchte, dieser in den Interviews durch offenes Fragen sowie das Eingehen auf neue,
durch die Experten genannte Aspekte entgegenzusteuern.
5.2 Ablauf der Befragungen Die erste Kontaktaufnahme mit den Befragten erfolgte per E-Mail bzw. bei Julius Tröger über
den Kurznachrichtendienst Twitter. Im Anschreiben wurden das Forschungsvorhaben sowie
die Funktion der Interviews dabei kurz erläutert. Hierbei wurde versucht, einerseits durch
Informationen das Interesse der Interviewpartner zu wecken, andererseits nicht zu viel zu
verraten, um das spätere Antwortverhalten im Interview nicht zu beeinflussen. Außerdem
wurde in den Anschreiben jeweils auf die speziellen datenjournalistischen Erfahrungen des
potenziellen Interviewpartners Bezug genommen. Auf insgesamt fünf Anfragen folgten drei
Zusagen. Zwei angeschriebene potenzielle Interviewpartner reagierten nicht.
306 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 172ff. 307 Vgl. dazu auch ebd., S. 132.
58
Die Gespräche mit Christina Elmer und Julius Tröger fanden in den Cafeterien der jeweiligen
Medienhäuser statt, in welchen die Befragten angestellt sind (SPIEGEL und BERLINER
MORGENPOST). Das Interview mit Sascha Venohr wurde in einem Besprechungsraum der ZEIT
ONLINE-Redaktion durchgeführt. Während der Gespräche gab es keine größeren
Unterbrechungen oder Störungen. Alle Befragten stimmten der Tonaufnahme des Interviews
zu. Mit einer Interviewdauer von 55-60 Minuten wurde der anfängliche angestrebte Rahmen
von 45 Minuten zwar etwas überzogen, jedoch hatten alle Interviewpartner so viel Zeit
eingeplant, dass kein Zeitdruck entstand. So konnten auch die optionalen Fragen des
Fragebogens zumindest gestreift werden. Die Interviews fanden am 31.7.2013 (Christina
Elmer) und 7.8.2013 (Julius Tröger und Sascha Venohr) statt. Alle Befragten füllten direkt vor
Ort einen kurzen Fragebogen zu beruflichen Angaben (siehe Anhang V) aus.
5.3 Vorgehensweise bei der Auswertung
5.3.1 Transkription
Alle Interview-Mitschnitte wurden vollständig transkribiert, um das Datenmaterial für die
Interpretation verfügbar zu machen. 308 Für die Transkription gibt es keine allgemein
anerkannten Regeln, da diese vom Untersuchungsziel abhängig sind. 309 Eine minutiöse
phonetische Umschrift aller sprachlichen Äußerungen ist für diese Arbeit nicht sinnvoll, da
vor allem der Inhalt der Äußerungen und nicht ihre sprachliche Form von Interesse ist. Es
wurde daher Standardorthografie und keine literarische Umschrift verwendet (z.B. „Hast
du“ statt „Haste“). Einzig die Äußerung „ne“ als rhetorisch bestärkende Interjektion, die den
Gesprächspartner zur Zustimmung bewegen soll, wurde als umgangssprachliches Element
beibehalten. Nichtverbale Äußerungen und längere Pausen im Gespräch wurden nur dann
vermerkt, wenn sie der Antwort eine andere Bedeutung verleihen.310 Ansonsten wurden die
Antworten nicht grammatisch bereinigt. Kürzere Denkpausen in den Antworten wurden mit
„...“ gekennzeichnet.
308 Vgl. AYAß, Ruth: Transkription. In: MIKOS, Lothar (Hrsg.): Qualitative Medienforschung: ein Handbuch. Konstanz, 2005, S. 377–386, hier S. 378. 309 Vgl. ebd., S. 377; GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 193. 310 Diese Vorgehensweise orientiert sich an den Regeln von GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 193ff.
59
5.3.2 Extraktion
Den Interview-Transkripten wurden durch qualitative Inhaltsanalyse inhaltliche Informationen
entnommen und diese weiterverarbeitet. Dabei wurde in Anlehnung an das
Extraktionsverfahren von Gläser und Laudel vorgegangen: Mit Hilfe eines Suchrasters wurden
Informationen aus dem Ursprungstext entnommen, 311 wobei sich das Raster nach den
theoretischen Vorüberlegungen richtet.312 Anders als beim häufig genutzten Mayringschen
Verfahren können die Kategorien im Laufe der Extraktion verändert, ergänzt, nicht jedoch
verworfen werden.313 Somit soll zum einen garantiert werden, dass auch Informationen
berücksichtigt werden können, die bei den theoretischen Vorüberlegungen nicht bedacht
wurden.314 Zum anderen soll verhindert werden, dass die theoretischen Überlegungen aus dem
Blickfeld verschwinden.
Die Extraktion wurde teilweise computergestützt mit dem an der Universität Hamburg
entwickelten freien Computerprogramm CATMA (Computer Aided Textual Markup &
Analysis) vorgenommen. Mit Hilfe des Programms wurden die Passagen der Interview-
Transkripte, die für die Forschungsfragen relevant erschienen, mit unterschiedlichen
Markierungen (sogenannten Tags) versehen. Die verwendeten Tags spiegeln dabei die
theoretischen Vorüberlegungen wider und bilden das Suchraster für die Extraktion.
Anschließend wurden alle mit einem bestimmten Tag versehenen Passagen gesammelt
ausgegeben. Diese Passagen wurden je nach Länge entweder als wörtliches Zitat oder
Paraphrase in eine Tabelle eingetragen, die in den Spalten die drei Befragten und in den Zeilen
die unterschiedlichen Tags enthielt. So wurden die Aussagen der Befragten zu gleichen Tags
in übersichtlicher Form nebeneinander dargestellt. Diese übersichtliche Tabellenform konnte
anschließend genutzt werden, um Parallelen und Unterschiede in den Antworten
herauszuarbeiten. Die Extraktionstabelle sowie die Interview-Transkripte werden der Arbeit in
digitaler Form auf der anhängenden Daten-CD beigefügt.315
311 Vgl. ebd., S. 200. 312 Vgl. ebd. 313 Vgl. ebd., S. 204f. 314 Vgl. ebd., S. 201. 315 Da nicht alle Befragten mit der Veröffentlichung der Transkripte bzw. der wörtlichen Zitation längerer Passagen einverstanden waren, wird die Daten-CD nur den Gutachtern dieser Arbeit zur wissenschaftlichen Überprüfung zur Verfügung gestellt.
60
6 Ergebnisse der empirischen Erhebung
6.1 Der datenjournalistische Arbeitsprozess
In den Experteninterviews wurden die Befragten gebeten, Arbeitsschritte zu nennen, die ihrer
Erfahrung nach projektübergreifend immer wieder vorkommen. Keiner der Befragten nannte
auf diese Frage hin direkt alle in Abschnitt 2.3.3 erarbeiteten datenjournalistischen
Arbeitsschritte. Nimmt man jedoch die Antworten aller Befragten zusammen und
berücksichtigt auch die Aspekte, die im Zusammenhang mit Beispielen erwähnt wurden,316 so
finden sich alle Schritte aus dem Theorieteil in den Antworten der Experten wieder. Darüber
hinaus ergeben sich aus den Interviews einige interessante Ergänzungen, die hier erläutert
werden.
Insbesondere bei Elmer und Tröger wird eine Unterteilung der Arbeit in eine Datenrecherche
und eine Recherche mit herkömmlichen journalistischen Methoden deutlich. 317 Die
Datenrecherche fördere im erfolgreichen Fall Ansätze für eine weiterführende Recherche
zutage und liefere die Informationsbasis für anschließende Gespräche mit Akteuren.318 Tröger
und Venohr erwähnen in diesem Zusammenhang einen bisher nicht berücksichtigten Schritt,
der sich aus der Datenrecherche ergeben kann: Manchmal würden sich die Daten als nicht
interessant oder nicht vertrauenswürdig genug erweisen. Es könne sich außerdem
herausstellen, dass das Projekt zu aufwendig werde. In solchen Fällen werde unter Umständen
nach einer anfänglichen Datenrecherche das Projekt fallen gelassen.319 Elmer wies zudem
darauf hin, dass es während des Projekts immer wieder nötig sein kann, zwischen Datenarbeit
und herkömmlichen Recherchemethoden zu wechseln.320
Im Theorieteil wurde der Arbeitsschritt „Journalistische Geschichte in den Daten
finden“ erwähnt. Aus den Interviews ergibt sich die Ergänzung, dass in datenjournalistischen
Projekten nicht immer unbedingt eine bestimmte Geschichte von der Redaktion erzählt bzw.
ein bestimmter Blickwinkel eingenommen wird. Insbesondere Venohr weist darauf hin, dass
ein großer Datensatz Antworten auf viele unterschiedliche Fragen liefern kann. Die Wahl der 316 Dass ein Arbeitsschritt in einem Beispiel erwähnt wird, gibt natürlich keinen Aufschluss darüber, ob er auch häufig vorkommt. Schritte, die sowohl in der Literatur als auch in den Beispielen der Interviewten genannten werden, kommen jedoch offenbar zumindest projektübergreifend vor und können somit unter Vorbehalt auch als typische Schritte angenommen werden. Häufig wurde auch die Vorgehensweise in Bezug auf die Beispiele von den Befragten recht allgemein formuliert. 317 Vgl. z.B. Transkript Elmer Z. 36-39. 318 Vgl. Transkript Tröger Z. 190-192, Z. 265-268; Transkript Elmer Z. 266-270. 319 Vgl. Transkript Tröger Z. 270-273; Transkript Venohr Z. 163-173. 320 Vgl. Transkript Elmer Z. 449-452.
61
Frage werde dabei häufig dem Leser überlassen. Als Beispiel dafür erwähnt Venohr ein ZEIT
ONLINE-Projekt, das einen Überblick über die Aktivitäten aller Bundestagsabgeordneten
liefert und bei dem der Leser sich gezielt über einzelne Abgeordnete informieren kann.321
Auffällig ist die starke Betonung der Visualisierung als Analysemethode bei allen drei
Interviewten.322 Dies weist darauf hin, dass es in der Tat einen starken Bezug zu dem von
Haase erwähnten Visual-Analytics-Ansatz gibt, bei dem die Fähigkeit des Menschen zur
Mustererkennung aus visuellen Darstellungen genutzt wird. 323 Zusätzlich werden
Analysemethoden wie Filtern, Sortieren, das Anfertigen von Verteilungsdiagrammen, die
Suche nach Extremwerten sowie die Verwendung von Pivot-Tabellen, Excel-Funktionen und
Datenbankabfragen genannt. 324 Elmer und Tröger weisen außerdem darauf hin, dass
insbesondere Lücken in den Daten für sie von Interesse seien, weil sich dahinter oft
Geschichten verbergen würden.325 Elmer gab an, dass sie sich bei der Berichterstattung eher
auf sehr deutliche Auffälligkeiten beschränkt. Bei Ergebnissen mit großen Fehlerbalken oder
Unsicherheiten laufe man Gefahr, beim Publikum einen falschen Eindruck zu erwecken.326
Die Befragten erwähnen einige Aspekte der Datenvorbereitung- und Untersuchung, welche im
Theorieteil noch nicht behandelt wurden. Für Elmer gehört in den allermeisten Fällen die
Berechnung eines vergleichbaren Indikators im Vorfeld der eigentlichen Analyse mit zur
Arbeit. Als Beispiel nennt sie die Berechnung eines Verhältnisses von Krankheitsfällen zu
Einwohnerzahlen.327 Venohr und Tröger erwähnen die Verkleinerung des Datensatzes als
wichtigen Aspekt. Diese könne nötig sein, um die Daten möglichst kompakt zum Download
bereitstellen zu können. Zur Datenvorbereitung könne daher auch gehören, Werte
zusammenzufassen, redundante Daten auszusortieren oder ein kompakteres Format zu
wählen.328
Die Befragten gaben einige Beispiele dazu, wie sie die Datenqualität bzw. die Qualität ihrer
Ergebnisse überprüfen. Das Hinzuziehen einer weiteren unabhängigen Quelle sei je nach
Datenlage nicht immer möglich. In solchen Fällen müsse die Zuverlässigkeit der Quelle
bestmöglich nach journalistischen Kriterien beurteilt werden. Zusätzlich könnten bestimmte
321 Vgl. Transkript Venohr Z. 221-224; Transkript Tröger Z. 62-64. 322 Vgl. Transkript Tröger Z. 257-259; Transkript Elmer Z. 490-491; Transkript Venohr Z. 107-109. 323 Vgl. HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32. 324 Vgl. Transkript Elmer Z. 490-491, Z. 129-133; Transkript Tröger Z. 206-208, Z. 251-252, Z. 259-262. 325 Vgl. Transkript Tröger Z. 190-192; Transkript Elmer Z. 523-526. 326 Vgl. Transkript Elmer Z. 541-551. 327 Vgl. Transkript Elmer Z. 102-105. 328 Vgl. Transkript Tröger Z. 519-520, Z. 571-573; Transkript Venohr Z. 366-370.
62
Datenbankabfragen (z.B. nach doppelten Einträgen) oder Prüfsummen Anhaltspunkte für die
Beurteilung der Datenqualität liefern.329 Bei der Beurteilung von Daten oder Ergebnissen
ziehen die Befragten außerdem Kollegen aus den entsprechenden Fachressorts sowie externe
Fachleute zu Rate.330
Zur ihrer Arbeitsweise generell betonen alle Befragten, dass sie nicht nach einem bestimmten
Prozedere vorgehen, sondern, dass jedes Projekt anders ist und neue Herausforderungen birgt,
die es zu meistern gilt. „Learning by Doing“ scheint bei datenjournalistischen Projekten ein
häufiges Prinzip zu sein.331
In den Interviews von Elmer und Venohr klingt an, dass die Befragten sich bei ihrer
Arbeitsweise bewusst oder unbewusst Strategien aus der Software-Entwicklung bedienen,
indem sie verschiedene Versionen ihrer Arbeit speichern und für sich nachvollziehbar machen,
wie sie von einem Bearbeitungsschritt zum nächsten gekommen sind.332
6.2 Verhältnis von datenjournalistischer und herkömmlicher Recherche
Im vorherigen Abschnitt wurde bereits erwähnt, dass journalistische Recherche mit
herkömmlichen Methoden wie der Befragung stets Teil von datenjournalistischen Projekten
ist. Eine Besonderheit datenjournalistischer Projekte liegt jedoch laut Elmer in der besseren
Ausgangsbasis bei Beginn der Befragungen: „Ja im Prinzip ist es eigentlich eine ganz normale
journalistische Recherche mit dem aber, finde ich, großen Unterschied, dass ich eine ganz
andere Position habe, aus der ich komme. Also ich habe schon auch dann eine sehr klare
These ja aus meinen Daten irgendwie gezogen und kann anders konfrontieren.“333 Dadurch
könne man sich gar nicht mehr auf einer oberflächlichen Ebene abspeisen lassen, fügt Elmer
hinzu. In eine ähnliche Richtung argumentiert Venohr, der dem Datenjournalismus einen
besonderen Wahrhaftigkeitsanspruch zuspricht. Dieser Anspruch resultiere daraus, dass der
Datenjournalismus auf Fakten basiere und habe zur Folge, dass man seine Standpunkte
„felsenfest vertreten“ könne.334 Venohr sieht einen weiteren Unterschied zu herkömmlichen
journalistischen Projekten in der Detailversessenheit des Datenjournalismus. Diese sei nötig,
329 Vgl. Transkript Venohr Z. 178-181; Transkript Elmer Z. 208-211; Transkript Tröger Z. 172-174. 330 Vgl. Transkript Tröger Z. 357-358, Z. 502-505; Transkript Venohr Z. 328-330. 331 Vgl. Transkript Elmer Z. 449-452; Transkript Tröger Z. 113-114, Z. 406; Transkript Venohr Z. 585-592. 332 Vgl. Transkript Elmer Z. 686-692; Transkript Venohr Z. 615-620. 333 Transkript Elmer Z. 265-268. 334 Vgl. Transkript Venohr Z. 487-491, Z. 498-501, Z. 503-505.
63
da in großen Anwendungen wie der Abgeordneten-Bilanz von ZEIT ONLINE nicht eine
einzelne Geschichte erzählt werde, sondern gesicherte Informationen für alle Geschichten
geliefert werden müssten, die der Leser in den Daten entdecken kann. Die übergeordneten
Ziele von datenjournalistischer und herkömmlicher Recherche seien jedoch die
gleichen. 335 Tröger sieht die Unterschiede zwischen herkömmlicher Recherche und
datenjournalistischer Vorgehensweise vor allem beim Beginn von Projekten: „Also am
Anfang ist es, glaube ich, schon anders. Wenn man Webtechniken zum Beispiel einsetzt, ein
bisschen mit Programmierung arbeitet, Statistik-Tools und so weiter [...]. Aber dann, wie
gesagt, wenn man die Geschichte hat oder wenn man denkt man hat eine oder auch ein paar
Fragen hat oder Dinge verstehen möchte, dann ist es, glaube ich, relativ gleich.“336 Dann gehe
es darum, weitere Stimmen einzufordern, Beteiligte zu konfrontieren und ihnen Gelegenheit
zur Stellungnahme zu bieten, so Tröger.337
6.3 CRISP-DM und der datenjournalistische Arbeitsprozess
In diesem Abschnitt wird erläutert, was die Experteninterviews im Hinblick auf
Übereinstimmungen und Unterschiede von CRISP-DM und datenjournalistischem
Arbeitsprozess ergeben haben. Außerdem wird anhand einiger Beispiele gezeigt, wie die
Befragten den Prozess in den „datenjournalistischen Alltags-Sprech“338 übersetzt haben.
Keiner der Befragten war bis zum Interviewzeitpunkt intensiver mit den Themen Data-Mining
oder Wissensentdeckung in Datenbanken in Berührung gekommen. Dementsprechend war
auch der Standardprozess CRISP-DM allen unbekannt. Übereinstimmung besteht unter den
Befragten dahingehend, dass CRISP-DM den auf Daten bezogenen Teil datenjournalistischer
Projekte ziemlich gut abbildet. Venohr und Tröger gaben an, dass viele der CRISP-DM-
Schritte von Datenjournalisten unbewusst gemacht werden und bekräftigen dadurch die im
Theorieteil geäußerte, dahin gehende Vermutung.339
Auch die Vermutung, dass Dokumentation bei der datenjournalistischen Arbeit eine weniger
wichtige Rolle spielt als bei CRISP-DM vorgesehen, wurde durch die Experteninterviews
bekräftigt. Eine Dokumentation findet bei den Befragten, wenn überhaupt, eher in Form
335 Vgl. Transkript Venohr Z. 197-201, Z. 224-227. 336 Transkript Tröger Z. 332-342. 337 Vgl. Transkript Tröger Z. 315-318, Z. 322-324. 338 Transkript Venohr Z. 685. 339 Vgl. Transkript Tröger Z. 743-744, Z. 725-726; Transkript Elmer Z. 740-750; Transkript Venohr Z. 689-694.
64
unterschiedlicher Dateiversionen oder in Form von Notizen in Excel-Dateien statt. Elmer
erwähnte, dass sie sich außerdem während des Projekts an zentraler Stelle alles notiert, worauf
sie später in der Aufbereitung hinweisen will, beispielsweise Lücken in den Daten. Im Fall des
STERN-Gesundheitsatlas seien außerdem für die weiterführende Recherche Exzerpte mit den
wichtigsten Ergebnissen der Datenrecherche erstellt worden.340
Alle Befragten gaben an, dass ihr Arbeitsablauf nicht in so einer festen strukturierten Form
abläuft, wie es das CRISP-DM-Schema auf den ersten Blick suggeriert. Obwohl von der
Autorin jeweils darauf hingewiesen wurde, dass es sich bei CRISP-DM um einen stark
iterativen und keinesfalls linearen Prozess handelt, wurde dieser Aspekt in allen Interviews
sehr betont.341
Auf die Frage nach den datenjournalistischen Arbeitsschritten, die in CRISP-DM nicht
enthalten sind, wurde wie erwartet unter anderem die journalistische Recherche jenseits der
Daten genannt. Darüber hinaus betonten alle Befragten das Fehlen der journalistischen
Umsetzung und Aufbereitung für das Publikum. Dieser Aspekt lässt sich laut Elmer nicht in
einen einzelnen Schritt fassen, sondern begleitet das ganze Projekt kontinuierlich und
gegebenenfalls in Absprache mit Designern oder Programmierern. Dabei gehe es um Fragen
von Design, Layout, User-Interaction sowie der technischen Komptabilität mit verschiedenen
Endgeräten und unterschiedlicher Software. Neben technischen Aspekten müsse der Journalist
sich fragen, wie er das Thema verständlich und ansprechend darreichen kann. Auch die
Interaktion zwischen Redaktion und Nutzer nach der Veröffentlichung kommt laut Venohr bei
CRISP-DM zu kurz.342 Ebenfalls zu kurz bei CRISP-DM kommt nach Ansicht der Befragten
die Datenbeschaffung. Häufig sei gar nicht klar, ob es überhaupt Daten zu der entsprechenden
Fragestellung gebe oder welche Daten am besten geeignet seien, um eine Aussage über den
Sachverhalt zu treffen.343 Manchmal müsse man die Daten auch erst selbst zusammentragen,
erwähnte Venohr mit Blick auf das Dispozinsen-Projekt von ZEIT ONLINE.344
340 Vgl. Transkript Tröger Z. 756-758; Transkript Elmer Z. 72-75, Z. 432-434, Z. 677-680; Transkript Venohr Z. 614-617. 341 Vgl. Transkript Venohr Z. 680-683; Transkript Elmer Z. 701-702; Transkript Tröger Z. 406. 342 Vgl. Transkript Elmer Z. 755-761, Z. 562-564, Z. 764-767; Transkript Tröger Z. 734-737; Transkript Venohr Z. 574-577, Z. 646-648. 343 Vgl. Transkript Elmer Z. 664-668; Transkript Venohr Z. 561-566. 344 Dispozinsen-Projekt bei ZEIT ONLINE: http://www.zeit.de/2013/29/banken-dispo-zinsen-wucher [abgerufen am 14.08.2013]. Vgl. auch Transkript Venohr Z. 561-566.
65
Im Folgenden wird in stark zusammengefasster und exemplarischer Form dargestellt, wie die
Befragten auf die sechs CRISP-DM-Phasen reagiert haben und wie die Arbeitsschritte in die
datenjournalistische Alltagssprache übersetzt wurden.
Untersuchung der Geschäftsziele
Mit der Aufgabe „Geschäftsziele untersuchen“ assoziierten sowohl Elmer als auch Venohr
den so genannten „Küchenzuruf“, also das prägnante Zusammenfassen des Projekts in Teaser-
Form. Tröger nannte als Projektziel, den „Lesern eine spannende Geschichte zu liefern“. Für
Venohr gibt es bei allen datenjournalistischen Projekten außerdem das übergeordnete Ziel,
dass diese die Marke von ZEIT ONLINE als innovatives, optisch ansprechendes und
faktenbasiertes Medium stärken.345
Ob verfügbares Personal und Budget zu Beginn des Projekts abgeschätzt würden, hänge von
seinem Umfang ab. Welche Informationen in technischer Hinsicht genau aus den Daten
gewonnen werden sollten, also die Data-Mining-Ziele, sei nicht unbedingt zu Beginn des
Projekts klar, da häufig erst nach dem ersten Kontakt mit dem Daten Auffälligkeiten entdeckt
würden. Elmer und Tröger gaben an, keine Projektpläne zu verwenden. Für Venohr hingegen
spielen solche Pläne mit festen Fristen eine wichtige Rolle, da seine Projekte häufig an die
Print-Ausgabe der ZEIT gekoppelt sind und daher der Redaktionsschluss beachtet werden
muss.346
Datenuntersuchung
Die Datenerfassung wurde, wie bereits erwähnt, von den Experten als besonders wichtig und
bei CRISP-DM als nicht genug berücksichtigt eingestuft. Eine explizite Datenbeschreibung
findet nach Aussagen der Befragten eher nicht statt. Die Schritte „Daten untersuchen“ und
„Datenqualität prüfen“ wurden von den Befragten jeweils zusammen behandelt und finden
sich bei allen im eigenen Arbeitsprozess wieder. Einige der dabei genannten Methoden zur
Untersuchung der Datenqualität wurden in Abschnitt 6.1 erläutert.347
Datenaufbereitung
Der Punkt „Daten auswählen“ wurde in zwei von drei Interviews eher übergangen. Da er aber
in den genannten Beispielen implizit immer wieder vorkommt, ist anzunehmen, dass er wegen
seiner Selbstverständlichkeit nicht weiter beachtet wurde. Alle restlichen Aufgaben dieser 345 Vgl. Transkript Elmer Z. 365-368; Transkript Venohr Z. 260-262, Z. 270-275; Transkript Tröger Z. 413-415. 346 Vgl. Transkript Tröger Z. 424-426; Transkript Venohr Z. 299-301, Z. 307-311. 347 Vgl. Transkript Venohr Z. 333-335; Transkript Elmer Z. 409-410; Transkript Tröger Z. 496-501.
66
Phase („Daten bereinigen“, „Daten erstellen“, „Daten integrieren“, „Daten formatieren“)
ließen sich von den Befragten auf ihren eigenen Arbeitsprozess übertragen. Bei der
Datenbereinigung wurde insbesondere auf Probleme durch unterschiedliche Formate
(Zeichenformate wie beispielsweise UTF8, Datumsformate) sowie inkonsistente
Benennungen in den Daten hingewiesen.348
Modellierung
Die Interviews stützen die Vermutung, dass in der Phase der Modellierung die wenigsten
Gemeinsamkeiten zwischen CRISP-DM und datenjournalistischem Arbeitsprozess bestehen.
Im vorherigen Abschnitt wurde bereits erläutert, welche Analysemethoden von den
Datenjournalisten vorrangig genannt wurden. Diese haben nur wenige Schnittmengen mit den
bei der Data-Mining-Modellierung verwendeten Methoden. Lediglich Venohr gab an,
Erfahrung mit einer Methode zu haben, die auch typisch für Data-Mining ist, dem Clustering
von Objekten.349
Auswertung
Die Auswertung der Ergebnisse und die Prüfung des Prozesses wurden von den Befragten in
ihren Antworten ebenfalls zum Teil übergreifend behandelt. In diesem Zusammenhang wurde
zum einen das Aufspüren von Fehlern in den bisherigen Ergebnissen genannt, zum anderen
aber auch der Realitätsabgleich der bisherigen Ergebnisse durch das Befragen von Fachleuten
oder Beteiligten. Venohr assoziiert mit dieser Phase auch bereits eine technische Überprüfung
dessen, ob die Ergebnisse bei unterschiedlichen technischen Voraussetzungen der Endgeräte
korrekt dargestellt werden.350
Bereitstellung
Unter der Bereitstellung verstehen alle Befragten die Veröffentlichung des journalistischen
Produkts. Diese gelte es sowohl technisch als auch inhaltlich zu planen. Wie bereits erwähnt
wurde, ist dies für Elmer ein Aspekt, der sich über die gesamte Dauer des Projekts erstreckt.
Für Venohr ist die Begleitung des Projekts nach der Veröffentlichung von großer Relevanz,
also eine Art Monitoring und Wartung. Dazu gehöre das Antworten auf Kommentare,
eventuelle Fehlerbeseitigungen sowie das Bewerben des Projekts über Social-Media-Kanäle.
Alle Befragten gaben an, dass im Anschluss an die Projekte eine redaktionsinterne Reflektion
stattfindet, die jedoch nicht auf bestimmte Weise strukturiert ist oder einen Schlussbericht 348 Vgl. Transkript Tröger Z. 520-524; Transkript Venohr Z 351-354. 349 Vgl. Transkript Venohr Z. 399-406. 350 Vgl. Transkript Elmer Z. 571-573; Transkript Tröger Z. 650-655; Transkript Venohr Z. 431-435.
67
beinhaltet. Für Tröger findet die Überprüfung des Projekts darüber hinaus vor allem durch die
Rezipienten und deren Feedback statt.351
6.4 Fazit zu CRISP-DM-Vergleich und Einschätzung der Experten
Im letzten Teil der Interviews wurden die Experten gefragt, ob sie generell eine Leitlinie im
Sinne einer Handlungsempfehlung ohne bindenden Charakter für den Datenjournalismus als
sinnvoll erachten.
Einerseits waren sich alle Experten darin einig, dass es nicht sinnvoll ist, einen festen Katalog,
eine Liste oder ein vorgegebenes Schema in die Redaktionen zu geben, das im Verlauf eines
Projekts abgearbeitet werden soll. Dazu sind nach Ansicht der Befragten datenjournalistische
Projekte zu unterschiedlich und stellen immer wieder neue Herausforderungen an die
Beteiligten.352 Laut Tröger gelten zudem ohnehin schon gewisse journalistische Workflows,
wie beispielswiese das Vier-Augen-Prinzip für datenjournalistische Projekte.
Andererseits schränkten alle Befragten ihre Ablehnung eines Leitfadens auf die eine oder
andere Art ein. Elmer hält eine Art Checkliste für sinnvoll, die an bestimmte wichtige Punkte
im Arbeitsprozess erinnert. Diese könne helfen, „Fehler zu vermeiden oder, dass jemand in
eine Richtung losrennt und am Ende dann irgendwo ganz fies scheitert oder so.“353 Tröger
räumt ein, dass er sich im Hinblick auf seine Erfahrungen mit dem Flugroutenradar354 für das
nächste größere Projekt gewisse Standardisierungen wünschen würde, die Fristen und
Zuständigkeiten im Projekt regeln.355 Für Venohr ist ein Leitfaden eher von pädagogischem
Interesse: „Ich glaube eher, dass so eine Liste eher wirklich etwas für Lehrbücher ist um
einfach eine Philosophie zu transportieren. Aber ich glaube, es gibt am Ende nicht diese
zwingende Logik, die immer greift.“356 Es gebe so viele projektspezifische Probleme, dass
man, keinen ZEIT ONLINE-Guide zum Abhaken erstellen könne. Venohr findet es aber wichtig,
„es überhaupt mal durch zu deklinieren, damit man auch mal diese Schritte erzählen kann,
berichten kann.“357
351 Vgl. Transkript Tröger Z. 680, Z. 701-703, Z. 713-716; Transkript Venohr Z. 449, Z. 453-455, Z. 460-461, Z. 465-467, Z. 552-555; Transkript Elmer Z. 579-581, Z. 655-656. 352 Vgl. Transkript Elmer Z. 711-716; Transkript Tröger Z. Z. 726-728, Z. 776-789, Z. 804-806; Transkript Venohr Z. 638-641. 353 Transkript Elmer Z. 716-717. 354 http://flugroutenradar.morgenpost.de/#mein-standort/2013-08-13/52.410074,13.129318 [abgerufen am 15.8.2013]. 355 Vgl. Transkript Tröger Z. 707-713, Z. 787-797. 356 Transkript Venohr Z. 643-645. 357 Transkript Venohr Z. 660-661, Z. 658-660.
68
In den Rahmen dieser Einschätzungen fällt auch die Beurteilung von CRISP-DM als Vorlage
für eine datenjournalistische Leitlinie. Wie bereits erwähnt, sehen alle Befragten eine hohe
Übereinstimmung von CRISP-DM mit der datenbezogenen Arbeit in ihrem Alltag. Tröger ist
jedoch der Ansicht, dass die aufgelisteten Punkte selbstverständlich sind: „... wer seine Daten
nicht prüft und seine Daten einfach nicht bereinigt, der macht seinen Job falsch. [...] Du kannst
ja auch nicht einem Redakteur irgendwie hinlegen: Mindestens zwei Quellen abhaken
bitte.“ Elmer sagt, dass CRISP-DM als Ausgangspunkt für eine Checkliste bis auf die bereits
erwähnten fehlenden Punkte „ziemlich gut“ passe. Venohr findet CRISP-DM als Ansatzpunkt
für einen Leitfaden zu pädagogischen Zwecken „nicht verkehrt“. Es sei jedoch wichtig darauf
hinzuweisen, dass die Schritte des Prozesses nur Grundbausteine sind, die in ganz
unterschiedlicher Weise angeordnet sein können.358
7 Diskussion der Gesamtergebnisse und Ausblick
Im Zentrum dieser Arbeit standen zwei übergeordnete Fragen: Wie arbeiten Datenjournalisten
und wie sollten sie arbeiten? Als konkreter Ansatz für die Beantwortung dieser Fragen wurde
in dieser Arbeit die Eignung des Data-Mining-Standardprozesses CRISP-DM als
Ausgangspunkt für einen datenjournalistischen Leitfaden untersucht. In den folgenden
Abschnitten wird diskutiert, was Literaturstudium und Experteninterviews im Hinblick auf die
Forschungsfragen dieser Arbeit ergeben haben.
7.1 Arbeitsweisen zwischen herkömmlicher Recherche und CRISP-DM
In den Forschungsfragen 1, 3 und 4 dieser Arbeit wurde danach gefragt, welche typischen
Arbeitsschritte den datenjournalistischen Arbeitsprozess charakterisieren und wie dieser
Prozess zwischen herkömmlicher Recherche und CRISP-DM einzuordnen ist. In den
Experteninterviews wurde deutlich, dass datenjournalistisches Arbeiten stets sowohl Elemente
der Datenbearbeitung als auch der herkömmlichen Recherche enthält.
Die Befragten betonen sehr stark, dass jedes Projekt anders und daher die Angabe einer
bestimmten Anzahl oder Reihenfolge von Arbeitsschritten unmöglich ist. Wie die
358 Vgl. Transkript Venohr Z. 680-683.
69
herkömmliche journalistische Recherche scheint auch die datenjournalistische Recherche ein
„lebendiger und oft auch spontaner Prozess “359 zu sein. Beide Recherche-Arten verfolgen
zudem die gleichen übergeordneten Ziele, wie die Aufdeckung neuer relevanter Informationen
oder die Erstellung eines verständlichen, ansprechenden Produkts. Unterschiedlich sind die
Wege, auf denen diese Ziele erreicht werden.
Offensichtlichster Unterschied ist die Datenarbeit. Die Ergebnisse dieser Arbeit legen nahe,
dass durch diese Datenarbeit eine Informationsbasis geschaffen wird, die besonders belastbar
ist und daher eine zielgerichtetere Konfrontation der beteiligten Akteure erlaubt als bei nicht-
datenjournalistischen Projekten. In den Interviews wurde zudem der Aspekt genannt, dass
manche datenjournalistischen Projekte sehr aufwendig sind, da sie alle Geschichten inhaltlich
absichern müssen, die der Leser potenziell in ihnen finden kann. Wie Literatur und
Experteninterviews gezeigt haben, können datenjournalistische Projekte unterschiedlichste
Veröffentlichungsformen annehmen. Dass hier oft neue Wege des Storytelling beschritten
werden, unterscheidet sie ebenfalls von herkömmlichen journalistischen Projekten.
Das Literaturstudium in Abschnitt 2.4.2 sowie die Befragung der Experten legen nahe, dass
sich viele Schritte des Standardprozesses CRISP-DM auf den Daten-Teil datenjournalistischen
Arbeitens übertragen lassen. Die beiden Prozesse weisen jedoch auch Unterschiede auf:
Journalisten setzen bei der Datenanalyse – neben eher einfachen Sortier-, Filter- und
Berechnungsvorgängen – stark auf den Einsatz von Visualisierungen und die menschliche
Fähigkeit der Mustererkennung setzen. Dies deckt sich mit Haases Einschätzung, nach der für
Datenjournalisten der Visual-Analytics-Ansatz eine große Rolle spielt. 360 Die speziellen
Modellierungsmethoden des Data-Mining scheinen im Datenjournalismus hingegen kaum
eine Rolle zu spielen. Auch scheint die Dokumentation der Arbeitsschritte im
Datenjournalismus weniger ausgeprägt zu sein als bei CRISP-DM vorgesehen. Wichtig ist den
Befragten jedoch die Nachvollziehbarkeit der einzelnen Datenbearbeitungsschritte, die vor
allem durch persönliche Notizen und Datei-Versionsverwaltung gewährleistet wird.
359 MAST: ABC des Journalismus, S. 240; vgl. auch KLAMMER: Empirische Sozialforschung, S. 29. 360 Vgl. HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 32ff.
70
7.2 Ansprüche an datenjournalistische Arbeitsweisen
Forschungsfrage 3 zielte auf die Beurteilung der Eignung von CRISP-DM als Ausgangspunkt
für eine datenjournalistische Leitlinie ab. In Abschnitt 1.1 wurde erläutert, dass für die
Beantwortung dieser Frage die gültigen Qualitätskriterien bestimmt werden müssen. Daher
wurde in Abschnitt 2.2.4 solche Kriterien für den Datenjournalismus abgeleitet. Für ihn gelten
in erster Linie journalistische Qualitätskriterien wie Aktualität, Relevanz, Richtigkeit und
Vermittlung.
Es wurde erörtert, dass ein streng reglementierter Arbeitsprozess, wie er in der Wissenschaft
üblich ist, im System Journalismus nicht gefordert werden kann. Stattdessen wurde ergänzend
zur journalistischen Sorgfaltspflicht eine Pflicht zur Transparenz abgeleitet, die nicht
spezifisch aber besonders bedeutsam für den Datenjournalismus ist.
Die Reaktionen der Experten legen nahe, dass eine detaillierte Dokumentation der eigenen
Arbeitsschritte – wie sie bei CRISP-DM gefordert wird – für die Qualitätssicherung im
Datenjournalismus förderlich wäre. Es wird jedoch auch deutlich, dass in diesem Punkt ein
Reibungsverhältnis zum Kriterium der Aktualität vorliegt.361 Wie dieser Konflikt bestmöglich
gelöst werden kann, muss an dieser Stelle vorerst offen bleiben.
In Abschnitt 2.2.4 wurde definiert, dass eine Leitlinie bei der Erfüllung der gültigen
Qualitätskriterien helfen soll. In diesem Zusammenhang ist die von Tröger erwähnte
Diskussion um die grundsätzliche Frage „Wie viel Projektmanagement gehört in den
Newsroom?“ von großem Interesse.362 Wie stark journalistische Vorgehensweise reglementiert
und strukturiert sein sollte, wird laut Tröger auf der US-amerikanischen Datenjournalismus-
Mailingliste des NICAR (National Institute for Computer-Assisted Reporting) aktuell stark
diskutiert.
361 Vgl. Transkript Venohr Z. 694-707. 362 Vgl. Transkript Tröger Z. 460-465
71
7.3 CRISP-DM als Leitlinien-Vorlage
In Forschungsfrage 3 wurde nach der Eignung von CRISP-DM als Ausgangspunkt für eine
datenjournalistische Leitlinie gefragt. Als Kriterien für die Eignung wurden in Abschnitt 1.2
die Ähnlichkeit zwischen CRISP-DM und dem datenjournalistischen Arbeitsprozess sowie der
Beitrag von CRISP-DM zur Erfüllung datenjournalistischer Qualitätskriterien definiert.
Für die Beantwortung der eigentlichen Forschungsfrage musste jedoch zunächst geklärt
werden, ob es generell eine datenjournalistische Leitlinie geben kann. In den
Experteninterviews wurde deutlich, dass die Befragten ein abzuarbeitendes Schema für den
Berufsalltag durchweg ablehnen. Es scheint jedoch sinnvoll, den von Venohr eingebrachten
Aspekt einer pädagogischen Leitlinie aufzugreifen, die für die Ausbildung gedacht ist und
eine bestimmte Philosophie für den späteren Berufsalltag transportiert. Optimalerweise würde
eine solche Leitlinie so gestaltet sein, dass sie später im Alltag bei Bedarf wieder zur Hand
genommen werden kann und dann die von Elmer als sinnvoll erachtete Checklisten für
bestimmte Arbeitsschritte enthält.
Im ersten Kapitel wurde gefordert, dass eine Leitlinie Orientierung bieten muss. Dies könnte
eine datenjournalistische Leitlinie dadurch erfüllen, dass sie diejenigen Schritte der
Datenbearbeitung erläutert, die von den befragten Experten auf ihren Berufsalltag übertragen
werden konnten. Sie sollte darüber hinaus verdeutlichen, wie Datenrecherche und
herkömmliche Recherche zusammenhängen können. Außerdem muss sie die Flexibilität des
datenjournalistischen Workflows widerspiegeln. 363 Venohr schlug vor, den CRISP-DM-
Prozess einmal für verschiedene Fälle zu sortieren und somit deutlich zu machen, dass es sich
bei den Schritten um Grundbausteine handelt, die in verschiedenen Reihenfolgen auftreten
können.
Wie die Befragten mehrfach betonten, stellt jedes Projekt neue Anforderungen an die
Beteiligten. Es kann daher keine vollständige Checkliste geben, welche Punkte wann in einem
Projekt abzuarbeiten sind. Eine Leitlinie könnte jedoch auf häufig gemachte Fehler im
Umgang mit Daten hinweisen, wie sie in Anhang Anhang IX dargestellt sind. Zusätzlich
könnten Beispiele für bestimmte Problemtypen aus der datenjournalistischen Alltagspraxis
gegeben werden. Ziel dessen wäre es, beim Leser eine Sensibilität dafür herzustellen, welche
Arten von Problemen vorkommen können. Zudem könnte ein Katalog von Kriterien
363 Vgl. dazu auch HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 33.
72
angegeben werden, der bei der Beurteilung der Datenqualität und -zuverlässigkeit hilft. Neben
dem herkömmlichen journalistischen Hinterfragen der Motive und der Unabhängigkeit der
Quelle, könnten hier die Qualitätskriterien der amtlichen Statistik (siehe Anhang XI) als
Orientierung zu Rate gezogen werden. Als zentraler Punkt wäre an dieser Stelle darauf
hinzuweisen, dass der Entstehungskontext der Daten unbedingt genau verstanden werden
muss. 364
Da die Aufbereitung datenjournalistischer Projekte von der Textform bis zur aufwendigen
personalisierbaren Anwendung reichen kann, scheint die Entwicklung einer Leitlinie für
diesen wichtigen Teil der datenjournalistischer Arbeit derzeit nicht möglich. Es könnten
höchstens Stolpersteine bei der Visualisierung von Daten (siehe Anhang IX) genannt und
Erfahrungen mit technischen Umsetzungsaspekten aus bisherigen datenjournalistischen
Projekten gesammelt werden. Hilfreich wäre darüber hinaus vielleicht eine Sammlung von
Beispielen verschiedener möglicher Umsetzungsformen.365
Die bisher skizzierte Leitlinie wäre vielleicht in der Lage, angehenden Datenjournalisten beim
datenbezogenen Teil ihrer Arbeit als Orientierung zu dienen und diesen mit der
herkömmlichen Recherche sowie der Umsetzung in Verbindung zu setzen. Aber würde sie
auch dazu beitragen, die datenjournalistischen Qualitätskriterien zu erfüllen? Da die skizzierte
Leitlinie sich vor allem auf den Daten-Teil des Projekts bezieht, kann sie zur gelungenen
Vermittlung des Themas höchstens indirekt beitragen, indem sie den Journalisten dazu anleitet,
alle nötigen Aspekte des Themas zu durchdringen. Auch das Kriterium der Aktualität kann
eine solche Leitlinie nur indirekt beeinflussen: Unter Umständen verkürzt sie die Projektdauer
indem sie vermeidet, dass der Journalist – wie Elmer es nennt – in die völlig falsche Richtung
losrennt. Einen direkteren Einfluss könnte sie auf die Qualitätskriterien Richtigkeit und
Relevanz haben.
Indem sie Hilfestellung bei der Einschätzung der Datenqualität, deren Bereinigung und
Analyse gibt, könnte sie dazu beitragen richtige, zuverlässige und relevante Ergebnisse zutage
zu fördern. Der Fall ist jedoch komplizierter gelagert als beispielsweise in der
evidenzbasierten Medizin. Dort gilt eine Studie als maximal zuverlässig, wenn sie
randomisiert und kontrolliert vorgenommen wird.366 Man könnte auf die Idee kommen, ein
364 Vgl. dazu auch ANDERL: Der Datenmythos. 365 Einen sehr schönen Überblick über die Umsetzung verschiedener datenjournalistischer Projekte beim Guardian bietet das Buch ROGERS: Facts are sacred. 366 Vgl. z.B. OXFORD CENTRE FOR EVIDENCE-BASED MEDICINE: Levels of Evidence. (01.07.2013) http://www.cebm.net/?o=1025 [abgerufen am 21.08.2013].
73
analoges Schema für den Datenjournalismus entwickeln zu wollen, bei dem in jedem
Arbeitsschritt „Zuverlässigkeits-Punkte“ gesammelt werden. Die Untersuchungen dieser
Arbeit haben jedoch gezeigt, dass der datenjournalistische Arbeitsprozess für solch ein
Unterfangen viel zu stark von Fall zu Fall variiert. Es kann daher keine datenjournalistische
Leitlinie geben, die durch starres Abarbeiten zur Erfüllung der Qualitätskriterien führt. Damit
ein richtiges und relevantes Endprodukt entsteht, wird zusätzlich vom Datenjournalisten viel
eigenes Einschätzungsvermögen und Fachwissen verlangt.
7.4 Reflexion des Forschungsprozesses Bei allen Ergebnissen und Schlussfolgerungen dieser Arbeit muss unbedingt beachtet werden,
dass die empirischen Ergebnisse nicht repräsentativ sind. Es handelt sich bei dieser Arbeit
lediglich um eine Voruntersuchung, die Anregungen für weitere Forschung liefern soll. Es
darf außerdem nicht vernachlässigt werden, dass von Aussagen über Handlungen nicht
unmittelbar auf die tatsächlichen Handlungen geschlossen werden kann. Zwischen diesen
beiden Aspekten liegt der Filter der Erinnerung und Bewertung der befragten Personen.
Dieses Problem könnte nur durch eine Beobachtung ausgeschlossen werden, die im Rahmen
dieser Arbeit aus forschungsökonomischen Gründen keine Option darstellte.
Auch einige mögliche Verfälschungen bei der Datenerhebung und Auswertung sollten
unbedingt bedacht werden. Bei allen Interviews herrschte eine sehr konstruktive Atmosphäre
und große Hilfs- und Kooperationsbereitschaft von Seiten der Befragten. Aus den
Interviewfragen war zwangsläufig ersichtlich, dass die Autorin sich bereits ausführlicher mit
dem Data-Mining-Standardprozess beschäftigt hatte. Es könnte sein, dass die Befragten daher
eher wohlwollend auf die Fragen nach der Vergleichbarkeit und Anwendbarkeit von CRISP-
DM im Datenjournalismus geantwortet haben, um diese Vorarbeit zu wertschätzen. Da jedoch
alle Befragten eine Leitlinie für ihren Berufsalltag deutlich abgelehnt haben, kann diese
Gefahr bis zu einem gewissen Grad ausgeschlossen werden. Auch bestand zu keinem der
Befragten im Vorfeld der Befragung eine nähere Bekanntschaft, die das Antwortverhalten
hätte beeinflussen können. Lediglich Christina Elmer und die Autorin waren sich durch einen
Workshop einige Monate vor der Befragung persönlich begegnet. Während der Gespräche
wurde offenbar, dass die Befragten sich untereinander kennen. Es liegt also eine ungewollte
Vorauswahl der Stichprobe vor, die das Ergebnis insofern beeinflussen könnte, als dass die
Befragten durch fachlichen Austausch eventuell ähnliche Ansichten teilen.
74
An manchen Stellen in den Interviews war zu merken, dass die Befragten bestimmte
Vorstellungen davon hatten, wie sie vielleicht besser arbeiten sollten. Dies zeigte sich wie
vermutet besonders im Zusammenhang mit der Frage nach der Dokumentation der eigenen
Projekte. Solche vermuteten Erwartungshaltungen können sozial erwünschtes
Antwortverhalten auslösen. Da aber häufig entgegen dieser Erwartungshaltungen geantwortet
wurde, kann auch dieser Effekt bis zu einem gewissen Grad ausgeschlossen werden.
Es liegt in der Natur von Befragungen, dass der Interviewer das Antwortverhalten beeinflusst.
In diesem Fall wird der Effekt noch dadurch verstärkt, dass die Arbeitsschritte von CRISP-
DM während der Interviews durch die Autorin auf Wunsch erläutert wurden. Die dabei
gewählte Erklärweise beinhaltet zwangsweise eine Interpretation der Arbeitsschritte und wirkt
sich zudem direkt auf das Antwortverhalten aus. Diese subjektive Verfälschung musste in
Kauf genommen werden, da nur so den Befragten in angemessener Zeit der ganze CRISP-
DM-Ablauf nahegebracht werden konnte.
Eine weitere Fehlerquelle stellt die Extraktion der Ergebnisse aus den Interview-
Transkriptionen dar. Die Zuordnung von Aussagen zu bestimmten Kategorien beinhaltet
zwangsläufig eine Interpretation durch den Forscher. Eine Überprüfung der Intercoder-
Reliabilität würde Auskunft über die Stärke dieses Effekts geben, war jedoch aus
forschungsökonomischen Gründen nicht realisierbar.
Nachdenklich stimmen sollte die Tatsache, dass die Experten mit den CRISP-DM-Schritten
teilweise unterschiedliche Aufgaben in ihrem eigenen Arbeitsprozess assoziierten. Diese
Tatsache wirft die Frage auf, inwiefern CRISP-DM geeignet ist, speziell den
datenjournalistischen Arbeitsprozess zu beschreiben. Die generischen Aufgaben sind
absichtlich sehr allgemein gehalten und lassen sich vielleicht auf noch ganz andere
Arbeitsprozesse übertragen. Daten spielen schließlich in vielen Arbeitsprozessen eine Rolle.
75
7.5 Fazit Durch die Experteninterviews wurde deutlich, dass die strikte Befolgung einer
datenjournalistischen Leitlinie im Berufsalltag als unsinnig angesehen wird. Unter den
Befragten bestand Konsens darin, dass datenjournalistische Projekte dafür zu stark von Fall zu
Fall variieren. Sinnvoll erscheint jedoch die Entwicklung einer pädagogischen Leitlinie für die
Journalisten-Ausbildung, welche die Grundzüge datenjournalistischen Arbeitens aufzeigt und
für mögliche Problemstellungen sensibilisiert. Obwohl die Experten eine Leitlinie im Sinne
einer abzuarbeitenden Liste durchweg ablehnten, wurde an manchen Stellen in den Interviews
der Wunsch nach einer stärkeren Strukturierung des Arbeitsprozesses geäußert. Einzelne
Elemente der pädagogischen Leitlinie könnten in diesen Bereichen als Orientierungshilfe
dienen, indem sie beispielsweise wichtige Fragen auflisten, die es in bestimmten
Projektphasen zu bedenken gilt. Solche Checklisten könnten jedoch nie vollständig sein und
würden daher eher als Anregung und Gedächtnisstütze dienen.
Für eine solche pädagogische Leitlinie kann CRISP-DM hinsichtlich der in Abschnitt 1.2
formulierten Kriterien als geeignete Vorlage bezeichnet werden. Für den Daten-Teil der
Recherche besteht eine weitreichende Übereinstimmung zum datenjournalistischen
Arbeitsprozess. Außerdem könnte eine an CRISP-DM orientierte pädagogische Leitlinie, wie
in Abschnitt 7.3 erörtert, zur Erfüllung datenjournalistischer Qualitätskriterien beitragen.
Selbst wenn die Übereinstimmung von CRISP-DM mit dem datenjournalistischen
Arbeitsprozess – wie in Abschnitt 7.4 vermutet – nicht besonders spezifisch ist, so kann
CRISP-DM dennoch als Gerüst fungieren. Für die Entwicklung einer Leitlinie gilt es, dieses
Gerüst mit Beispielen, Hinweisen und Erklärungen in datenjournalistischer Alltagssprache –
wie in Abschnitt 7.3 skizziert – zu füllen. Es muss nicht nur klar sein, welcher Schritt
unternommen werden muss, sondern auch wie. Außerdem gilt es, Verknüpfungen und
Ergänzungen zu den Aspekten zu schaffen, die durch CRISP-DM nicht berücksichtigt werden.
Dazu zählen die oftmals aufwendige Beschaffung von Daten, die Recherche mittels
herkömmlicher journalistischer Methoden und die Aufbereitung für den Rezipienten. In
Anhang XII wurde eine Literatursammlung zusammengestellt, die bei der konkreten
Formulierung einer solchen Leitlinie Anhaltspunkte bieten könnte.
76
7.6 Ausblick und Forschungsdesiderate
Eine Frage, die sich im Hinblick auf das Fazit dieser Arbeit aufdrängt ist die, inwiefern
Datenjournalisten im Redaktionsalltag den theoretischen Anforderungen einer Lehrbuch-
Leitlinie gerecht werden können. Machill schreibt: „Wenn man aber journalistische Recherche
untersuchen möchte, so wird man nicht den Idealtypus des Journalisten finden, sondern
arbeitende Journalisten, die den Zwängen ihres Arbeitgebers unterworfen sind und
dementsprechend ihr Recherchehandeln aufbauen.“367 Darüber hinaus unterliegen Journalisten,
wie in Abschnitt 2.1.3 dieser Arbeit erörtert wurde, weiteren gesellschaftlichen und
ökonomischen Einflüssen. Ob „guter“ Datenjournalismus umgesetzt werden kann, liegt
außerdem in der Journalisten-Ausbildung begründet. Was müssen Datenjournalisten können?
Gibt es die dafür benötigten Ausbildungsmöglichkeiten? Diese Fragen konnten im Rahmen
der vorliegenden Arbeit nicht behandelt werden. Offen bleibt auch die Frage nach der
Funktion des Datenjournalismus. Hilft er Journalisten dabei, eine Wachhund-Funktion
einzunehmen?
Dass diese Arbeit an einem Lehrstuhl für Wissenschaftsjournalismus entsteht, legt außerdem
die Frage nahe, ob Datenjournalismus für Wissenschaftsjournalisten von besonderer
Bedeutung ist. Sind sie prädestiniert dafür, datenjournalistische Methoden zu nutzen, weil sie
„keine Angst vor Zahlen“ haben? Welche Datenquellen, Chancen und Hindernisse bietet der
Datenjournalismus speziell für Wissenschaftsjournalisten?
Diese Fragen bilden den Ausgangspunkt für weitere Forschungsarbeiten, die unbedingt
unternommen werden sollten, denn wie auch immer die Rolle des Datenjournalismus in
Zukunft beschaffen sein mag: Er ist aus unserer datenüberfluteten Welt nicht mehr
wegzudenken.
367 MACHILL/BEILER/ZENKER: Journalistische Recherche im Internet, S. 36; Vgl. dazu auch MAST: ABC des Journalismus, S. 249 ff.
77
8 Bibliographie
Afghanistan: the war logs. In: the Guardian. (04.08.2010), http://www.theguardian.com/world/the-war-logs [abgerufen am 21.08.2013]. AITAMURTO, Tanja, Esa SIRKKUNEN und Pauliina LEHTONEN: Trends in Data Journalism. (2011), http://virtual.vtt.fi/virtual/nextmedia/Deliverables-2011/D3.2.1.2.B_Hyperlocal_Trends_In%20Data_Journalism.pdf [abgerufen am 22.04.2013]. ALTMEPPEN, Klaus-Dieter: Entscheidungen und Koordinationen. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus: Ein diskursives Handbuch. 1. Aufl. Wiesbaden: VS, Verl. für Sozialwissenschaften 2004, S. 293–310. ANDERL, Sibylle: Der Datenmythos. In: Planckton. (2013), http://blogs.faz.net/planckton/2013/04/11/der-datenmythos-681/ [abgerufen am 22.04.2013]. ANDERSON, David R., Dennis J. SWEENEY und Thomas A. WILLIAMS: statistics (science). In: Encyclopedia Britannica. (2007), http://www.britannica.com/EBchecked/topic/564172/statistics [abgerufen am 03.07.2013]. ARNOLD, Klaus: Qualität im Journalismus – ein integratives Konzept. In: Publizistik. 53/4 (2008), S. 488–508. ARNOLD, Klaus: Qualitätsjournalismus: die Zeitung und ihr Publikum. Konstanz: UVK Verl.-Ges. 2009. AYAß, Ruth: Transkription. In: MIKOS, Lothar (Hrsg.): Qualitative Medienforschung: ein Handbuch. Konstanz: UVK-Verl.-Ges. 2005, S. 377–386. BALOG, Andreas: Rekonstruktion von Handlungen: Alltagsintuitionen und soziologische Begriffsbildung. Opladen: Westdt. Verl. 1989. BALZERT, Helmut: Wissenschaftliches Arbeiten: Wissenschaft, Quellen, Artefakte, Organisation, Präsentation. 1. Aufl., 2. korrigierter Nachdr. Herdecke [u.a.]: W3L-Verl. 2008. BECK, Klaus: Journalistische Qualität in der Wirtschaftskrise. Konstanz: UVK-Verl.-Ges. 2010. BISSANTZ, Nicolas und Jürgen HAGEDORN: Data Mining (Datenmustererkennung). In: Wirtschaftsinformatik. 51/1 (2009), S. 139–144. BOGNER, Alexander (Hrsg.): Das Experteninterview: Theorie, Methode, Anwendung. 2. Aufl. Wiesbaden: VS, Verl. für Sozialwiss. 2005. BONEGROU, Liliana: What are the training needs for data-driven journalism? (2011), http://de.slideshare.net/lilianabounegru/preliminary-results-of-ejc-survey-on-training-needs-for-data-journalism [abgerufen am 22.08.2013]. BONS, Katharina: Datenjournalismus – Neither Rocket Science, nor the Silver Bullet. Eine qualitative explorative Untersuchung in Deutschland und Großbritannien. Diplomarbeit an der TU Dortmund 2012.
78
BRADSHAW, Paul und Liisa ROHUMAA: The Online Journalism Handbook. Skills to survive and thrive in the digital age. Harlow, Essex, New York: Longman 2011. BRANAHL, Udo: Recht und Moral im Journalismus. Der Beitrag des Rechts zur Förderung von „gutem“ beruflichen Verhalten des Journalisten in der Bundesrepublik Deutschland. Medien-Ethik. Beschreibungen, Analysen, Konzepte für den deutschsprachigen Journalismus. In: HALLER Michael und Helmut HOLZHEY (Hrsg.): Medien-Ethik. Beschreibungen, Analysen, Konzepte für den deutschsprachigen Journalismus. Opladen: Westdt. Verlag 1992, S. 224–241 BRENDEL, Detlef und Bernd E. GROBE: Journalistisches Grundwissen: Darstellung der Formen und Mittel journalistischer Arbeit und Einführung in die Anwendung empirischer Daten in den Massenmedien. 1. Aufl. München: Verl. Dokumentation 1976. BRENDEL, Matthias und Frank BRENDEL: Richtig recherchieren: wie Profis Informationen suchen und besorgen. Ein Handbuch für Journalisten, Rechercheure und Öffentlichkeitsarbeiter. 4., erw. Aufl. Frankfurt am Main: FAZ-Inst. für Management-, Markt- und Medieninformationen 2000. BUCHER, Hans-Jürgen: Journalismus als kommunikatives Handeln. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus: ein diskursives Handbuch. 1. Aufl. Wiesbaden: Westdt. Verl. 2000, S. 245–273. BUCHER, Hans-Jürgen: Journalistische Qualität und Theorien des Journalismus. In: BUCHER, Hans-Jürgen (Hrsg.): Qualität im Journalismus: Grundlagen - Dimensionen - Praxismodelle. 1. Aufl. Wiesbaden: Westdt. Verl. 2003, S. 11–34. BUNZ, Mercedes: Das offene Geheimnis: Zur Politik der Wahrheit im Datenjournalismus. In: GEISELBERGER, Heinrich und Dirk BAECKER (Hrsg.): WikiLeaks und die Folgen. Netz, Medien, Politik. Berlin: Suhrkamp 2011, S. 134–151. CHAKRABARTI, Soumen u. a.: Data Mining Curriculum: A proposal (Version 0.91). (2004), http://www.cs.uiuc.edu/~hanj/kdd_curriculum.pdf [abgerufen am 20.08.2013]. CHAPMAN, Pete u. a.: CRISP-DM 1.0. (2000), http://www.the-modeling-agency.com/crisp-dm.pdf [abgerufen am 21.08.2013]. COX, Melisma: The development of computer-assisted reporting. (2000), http://com.miami.edu/car/cox00.pdf [abgerufen am 17.04.2013]. DATENJOURNAL: Ein Einstieg in den Datenjournalismus. Interview mit Bernd Helfert. (2011), http://www.datenjournal.de/dossier/einstieg.html [abgerufen am 17.04.2013]. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Vorschläge zur Sicherung guter wissenschaftlicher Praxis. Proposals for Safeguarding Good Scientific Practice. (1998), http://www.dfg.de/download/pdf/dfg_im_profil/reden_stellungnahmen/download/empfehlung_wiss_praxis_0198.pdf [abgerufen am 21.08.2013]. DEUTSCHE FORSCHUNGSGEMEINSCHAFT: Wer wir sind., http://www.dfg.de/dfg_profil/aufgaben/wer_wir_sind/index.html [abgerufen am 27.07.2013].
79
DOIG, Steve: Basic Steps in Working with Data. In: Data Journalism Handbook. (2012), http://datajournalismhandbook.org/1.0/en/understanding_data_2.html [abgerufen am 21.08.2013]. DONAU-UNIVERSITÄT KREMS: Datenjournalismus in Österreich: Potentiale noch nicht ausgeschöpft. (05.10.2012), http://www.donau-uni.ac.at/de/department/wissenkommunikation/news/id/18611/index.php [abgerufen am 17.08.2013]. DUDEN: Statistik., http://www.duden.de/rechtschreibung/Statistik [abgerufen am 03.07.2013]. EGAWHARY, Elena und Cynthia O’MURCHU: Data Journalism (CAR). (2012), http://issuu.com/tcij/docs/data_journalism_book [abgerufen am 22.04.2013]. ELMER, Christina: Kleine Einführung Datenjournalismus. Vortragsfolien WPK-Workshop: Data Stories I, Berlin 2013. ENYCLOPAEDIA BRITANNICA: data mining (computer science). In: Encyclopedia Britannica, http://www.britannica.com/EBchecked/topic/1056150/data-mining [abgerufen am 29.04.2013]. ESSER, Frank: Die Kräfte hinter den Schlagzeilen. Englischer und deutscher Journalismus im Vergleich. Freiburg [u.a.]: Alber 1998. ESTER, Martin und Jörg SANDER: Knowledge discovery in databases: Techniken und Anwendungen. Berlin [u.a.]: Springer 2000. EUOPEAN JOURNALISM CENTRE und OPEN KNOWLEDGE FOUNDATION: The Data Journalism Handbook., http://datajournalismhandbook.org/ [abgerufen am 17.04.2013]. EUROPEAN JOURNALISM CENTRE: About - F.A.Q. What is data driven journalism?, http://datadrivenjournalism.net/about/faq [abgerufen am 17.04.2013]. EUROPEAN JOURNALISM CENTRE und Mirko LORENZ: DATA-DRIVEN JOURNALISM: How should a curriculum for data journalism trainings look like?, http://www.surveymonkey.com/s.aspx?sm=2jRFF7W5Re%2bj9s5jn3WJcvb9JzKs0HiuTX3JnhrJb3o%3d#q5 [abgerufen am 17.08.2013]. BARLÖSIUS, Eva: Wissenschaft als Feld. In: MAASEN, Sabine (Hrsg.): Handbuch Wissenschaftssoziologie. Wiesbaden: Springer Fachmedien Wiesbaden 2012, S. 125–136. FAYYAD, Usama, Gregory PIATETSKY-SHAPIRO und Padhraic SMYTH: From Data Mining to Knowledge Discovery in Databases. In: AI Magazine. 17 (1996), S. 37–54. FERSCHL, Franz: Deskriptive Statistik. Würzburg [u.a.]: Physica-Verl. 1978. FISCHER, Peter: Lexikon der Informatik. Berlin, Heidelberg: Springer-Verlag Berlin Heidelberg 2011. GEBAUER, Matthias u. a.: Enthüllung brisanter Kriegsdokumente: Die Afghanistan-Protokolle. In: Spiegel Online. (25.07.2010), http://www.spiegel.de/politik/ausland/enthuellung-brisanter-kriegsdokumente-die-afghanistan-protokolle-a-708311.html [abgerufen am 21.08.2013].
80
GLÄSER, Jochen: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen. 4. Aufl. Wiesbaden: VS-Verl. 2010. GLÄSER, Jochen und Grit LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen. 4. Aufl. Wiesbaden: VS-Verl. 2010. GRIESS, Andreas: Datenjournalismus in Deutschland. (27.06.2012), http://de.slideshare.net/agriess/datenjournalismus-in-deutschland [abgerufen am 13.06.2013]. THE GUARDIAN: How to be a data journalist., http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide [abgerufen am 17.04.2013]. HAAS, Hannes: Empirischer Journalismus: Verfahren zur Erkundung gesellschaftlicher Wirklichkeit. Wien [u.a.]: Böhlau 1999. HAASE, Alexander: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus. Bachelorarbeit an der Hochschule Mittweida 2011. HALLER, Michael (Hrsg.): Recherche-Werkstatt. Konstanz: UVK 2001. HALLER, Michael: Recherchieren. 6., überarb. Aufl. Konstanz: UVK Verl.-Ges. 2004. HASTIE, Trevor, Robert TIBSHIRANI und Jerome H. FRIEDMAN: The elements of statistical learning: data mining, inference, and prediction. New York, NY: Springer 2009. HELD, Barbara und Stefan RUß-MOHL: Qualitätsmanagement als Mittel der Erfolgssicherung. In: FASEL, Christoph (Hrsg.): Qualität und Erfolg im Journalismus. Konstanz 2005, S. 49–63. HILLMANN, Karl-Heinz: Wörterbuch der Soziologie. 4., überarb. und erg. Aufl. Stuttgart: Kröner 1994. HIRST, Tony: Several Takes on Defining Data Journalism. (2013), http://schoolofdata.org/2013/06/11/several-takes-on-defining-data-journalism/ [abgerufen am 13.06.2013]. HÖFFE, Otfried (Hrsg.): Lexikon der Ethik. 5., neubearb. und erw. Aufl. München: Beck 1997. HOUSTON, Brant: Computer-assisted reporting: a practical guide. 3. ed. Aufl. Boston [u.a.]: Bedford/St. Martin’s 2004. HUBER, Christian: Das Journalismus-Netzwerk: wie mediale Infrastrukturen journalistische Qualität beeinflussen. Innsbruck [u.a.]: Studien-Verl. 1998. HUDEC, Marcus und Christian NEUMANN: Was ist Statistik? Geschichte, Grundlagen, Anwendungen., http://www.stat4u.at/download/1417/WasIstStatistik.pdf [abgerufen am 20.08.2013]. IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - ein Leitfaden. (2011), ftp://public.dhe.ibm.com/common/ssi/ecm/de/ytw03084dede/YTW03084DEDE.PDF [abgerufen am 21.08.2013].
81
IBM: CRISP-DM 1.0. Data Mining Schritt für Schritt - Ein Leitfaden. IHLE, Anne: Datenjournalismus - ein neues journalistisches Arbeitsfeld? Bachelorarbeit an der TU Ilmenau 2011. INVESTIGATIVE REPORTERS AND EDITORS: About IRE., http://www.ire.org/about/ [abgerufen am 04.08.2013]. INVESTIGATIVE REPORTERS AND EDITORS: NICAR., http://www.ire.org/nicar/ [abgerufen am 17.04.2013]. Iraq: The war logs. In: the Guardian. (22.10.2010), http://www.theguardian.com/world/iraq-war-logs [abgerufen am 21.08.2013]. JAESUNG, SIM: Critical success factors in data mining projects. Dissertation an der University of North Texas 2003. JEKER, Rebecca: Online-Recherche. Strategien für die journalistische Recherche im Internet. In: Medienheft. (2001), http://www.medienheft.ch/uploads/media/k16_JekerRebecca.pdf [abgerufen am 21.08.2013]. KAMPS, Udo: Definition»Statistik«. Gabler Wirtschaftslexikon., http://wirtschaftslexikon.gabler.de/Definition/statistik.html [abgerufen am 03.07.2013]. KAWALKOWSKI, Blasius: Trend oder Zukunft: Daten als zentraler Gegenstand der journalistischen Berichterstattung. Eine Untersuchung zu den Perspektiven und Möglichkeiten des Datenjournalismus. Bachelorarbeit an der Hochschule Bonn-Rhein-Sieg 2012. KLAMMER, Bernd: Empirische Sozialforschung: eine Einführung für Kommunikationswissenschaftler und Journalisten. Konstanz: UVK Verl.-Ges. 2005. KLAMMER, Bernd: Journalistik und Statistik. In: SCHÄFER, Ulrich P. (Hrsg.): Journalismus in Theorie und Praxis: Beiträge zur universitären Journalistenausbildung. Festschrift für Kurt Koszyk. Konstanz: UVK-Medien 1999, S. 227–242. KRÄMER, Walter: So lügt man mit Statistik. Ungekürzte Taschenbuchausg., 12. Aufl. Aufl. München [u.a.]: Piper 2009. KRAMPE, Anna-Lena: Journalistische Datens(ch)ätze. Definition, Einordnung und Qualitätskriterien von Datenjournalismus. Masterarbeit an der Hamburg Media School 2011. KRASSUSKI, Lisa: Qualitätskriterien in der Umweltberichterstattung. Bachelorarbeit an der TU Dortmund 2010. KROMREY, Helmut: Empirische Sozialforschung: Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung. 12., überarb. und erg. Aufl. Stuttgart: Lucius & Lucius 2009. LAFLEUR, Jennifer: A guide to Bulletproofing Your Data. In: GitHub, https://github.com/propublica/guides [abgerufen am 17.08.2013]. LANGER, Ulrike: Schaubild statt Klickstrecke. In: Medium Magazin. (2011), http://www.mediummagazin.de/archiv/2011-2/ausgabe-01022011/schaubild-statt-klickstrecke/
82
[abgerufen am 21.08.2013]. LEHMKUHL, Markus: „Die Wissenschaft hat festgestellt ...“ - zur Qualität der Berichterstattung in der Regionalpresse. In: KIENZLEN, Grit, Jan LUBLINSKI und Volker STOLLORZ (Hrsg.): Fakt, Fiktion, Fälschung. Trends im Wissenschaftsjournalismus. Konstanz: UVK-Verl.-Ges. 2007, S. 50–55. LEIF, Thomas: Leidenschaft: Recherche. Skandal-Geschichten und Enthüllungs-Berichte. Opladen [u.a.]: Westdt. Verl. 1998. LEIF, Thomas (Hrsg.): Mehr Leidenschaft: Recherche. Skandal-Geschichten und Enthüllungs-Berichte. Ein Handbuch zur Recherche und Informationsbeschaffung. 1. Aufl. Wiesbaden: Westdeutscher Verl. 2003. LEßMÖLLMANN, Annette: Datenjournalismus: Chance für den Journalismus von morgen. (2012), http://www.halem-verlag.de/2012/datenjournalismus-chance-fur-den-journalismus-von-morgen/ [abgerufen am 17.04.2013]. LORENZ, Mirko: Datenjournalismus: Lohnt der Aufwand? (18.10.2011), http://de.slideshare.net/mirkolorenz/datenjournalismus-lohnt-der-aufwand [abgerufen am 18.04.2013]. LORENZ, Mirko: Status and Outlook for data-driven Journalism. (2010), http://de.slideshare.net/duarteromero/datadriven-journalism-what-is-there-to-learn-12056926 [abgerufen am 21.08.2013]. LUBLINSKI, Jan: Einführung. Pudding an der Wand. In: KIENZLEN, Grit, Jan LUBLINSKI und Volker STOLLORZ (Hrsg.): Fakt, Fiktion, Fälschung. Trends im Wissenschaftsjournalismus. Konstanz: UVK-Verl.-Ges. 2007, S. 21–24. LUBLINSKI, Jan: Wissenschaftsjournalismus im Hörfunk: Redaktionsorganisation und Thematisierungsprozesse. Konstanz: UVK Verl.-Ges. 2004. LUDWIG, Johannes: Investigativer Journalismus. 2., überarb. Aufl. Konstanz: UVK-Verl.-Ges. 2007. MAASEN, Sabine: Handbuch Wissenschaftssoziologie. Wiesbaden: Springer Fachmedien Wiesbaden 2012. MACHILL, Marcel, Markus BEILER und Martin ZENKER: Journalistische Recherche im Internet: Bestandsaufnahme journalistischer Arbeitsweisen in Zeitungen, Hörfunk, Fernsehen und Online. Berlin: Vistas 2008. MAELICKE, Bernd (Hrsg.): Lexikon der Sozialwirtschaft. 1. Aufl. Baden-Baden: Nomos 2008. MAIER-LEIBNITZ, Heinz: Der geteilte Plato: ein Atomphysiker zum Streit um den Fortschritt. Zürich: Ed. Interfrom [u.a.] 1981. MAST, Claudia: ABC des Journalismus: ein Handbuch. 11., überarb. Aufl. Konstanz: UVK-Verl.-Ges. 2008. MATZAT, Lorenz: Data Driven Journalism: Versuch einer Definition. (2010),
83
http://datenjournalist.de/data-driven-journalism-versuch-einer-definition/ [abgerufen am 18.04.2013]. MATZAT, Lorenz: Datenjournalismus vor dem Internet: Wetterbericht, Finanzdaten und Co. (2010), http://datenjournalist.de/datenjournalismus-vor-dem-internet-wetterbericht-finanzdaten-und-co/ [abgerufen am 20.08.2013]. MATZAT, Lorenz: Datenjournalismus. In: Bundeszentrale für politische Bildung. (2011), http://www.bpb.de/gesellschaft/medien/opendata/64069/datenjournalismus?p=all [abgerufen am 04.08.2013]. MATZAT, Lorenz: Einführung in Datenjournalismus. (16.04.2010), http://de.slideshare.net/wir_sie/einfhrung-in-datenjournalismus-data-driven-journalism [abgerufen am 18.04.2013]. MATZAT, Lorenz und Ulrike LANGER: Aus Zahlen werden Informationen: Datenjournalismus. In: JAKUBETZ, Christian, Ulrike LANGER und Ralf HOHLFELD (Hrsg.): Der Universalcode. Journalismus im digitalen Zeitalter. München: Euryclia 2011, S. 333–358. MATZAT, Lorenz: Man macht sich überprüfbar. In: medium - magazin für journalisten. (2011), http://www.mediummagazin.de/archiv/2011-2/ausgabe-01022011/man%20-macht-sich-uberprufbar/ [abgerufen am 18.04.2013]. MEIER, Klaus: Internet-Journalismus. 3., überarb. und erw. Aufl. Aufl. Konstanz: UVK-Verl.-Ges. 2002. MEYER, Philip: Precision journalism: a reporter’s introduction to social science methods. 4. ed. Aufl. Lanham [u.a.]: Rowman & Littlefield Publ. 2002. MIKOS, Lothar: Qualitative Medienforschung: ein Handbuch. Konstanz: UVK-Verl.-Ges. 2005. NETZWERK RECHERCHE: Leitlinien Recherche-Journalismus. (2010), http://www.netzwerkrecherche.de/nr-Positionen--Positionen-des-netzwerk-recherche/Leitlinien-Recherche-Journalismus/ [abgerufen am 20.08.2013]. OXFORD CENTRE FOR EVIDENCE-BASED MEDICINE: Levels of Evidence. (01.07.2013), http://www.cebm.net/?o=1025 [abgerufen am 21.08.2013]. PATZWALD, MARC: Erzählen nach Zahlen., http://www.epd.de/fachdienst/fachdienst-medien/schwerpunktartikel/erz%C3%A4hlen-nach-zahlen [abgerufen am 13.06.2013]. PIATETSKY-SHAPIRO, Gregory: Poll: Data Mining Methodology. In: KDnuggets. (2007), http://www.kdnuggets.com/polls/2007/data_mining_methodology.htm [abgerufen am 21.08.2013]. PÖTTKER, Horst: Kompensation von Komplexität. Journalismustheorie als Begründung journalistischer Qualitätsmaßstäbe. In: LÖFFELHOLZ, Martin (Hrsg.): Theorien des Journalismus. Ein diskursives Handbuch. Wiesbaden 2000, S. 375–390. PÖTTKER, Horst: Öffentlichkeit durch Wissenschaft. Zum Programm der Journalistik. In: Publizistik. 43 (1998), S. 229–249.
84
RAGER, Günther: Dimensionen der Qualität. Weg aus den allseits offenen Richterskalen? In: BENTELE, Günter und Manfred RÜHL (Hrsg.): Publizistik in der Gesellschaft. Konstanz 1994. ROGERS, Simon: Data journalism at the Guardian: what is it and how do we do it? In: the Guardian. (28.07.2011), http://www.theguardian.com/news/datablog/2011/jul/28/data-journalism [abgerufen am 21.08.2013]. ROGERS, Simon: Facts are sacred: the power of data. London: Faber and Faber 2013. ROGERS, Simon: How to crowdsource MPs’ expenses. In: the Guardian. (18.06.2009), http://www.theguardian.com/news/datablog/2009/jun/18/mps-expenses-houseofcommons [abgerufen am 21.08.2013]. RUß-MOHL, Stefan: Am eigenen Schopfe ... Qualitätssicherung im Journalismus - Grundfragen, Ansätze, Näherungsversuche. In: Publizistik. 37 (1992), S. 83–96. SCHIMANK, Uwe: Wissenschaft als gesellschaftliches Teilsystem. In: MAASEN, Sabine (Hrsg.): Handbuch Wissenschaftssoziologie. Wiesbaden: Springer Fachmedien Wiesbaden 2012, S. 113–124. SÖFJER, Jan: Journalist: Datenjournalismus - Sprich mit Daten. In: Journalist. (2010). STATISTISCHE ÄMTER DES BUNDES UND DER LÄNDER: Die Qualitätsstandards der amtlichen Statistik. (2006), http://www.statistikportal.de/statistik-portal/qualistandards.pdf [abgerufen am 22.08.2013]. STIGLER, SOPHIE: Recherchestrategien im Netz. Das Suchvorgehen von Fachexperten, Netzexperten und Laien im Test. Masterarbeit an der TU Dortmund 2013. TAZ: Flughafen BER. (2013), http://www.taz.de/Fluglaerm-BBI/!t195/ [abgerufen am 20.08.2013]. THIBODEAUX, Troy: 5 tips for getting started in data journalism. (06.10.2011), http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-in-data-journalism/ [abgerufen am 22.04.2013]. VERMANEN, Jerry: Why Is Data Journalism Important? Updating Your Skills Set. In: The Data Journalism Handbook, http://datajournalismhandbook.org/1.0/en/introduction_2.html [abgerufen am 21.08.2013]. WAGNER, Hans: Qualitative Methoden in der Kommunikationswissenschaft: ein Lehr- und Studienbuch. Vollst. überarb., erw. und erg. Neuaufl. Aufl. München: Fischer 2008. WALTER, Nicole: Goldschürfer im Netz. Ein Gespräch mit den Datenjournalisten Matzat und Venohr. In: Fluter. (19.03.2013), http://www.fluter.de/de/120/berufe/11408/ [abgerufen am 13.06.2013]. WEIHS, CLAUS: Data Mining Konzept CRISP-DM. Skript TU Dortmund SoSe 2003 2003. WEISCHENBERG, Siegfried, Maja MALIK und Armin SCHOLL: Journalismus in Deutschland 2005. Zentrale Befunde der aktuellen Repräsentativbefragung deutscher Journalisten. In: Media Perspektiven. 7 (2006), S. 346–361.
85
WEISCHENBERG, Siegfried: Mediensysteme, Medienethik, Medieninstitutionen. Opladen: Westdt. Verl. 1992. WORMER, Holger: Figures, statistics and the journalist: an affair between love and fear. Some perspectives of statistical consulting in journalism. In: Advances in Statistical Analysis. 91/4 (2007), S. 391–397. WORMER, Holger: Improving Health Care Journalism. In: GIGERENZER, Gerd und John A. MUIR GRAY (Hrsg.): Better doctors, better patients, better decisions. Envisioning health care 2020. Cambridge, Mass. [u.a.]: MIT Press 2011, S. 169–188. ZEH, Jürgen: Journalismus als Präzisionsjournalismus. Sozialwissenschaftliche Methodenlehre in der Journalistenausbildung. In: WILKE, Jürgen (Hrsg.): Zwischenbilanz der Journalistenausbildung. München: Ölschläger 1987, S. 145–166. ZEIT ONLINE: Verräterisches Handy. (2011), http://www.zeit.de/datenschutz/malte-spitz-vorratsdaten [abgerufen am 20.08.2013].
i
Anhang I. Tabelle der Definitionskriterien Tabelle 2 Übersicht Definitionskriterien Datenjournalismus
Kriterien Krampe Bons Griess Behrend
Daten sind Quellmaterial und Berichterstattungs-gegenstand
grundlegend grundlegend grundlegend grundlegend
Aus den Daten werden Geschichten generiert
- - grundlegend optional
Gewinnung eines Mehrwerts optional - - grundlegend
Quellen werden transparent gemacht - - optional optional
Veröffentlichung von Rohdaten grundlegend optional optional optional
Interaktivität des daten-journalistischen Produkts
grundlegend - optional optional
Analyse der Daten grundlegend grundlegend - grundlegend
Verknüpfung von Daten optional - - optional
Visualisierung grundlegend optional grundlegend optional
Beschaffung der Daten grundlegend - - -
Recherche (jenseits der Daten) grundlegend grundlegend grundlegend grundlegend
Einsatz von Software/ Computern grundlegend grundlegend - grundlegend
Bearbeitung großer Datenmengen grundlegend - - optional
Textlicher Output optional - - optional
Crowdsourcing - - - -
Das Symbol „-“ gibt an, dass der Aspekt in der jeweiligen Definition nicht direkt
angesprochen wurde. In der rechten Spalte ist aufgeführt, wie die Kriterien in die für
diese Arbeit gültige Definition einfließen.
ii
Anhang II. Skizzen: Datenjournalistischer Arbeitsprozess und CRISP-DM
Die nachfolgenden Skizzen stellen die vermuteten Schnittmengen zwischen
datenjournalistischem Arbeitsprozess und den generischen Aufgaben von CRISP-DM dar.
Überschneidungen der datenjournalistischen Arbeitsschritte untereinander wurden der
Übersichtlichkeit halber nicht dargestellt. Jede Skizze behandelt die Aufgaben einer der
CRISP-DM-Phasen.
iii
iv
v
Anhang III. Interviewleitfaden
vi
vii
viii
Anhang IV. Erläuterungen zu den Interviewfragen
Frage 1: An welchem Ihrer bisherigen datenjournalistischen Projekte haben Sie
besonders gerne gearbeitet?
Die erste Frage des Leitfadens fungiert als sogenannte Eisbrecherfrage und soll als solche
eine gute Gesprächsatmosphäre herstellen. In diesem Fall wird nach einem Projekt
gefragt, an dem der Befragte besonders gern gearbeitet hat. Die Frage zielt nicht direkt
auf die Beantwortung einer Forschungsfrage ab, gewährleistet aber, dass der Interviewte
für den weiteren Gesprächsverlauf ein Beispiel wählt, über das er gerne spricht.
Frage 2: Ich würde gerne genauer auf den Ablauf dieses Projekts eingehen. Welche
Schritte haben Sie dabei vom Beginn bis zum fertigen journalistischen Produkt hin
unternommen?
Diese Frage zielt auf die Beantwortung der Hauptforschungsfrage nach den typischen
Schritten im datenjournalistischen Arbeitsprozess ab. Dass zunächst nach dem Verlauf
eines bestimmten Projekts gefragt wird, hat zwei Gründe. Zum einen soll dem Befragten
so der Einstieg in die Reflektion über die eigene Arbeitsweise erleichtert werden. Zum
anderen liefert dieses Beispiel zusätzliche Anhaltspunkte darüber, wie Datenjournalisten
tatsächlich arbeiten – unabhängig davon, ob sie selbst diese Schritte als typisch
einschätzen.
Frage 3: Welche Arbeitsschritte kommen Ihrer Erfahrung nach unabhängig vom
Projekt immer wieder vor?
Der Befragte wird gebeten, solche Arbeitsschritte zu nennen, die projektübergreifend bei
seiner Arbeit als Datenjournalist immer wieder vorkommen. Es kann kritisiert werden,
dass die Aufmerksamkeit des Interviewten zuvor zu stark auf das Beispielprojekt
fokussiert wurde und die typischen Arbeitsschritte sich folglich zu stark auf diesen
Einzelfall beziehen. Dieses Risiko besteht und muss bei der Auswertung mit in Betracht
gezogen werden. Die Vorteile des Einstiegsbeispiels wurden hier jedoch als überwiegend
angesehen.
Fragen 4 und 5: Haben Sie sich schon einmal konkret mit Data-Mining-Techniken
oder Wissensentdeckung in Datenbanken beschäftigt? Falls ja: Haben Sie schon
einmal etwas von diesem oder einem ähnlichen Standardprozess gehört?
ix
Durch diese Frage sollen unnötige Erläuterungen der Interviewerin vermieden werden.
Zum anderen steht dahinter die Frage, was Datenjournalisten überhaupt über Data-Mining
wissen. Auch könnten die Fragen Hinweise darauf geben, ob Datenjournalisten je nach
Data-Mining-Vorwissen unterschiedliche Arbeitsweise angeben oder die Rolle von
CRISP-DM unterschiedlich einschätzen.
Frage(n) 6: Gibt es bei Ihrer datenjournalistischen Arbeit eine Phase, die man als
XY (z.B. „Untersuchung der Geschäftsziele“) bezeichnen könnte?
Dem Befragten wird ein Schema des CRISP-DM Prozesses mit den sechs Phasen sowie
den generischen Aufgaben jeder Phase vorgelegt (siehe Anhang VI). Der Befragte soll
formulieren, welche Schritte aus dem eigenen Arbeitsprozess er mit den vorgelegten
Phasen assoziiert. Dieses Vorgehen zielt auf die Beantwortung der Forschungsfrage nach
den Gemeinsamkeiten und Unterschieden von CRISP-DM ab. Durch die Assoziationen
der Datenjournalisten wird geprüft, wie Datenjournalisten die generischen Aufgaben von
CRISP-DM auf ihren Arbeitsalltag übertragen. Außerdem werden durch die freie
Assoziation vermutlich solche Handlungen genannt, die den Datenjournalisten von sich
aus als wichtig erscheinen. Durch Nachfragen sollen die Inhalte der generischen
Aufgaben von CRISP-DM genauer mit den assoziierten Arbeitsschritten der
Datenjournalisten verglichen werden. Diese beiden Ebenen des Vergleichs wurden bereits
in Abschnitt 4.2 thematisiert. Die Betrachtung des CRISP-DM-Schemas steht im
Fragebogen nach den Fragen zum Arbeitsprozess, um eine gedankliche Fixierung auf
CRISP-DM zu vermeiden.
Frage 7: Welche Aspekte aus Ihrem Arbeitsalltag als Datenjournalist kommen hier
bei CRISP-DM nicht vor?
Zu Beginn hatte der Befragte bereits die von ihm für typisch gehaltenen Arbeitsschritte
des Datenjournalismus aufgezählt. Aus einem Vergleich dieser Auflistung mit CRISP-
DM ließe sich also schließen, welche Schritte fehlen. Dennoch ist diese Frage wichtig, da
durch sie vielleicht zutage tritt, welche Unterschiede den Datenjournalisten als Erstes ins
Auge fallen oder welche als besonders wichtig erachtet werden.
Frage 8: Bei CRISP-DM ist vorgesehen, dass jeder Schritt und jede Entscheidung
dokumentiert wird. Im Journalismus steht traditionell eher das Endprodukt im
Fokus und nicht der Weg dorthin. Mich würde interessieren, wie das bei Ihrer
Arbeit ist. Wie dokumentieren Sie ihre Projekte?
x
Diese Frage wird als heikel eingestuft, da sie implizit eine Erwartungshaltung
transportieren könnte. Die Befragten könnten annehmen, es sei sozial erwünscht, die
eigenen Projekte zu dokumentieren, um zum Beispiel bei späterer Kritik weniger
angreifbar zu sein. Daher wird auf Empfehlung von Gläser und Laudel hin versucht, die
Tendenz zur sozial erwünschten Antwort zu neutralisieren.368 Durch den Hinweis, dass
im Journalismus traditionell mehr das Endprodukt im Fokus steht, wird suggeriert, dass
eine ausführliche Dokumentation des Arbeitsprozesses nicht unbedingt üblich ist.
Fragen 9 und 10: Glauben Sie, dass man eine hilfreiche Leitlinie für den
Datenjournalismus erstellen könnte? Wenn ja: Wie geeignet ist Ihrer Meinung nach
CRISP-DM als Vorlage für eine solche Leitlinie?
Frage 9 dient als Filterfrage.369 Aufgrund der Antwort wird entschieden, ob es Sinn ergibt,
nach den Gründen für oder gegen CRISP-DM als Leitlinie zu fragen.
Frage 11: Möchten Sie noch etwas ergänzen, was wir bei unserem Gespräch bisher
nicht genug berücksichtigt haben?
Diese Schlussfrage hat zwei Vorteile: Sie ist für den Interviewpartner wahrscheinlich
angenehm und erhöht die Offenheit des Interviews, „indem sie noch einmal zur
Generierung von Informationen anregt, die in der Vorbereitung nicht vorhergesehen
wurden“370.
Optionale Fragen: In welchem Verhältnis stehen Ihrer Meinung nach
datenjournalistische und nicht-datenjournalistische Recherche? Inwiefern
unterscheiden sich die Ziele/Vorgehensweisen datenjournalistischer und anderer
Recherchen?
Da der Fragebogen bereits sehr lang war, wurden die Fragen zu Forschungsfrage 4 nur als
optional mit aufgenommen. Eine sehr offenen Frage („In welchem Verhältnis stehen ...?“)
wird ergänzt durch zwei etwas bestimmtere Fragen nach den unterschiedlichen Zielen
und Vorgehensweisen.
368 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 138. 369 Vgl. ebd., S. 132. 370 Ebd., S. 149.
xi
Anhang V. Fragebogen zu beruflichen Angaben
xii
Anhang VI. CRISP-DM-Übersicht Untersuchung der Geschäftsziele
• Geschäftsziele bestimmen
• Situation beurteilen
• Data-Mining-Ziele bestimmen
• Projektplan erstellen
Datenuntersuchung
• Anfangsdaten erfassen
• Daten beschreiben
• Daten untersuchen
• Datenqualität prüfen
Datenaufbereitung
• Daten auswählen
• Daten bereinigen
• Daten erstellen
• Daten integrieren
• Daten formatieren
Modellierung
• Modellierungsverfahren auswählen
• Testdesign generieren
• Modell erstellen
• Modell beurteilen
Auswertung
• Ergebnisse auswerten
• Prozess prüfen
• Weitere Schritte festlegen
Bereitstellung
• Bereitstellung planen
• Monitoring und Wartung planen
• Schlussbericht erstellen
• Projekt prüfen
xiii
Anhang VII. Potentielle Interviewpartner Tabelle 3 Potentielle Interviewpartner
Name Medium Interviewt (mindestens) von
Christina Elmer Spiegel-Online Bons, Ihle
Lorenz Matzat Open Data City Bons, Krampe, Ihle
Lars-Marten Nagel Welt-Investigativteam Bons
Sascha Venohr Zeit Online Bons
Björn Schwentker Freier Journalist (u.a Dradio
Wissen) Bons
Marco Maas Open Data City Krampe, Ihle
Mirko Lorenz u.a. Trainer für Datenjournalismus Ihle, Laut Website
„heavily overbooked“
Gregor Aisch Programmierer, arbeitet u.a. mit
Mirko Lorenz zusammen. -
Sebastian Mondial Freier Datenjournalist,
Recherche-Spezialist und Trainer Ihle
Julius Tröger Berliner Morgenpost Bons
Judith Pulg Ehemals WDR, jetzt
Koordinationsstelle Uni Augsburg Bons
Sebastian Heiser taz Krampe, Ihle
Anette Leßmöllmann
Professorin für Journalistik/
Wissenschaftsjournalismus,
Hochschule Darmstadt
-
Ulrike Langer Medien-Journalistin -
Lorenz Lorenz-
Meyer
Professor für Online-Journalismus
/ Hochschule Darmstadt Krampe
xiv
Anhang IX. Regeln der Interviewführung nach Gläser und Laudel
• Aktives Zuhören! Durch verbale und nicht-verbale Signale soll der Befragte in
seinem Redefluss bestärkt werden.371
• Nicht unterbrechen! Nachfragen sollten erst gestellt werden, wenn der Befragte
die Antwort beendet hat. Durch die Unterbrechung wird die Antwort sonst
vielleicht in eine ganz andere Richtung gelenkt.372
• Pausen zulassen! Pausen werden in der Alltagskommunikation vermieden.
Während des Interviews müssen sie jedoch ausgehalten werden, da Nachdenken
Zeit braucht.373
• Flexibel fragen! Durch Übergänge soll ein möglichst natürlicher
Gesprächsverlauf geschaffen werden, um den Eindruck eines Verhörs zu
vermeiden.374
• Nicht Verstandenes klären! Es bieten sich geschlossene Frageformen an, wie
z.B. „Habe ich Sie richtig verstanden, dass ...?“375
• Details erfragen! Es bietet sich an, Teile der Antwort zu wiederholen und um
Präzisierung zu bitten.376
• Kurze und eindeutige Nachfragen stellen! Multiple Fragen können den
Befragten leicht überfordern.377
• Kompetenz zeigen! Experteninterviews sollten besonders sorgfältig vorbereitet
werden, um zumindest den Stand eines informierten Laien zu erreichen.378
• Bewertungen vermeiden! Um das Antwortverhalten des Interviewpartners nicht
zu beeinflussen, darf der Interviewer weder negative noch positive Wertungen
ausdrücken.379
371 Vgl. GLÄSER/LAUDEL: Experteninterviews und qualitative Inhaltsanalyse als Instrumente rekonstruierender Untersuchungen, S. 173. 372 Vgl. ebd. 373 Vgl. ebd. S. 173f. 374 Vgl. ebd. S. 174. 375 Vgl. ebd. S. 174f. 376 Vgl. ebd. S. 175. 377 Vgl. ebd. S. 177. 378 Vgl. ebd. 379 Vgl. ebd.
xv
Anhang X. Häufige Fehler im Umgang mit Daten Probleme des Studiendesigns übersehen
Sollen Daten aus einer Studie weiter verarbeitet werden, so gilt es das Studiendesign
genau zu prüfen. Sibylle Anderl betont im FAZ-Blog, wie wichtig das Wissen über die
Entstehung der Daten beim wissenschaftlichen Arbeiten mit ihnen ist.380 Bei Umfragen
können etwa die Fragesituation, Suggestivfragen oder sogar die Anzahl der
Antwortmöglichkeiten das Antwortverhalten stark beeinflusst haben.381 Kritisch geprüft
werden sollte auch, ob die Stichprobe versehentlich auf ungewollte Art und Weise
vorsortiert wurde, weil die Befragung beispielsweise zu einem bestimmten Zeitpunkt an
einem bestimmten Ort durchgeführt wurde.382 Ein wichtiges Element des Studiendesigns
sind auch die verwendeten Definitionen.383 Es gilt zu prüfen welche Definitionen genau
verwendet wurden und ob sie wirklich das aussagen, was sie auf den ersten Blick zu
sagen scheinen. Lohnenswert ist auch die Frage, wer diese Definition aus welchem Grund
so gewählt haben könnte und welche Schlussfolgerungen eine alternative Definition zur
Folge hätte.384
Zahlen schrumpfen, aufblähen und verschleiern
Das in Bezug setzen von Zahlen zueinander bietet allerlei Spielraum. So kann eine Zahl
groß oder klein erscheinen, je nachdem mit welcher anderen Zahl sie verglichen wird.
Prozentangaben sind besonders geeignet um den wahren Charakter von Zahlen zu
verschleiern. So klingt beispielsweise ein um 50% gestiegener Frauenanteil in einem
Unternehmen sehr beeindruckend. Dahinter kann sich jedoch verbergen, dass statt vier
nun sechs Frauen im Unternehmen arbeiten. 385 Wachstumsraten von Wachstumsraten
können Anstiege sehr viel dramatischer erscheinen lassen386 und je nachdem welcher
Mittelwert gewählt wird, kann beispielsweise ein Durchschnittseinkommen sehr
unterschiedlich ausfallen.387 Vorsicht ist auch geboten bei Zahlen, die eine Exaktheit
suggerieren, die in dem Zusammenhang gar nicht zweckmäßig oder realistisch ist.388
380 Vgl. ANDERL: Der Datenmythos. 381 Vgl. KRÄMER, Walter: So lügt man mit Statistik. München [u.a.], 2009, S. 121ff. 382 Vgl. ebd., S. 98. 383 Vgl. ebd., S. 139ff. 384 Vgl. ebd., S. 27ff. 385 Vgl. ebd., S. 53. 386 Vgl. ebd., S. 57ff. 387 Vgl. ebd., S. 64ff. 388 Vgl. ebd., S. 15ff.
xvi
Fehlschlüsse ziehen durch statistischen Fauxpas Manchmal nicht direkt zu erkennen sind Prozentangaben, die sich auf eine irreführende
Basis beziehen. Dass die meisten Unfälle bei moderaten Geschwindigkeiten und nicht bei
Tempo 200 passieren, bedeutet beispielsweise nicht, dass moderate Geschwindigkeiten
gefährlicher sind. 389 Ebenfalls nicht immer gleich zu erkennen ist es, wenn eine
Stichprobe nicht zufällig ausgewählt wurde und dadurch scheinbare Signifikanz erzeugt
wird. Dass im Umkreis eines Atomkraftwerks mehr Krebsfälle vorkommen als im
Bevölkerungsdurchschnitt, heißt nicht automatisch, dass Atomkraftwerke Krebs
verursachen. Vielleicht treten im Umkreis anderer Atomkraftwerke unterdurchschnittlich
viele Fälle auf, werden hier jedoch nicht berücksichtigt.390 Statistisch bedenklich ist auch
eine zu gewagte Extrapolation von Werten in die Vergangenheit oder Zukunft391 sowie
das Schaffen von künstlichen Superlativen durch das Einschränken der
Vergleichsmenge.392 Gibt es nur einen Viehzüchter im Dorf, so hat er auch zwangsläufig
die schönsten Kühe. Ein Klassiker im falschen Umgang mit Daten ist die Verwechslung
von Korrelation und Kausalität. So sollte man sich stets fragen: Gibt es wirklich
Anhaltspunkte für eine Kausalität? Und wenn ja, in welche Richtung wirkt sie?393
Irreführende Visualisierung Trends können bei der Visualisierung auf vielfältige Arten manipuliert werden: Je
nachdem welche Daten mit einbezogen werden, steigt oder fällt der Trend. Anstieg oder
Abfall können durch teilweises Abschneiden der vertikalen Achse noch verstärkt
werden.394 Außerdem können Anstiege, Abfälle und Konstanz auch durch das Dehnen
oder Stauchen von Teilen der Achsen suggeriert werden.395 Bei der mehrdimensionalen
Darstellung von Daten kann schnell ein falscher Eindruck entstehen. Verdoppelt man die
Seitenlänge eines Würfels um eine doppelt so große Zahl zu veranschaulichen, so hat der
Würfel das achtfache Volumen.396 Der Eindruck vom Größenverhältnis der Zahlen wird
also verfälscht. Wer mit Karten arbeitet, sollte sich stets bewusst machen, wie Projektion
und Mittelpunkt gewählt sind und warum.397
389 Vgl. ebd., S. 34. 390 Vgl. ebd., S. 183ff. 391 Vgl. ebd., S. 82ff. 392 Vgl. ebd., S. 87ff. 393 Vgl. ebd., S. 165ff. 394 Vgl. ebd., S. 38. 395 Vgl. ebd., S. 47. 396 Vgl. ebd., S. 113. 397 Vgl. ebd., S. 155ff.
xvii
Falsches Rechnen mit Prozenten
Neben irreführenden Darstellungen, gibt es auch Rechenfehler, die häufig auftreten. Dazu
gehört beispielsweise das Umrechnen von Prozenten in Anteile. Der Satz „60% der
Deutschen mögen Vanilleeis“ bedeutet beispielsweis nicht, dass jeder sechste Deutsche
Vanilleeis mag.398 Häufig werden auch Prozente mit Prozentpunkten verwechselt. Ein
Anstieg der Frauenquote von 30 auf 33% bedeutet beispielsweise einen Zuwachs von 3
Prozentpunkten oder um 10 Prozent.399
398 Vgl. ebd., S. 52f. 399 Vgl. ebd., S. 58f.
xviii
Anhang XI. Qualitätskriterien der amtlichen Statistik
Für amtliche Statistiken gelten nach dem Bundesstatistikgesetz die Grundsätze der
„wissenschaftlichen Unabhängigkeit, Neutralität und Objektivität“ 400 . Die Qualität
statistischer Produkte soll durch die im Europäischen Statistischen System (ESS)401
entwickelten Kriterien gewährleistet werden.402 Diese werden im Folgenden erläutert.
Relevanz
Die Ergebnisse der amtlichen Statistik sind dann relevant, wenn sie den Anforderungen
der Nutzer entsprechen.403 Dazu zählen Ministerien und andere politische Institutionen
ebenso wie Wissenschaft, Medien und potentiell die gesamte Öffentlichkeit. Durch
Befragungen der Nutzer soll die Zufriedenheit mit den Ergebnissen gesteigert werden.404
Genauigkeit
Auch wenn Statistiken die Realität möglichst „genau und zuverlässig wiederspiegeln“405
sollen, sind sie doch stets fehlerbehaftet. Bei der amtlichen Statistik wird eine bestimmte
Genauigkeit festgelegt und angestrebt, die für den Verwendungszweck angemessen
erscheint. Fehler werden so weit wie möglich analysiert und die Ergebnisse der Analyse
veröffentlicht.406
Aktualität und Pünktlichkeit
Amtliche Statistiken sollen „möglichst zeitnah“407 verbreitet werden. Ist die Aktualität
eines Ereignisses besonders wichtig, so werden vorläufige Ergebnisse veröffentlicht.408
Wie schon bei den Qualitätskriterien des Journalismus steht auch hier die Aktualität im
Zielkonflikt mir anderen Kriterien wie zum Beispiel Genauigkeit.409
400 Die Qualitätsstandards der amtlichen Statistik, S. 8. 401 Unter dem Europäischen Statistischen System versteht man die Kooperation des statistischen Amts der Europäischen Union (Eurostat), den nationalen statistischen Ämtern sowie weiteren Einrichtungen der EU-Mitgliedsstaaten, die für die Entwicklung, Erstellung und Verbreitung europäischer Statistiken zuständig sind (Quelle: http://epp.eurostat.ec.europa.eu/portal/page/portal/ess_eurostat/introduction). 402 Vgl. STATISTISCHE ÄMTER DES BUNDES UND DER LÄNDER: Die Qualitätsstandards der amtlichen Statistik. (2006), http://www.statistikportal.de/statistik-portal/qualistandards.pdf [abgerufen am 22.08.2013], S 13. 403 Vgl. ebd. 404 Vgl. ebd. 405 Vgl. ebd. 406 Vgl. ebd., S. 14. 407 Ebd. 408 Vgl. ebd. 409 Vgl. ebd., S. 15f.
xix
Verfügbarkeit und Transparenz
Die Ergebnisse der amtlichen Statistik sollen für die Nutzer leicht zugänglich sein. Es
werden daher möglichst vielfältige Verbreitungswege genutzt und
„Standardinformationen kostenlos zur Verfügung gestellt“ 410 . Zu allen Ergebnissen
müssen Konzept und Methoden vollständig dokumentiert sein.411
Vergleichbarkeit
Die Ergebnisse der amtlichen Statistik sollen zeitlich, räumlich und fachlich vergleichbar
sein.412 Daher werden beispielsweise für Definitionen und Einheiten wenn möglich
internationale Standards verwendet.
Kohärenz
Statistiken aus unterschiedlichen Quellen sollen möglichst widerspruchsfrei miteinander
kombinierbar sein. 413 Auch deshalb sollten also beispielsweise bei Monats- und
Jahreserhebungen die gleichen Definitionen verwendet werden.
410 Ebd., S. 15. 411 Vgl ebd., S. 14. 412 Vgl. ebd., S. 15. 413 Vgl. ebd.
xx
Anhang XII. Hilfreiche Quellen für die Erstellung einer Leitlinie
• Haase stellt in seiner Arbeit einen Workflow vor, „der sich an den Möglichkeiten
von Visual Analytics auf Basis des KDD-Modells orientiert und eine effektive
und erfolgreiche Realisierung von Projekten auf Datenbasis sichern soll.“414
Dabei nennt er beispielsweise zu definierende Zielvorgaben des Projekts,
mögliche Datenfehler und Visualisierungstechniken. Außerdem zitiert er ein 5-
Sterne-System, das die Offenheit der Datenveröffentlichung beurteilt.415
• Sirkkunen et al. erwähnen fünf „Best practice“-Aspekte. Dazu zählen
beispielsweise die Veröffentlichung von Metadaten und das Schaffen eines
Partizipationskanals für die Leser.416
• ProPublica, ein US-amerikanisches Non-Profit-Newsdesk für investigativen
Journalismus, hat eine Checkliste für das Überprüfen von Daten veröffentlicht.
Der „Guide to Bulletproofing Your Data“ enthält unter anderem konkrete
Empfehlungen zu Konsistenschecks und allgemeine Empfehlungen zur
Vorgehensweise bei datenjournalistischen Projekten.417
• Als Anhaltspunkt für die Beurteilung der Gültigkeit von Studienergebnissen im
Journalismus listet Klammer die Standards zur Qualitätssicherung in der Markt-
und Sozialforschung auf. 418 An anderer Stelle gibt er verschiedene
Qualitätskriterien an, die beim journalistischen Umgang mit Statistik einzuhalten
sind.419
414 HAASE: Stories in Data. Das Potential von Daten und ihr Einfluss auf den Journalismus, S. 33ff. 415 Vgl. ebd., S. 43. 416 Vgl. AITAMURTO/SIRKKUNEN/LEHTONEN: Trends in Data Journalism., S. 11f. 417 Vgl. LAFLEUR: A guide to Bulletproofing Your Data. 418 Vgl. KLAMMER: Empirische Sozialforschung, S. 312f. 419 Vgl. KLAMMER: Journalistik und Statistik, S. 237ff.
top related