24. Juni 2012

Statista - trau, schau, wem

Statista.com erfreut sich bei Studenten immer größerer Beliebtheit -- kostenlose, leicht zugängliche Daten und nützliche Infografiken, die sich in jeder Seminararbeit gut machen.

Aber halt! Oft gibt es Missverständnisse oder ungenügendes Verständnis von dem, was Statista ist, was es anbietet, und wie man das Portal am besten nutzt. Darum hier ein paar Tipps -- und kleine Warnungen.

Zunächst: Statista ist keine Statistikbehörde, sondern ein kommerzieller Dienstleister. Das Unternehmen verdient Geld damit, Daten anderer einzusammeln, aufzubereiten und zugänglich zu machen. Statista erhebt selbst keine Statistiken.
Statista ist erst einmal "nur" ein komfortables Recherche-Tool, ein Katalog. 

Und: Statista bietet viel, aber das Beste ist nicht kostenlos. Studenten können aber auch an die hochwertigen Inhalte gelangen.

Nicht nur durch Gratis-Angebote zappen - Uni-Zugang nutzen

Studenten klicken sich meist durchs öffentlich frei zugängliche Web-Angebot. Dies ist nur ein kleiner Teil der Datenbank.

Wichtig: Wer alle Infos zur veröffentlichten Statistik sehen will, (z.B. den Herkunftsnachweis) muss sich ein Basisdienst-Konto freischalten lassen. Das ist erst einmal gratis.

Viele Angebote findet man zwar, sie sind jedoch gesperrt. Man braucht ein Premium-Account. Das kann sich der Student natürlich nicht leisten. Muss er aber auch nicht: Viele Hochschulbibliotheken haben Statista per Campus-Lizenz abonniert, so dass über die Uni oft die vollen Datensätze mit allen Infos für Studenten erreichbar sind!

Also: In die digitale Uni-Bibliothek einloggen und von dort aus in der gesamten Statista-Datenbank recherchieren. 

Woher stammen die Daten überhaupt? 

Statista wirbt damit, dass es 10.000 verschiedene Quellen hat. Allein diese hohe Zahl sollte misstrauisch machen. 

Gute, verlässliche Daten erheben ist teuer und aufwändig. Abgesehen von staatlichen Statistikämtern und öffentlichen Institutionen, die vom Steuerzahler unterhalten werden, haben Auftraggeber teurer Studien in der Regel kein Interesse daran, "einfach so" zum Nutzen der Allgemeinheit aufwändig erlangte Daten unters Publikum zu streuen.

Auftraggeber haben allenfalls ein Interesse daran, bestimmte Daten in die Öffentlichkeit zu bringen (und andere vielleicht nicht). Die Absicht: Sie können auf einen Werbeeffekt hoffen. Oder sie möchten Image-PR machen, mit den Daten etwas ins gute (oder schlechte) Licht rücken, eine Debatte beeinflussen oder anderes mehr.

Daher ist es sehr wichtig, dass Statista-Nutzer die Ursprungsquelle kennen – und sich einen Reim darauf machen, was die Absicht ist. Statista sagt:
"Zu jeder Statistik veröffentlichen wir die verfügbaren Metadaten wie Quelle, Veröffentlichungsdatum, Anzahl der Befragten usw. und machen so alle Angaben auf Statista überprüfbar. Aufbereitungen von Datensätzen erfolgen nach wissenschaftlichen Kriterien."
Klingt gut, aber: Das heißt noch nicht, dass die Ursprungsdaten streng neutral und nach allen Regeln wissenschaftlicher Transparenz und Methodik erhoben wurden. Und über die Selektivität der veröffentlichten Daten wissen wir damit auch nichts. Mag sein, dass die Leute bei Statista sehr sorgfältig sind. Aber sie sind nur Zweitverwerter. Sie zitieren nur.

An anderer Stelle sagt Statista:
"Statista kann Ihnen nicht die Entscheidung abnehmen, welcher Quelle und welcher Erhebung Sie Ihr Vertrauenschenken – oder welcher Methodik."

Das ist eben der Grund, weshalb Statista Herkunfts- und Metadaten transparent macht. 

Tatsache ist, dass Statista unter den 10.000 Quellen z.B. auch Pressemitteilungen von Verbänden und Unternehmen nutzt. Wie genau werden diese überprüft? Wird die Methodik unter die Lupe genommen? Wohl kaum so, wie die höchste Qualität es erforderlich machen würde. Statista ist kein Statistik-TÜV. Statista lebt davon, möglichst viele Daten ins System zu bringen -- und haftet nicht für Unfug und Manipulation, die darin stecken.

Beispiel: Da verbreitet etwa eine Internet-Partnervermittlung über Statista die Ergebnisse einer User-Umfrage übers Online-Flirten -- schon an der Formulierung der Fragen erkennt man, dass da kein Wissenschaftler am Werk war, sondern clevere Marketingleute.

Jeder kennt diese lustigen Web-Umfragen und -Abstimmungstools. Mit seriöser, repräsentativer und methodisch sauberer Sozialforschung haben sie nicht unbedingt etwas zu tun. Also kritisch bleiben.

Damit soll nicht gesagt sein, dass Statista eine Deponie für Datenmüll ist. Nein, bei Statista finden sich ebenso hochseriöse Daten. Nur muss man sich selbst die Mühe machen, das eine vom anderen zu unterscheiden.

Allgemein: Der größte Teil statistischer Daten, die kostenlos in die Öffentlichkeit gelangen und von diversen Medien (Zeitungen, Portalen, Blogs und eben auch Statista) verbreitet werden, wird im Bereich der Marktforschung produziert. Es gibt gute und schlechte Marktforschung, vor allem aber ist sie meist Auftragsforschung, und auf Märkten gibt es Käufer- und Verkäufer-Interessen.

Güte und Qualität der Erhebung sollte man abschätzen können. Repräsentativität ist so ein kritischer Punkt, aber auch zahlreiche andere Faktoren - von Auswahlkriterien über die Erhebungs- und Gewichtungsmethodik bis zur Frageformulierung. Selbst wenn keine Manipulationsabsicht besteht, können handwerkliche Fehler passieren, oder das Grundkonzept ist Mist.
Außerdem sollte man sich natürlich darüber klar sein, dass Statistik nicht gleich Statistik ist. Eine Meinungsumfrage ist etwas anderes als eine Güterzählung vom Zoll.

Im Zweifel zurück zum Original - keine Zitatzitate

Statista ist erst einmal ein komfortables Recherche-Tool, ein Katalog. Gerade in der wissenschaftlichen Arbeit sollte man aber nicht Statista als Quelle begutachten und zitieren, sondern zum Original gehen, wenn irgend möglich.

Viele Statista-Quellen sind nicht exklusiv bei Statista zu haben, sondern wurden anderswo bereits veröffentlicht -- oftmals eingebettet in größere Berichte oder angereichert um zusätzliche Daten und Präsentationen.

Verweist Statista unter einer hübschen Grafik etwa als Quelle auf den Branchenverband XYZ, wird man wahrscheinlich auf der Website von XYZ eine Publikation mit genau diesen Daten finden. Denn der Verband nutzt Statista als Veröffentlichungs-Plattform -- aber nicht als einzige. Möglicherweise sind beim Verband sogar noch hübschere Grafiken zu finden, vor allem aber wird der Kontext sichtbar. Und es gibt mehr zum Thema.

Ein anderes Beispiel: Wenn Statista etwas vom EU-Statistikamt Eurostat präsentiert, sollte man sich die Daten auch direkt bei Eurostat ziehen. Großer Vorteil: Dort lassen sich die Daten individuell zusammenstellen, außerdem ermöglichen Grafik-Tools diverse Darstellungsoptionen. Infografiken kann man sich also so bauen, wie sie für den Nutzer sinnvoll sind.

Studenten lernen im Studium, dass man Zitat-Zitate vermeiden soll. Wenn also Müller in einem Buch einen Aufsatz von Schmidt zitiert, und der Student möchte das Schmidt-Zitat in der Seminararbeit nutzen, sollte er den Schmidt-Aufsatz aufstöbern und daraus direkt zitieren -- statt sich darauf zu verlassen, dass Müller den Schmidt richtig zitiert hat.

So ist es auch bei Statistiken. Statista ist wie Müller, der Schmidt zitiert. Nutzen Sie Statista, um Schmidt zu finden, und dann schauen Sie sich Schmidt an -- und zitieren Sie Schmidt.

Weitere Posts zum Thema:

Keine Kommentare:

Kommentar veröffentlichen

Fragen? Kommentare? Nur zu!