Fallstricke in der Statistik: Führt Butterkonsum zu einer glücklicheren Ehe?

Khamkéo Vilaysing / Unsplash
Wer kennt es nicht: Die Statistikvorlesung war nicht gerade das Highlight des Studiums und die Lehrkraft hat nur Beispiele gebracht, die mit deinem wissenschaftlichen Alltag nur wenig zu tun haben. Jetzt musst du aber eine Dissertation oder eine Veröffentlichung verfassen, die auf der Auswertung von Krankendaten oder Befragungen basiert.

Welche Fragen sind wichtig?

Zunächst musst du festlegen, welche Parameter für die Beantwortung deiner Forschungsfrage relevant und sinnvoll sind. Du brauchst ein adäquates Set an Fragen, das du gut auswerten kannst.

Es soll beispielsweise der Einfluss des Margarinekonsums auf das allgemeine Wohlbefinden untersucht werden, um damit gesundheitliche Aspekte zu beleuchten. Blutwerte oder körperliche Aktivität wären hier gängige Parameter. Zum allgemeinen Wohlbefinden gehören aber auch die zwischenmenschlichen Beziehungen und so nimmst du die Scheidungsrate mit in deine Statistik auf. So weit, so gut.

Die Datenbasis

Die Qualität der Veröffentlichung oder der Dissertation hängt nicht nur von einer interessanten Fragestellung oder Forschungshypothese ab. Ebenso wichtig ist die korrekte und nachvollziehbare statistische Aufbereitung.

Bereits am Anfang der Arbeit muss die Stichprobengröße bestimmt werden, die für ein repräsentatives Ergebnis mit einer akzeptablen Fehlerspanne notwendig ist. Bei einer betroffenen Gruppe von 500 Personen und einer Fehlerspanne von 10 Prozent brauchen lediglich 80 Personen befragt werden. Ist die Gruppe doppelt so groß und soll die Fehlerspanne z. B. nur bei 3 Prozent liegen, müssen dagegen 525 Personen befragt werden — ein deutlicher Mehraufwand.

Werbung


Damit ist es aber nicht getan. Du solltest bei einer Befragung auch die menschliche Natur berücksichtigen. Nicht alle Personen, die du anschreibst, haben darauf gewartet, dich bei deinem Projekt zu unterstützen. Du musst berechnen, wie viele Personen kontaktiert werden müssen, um genügend Rücklauf für eine statistisch tragfähige Auswertung zu generieren.

Außerdem kann es sein, dass einige Fragen nicht von allen Teilnehmenden beantwortet werden. So muss bereits vor der Befragung entschieden werden, wie damit verfahren wird. Bereits in der Planungsphase ist es daher ratsam, sich Hilfe zu holen.

Jetzt nur noch auswerten?

Du hast genügend Personen befragt oder eine große Zahl von Krankenakten ausgewertet. Alle Ergebnisse sind in einer Tabelle zusammengefasst, jetzt muss nur noch das Statistikprogramm mit den Daten gefüttert werden. Geht doch fix, nicht wahr?

Aber wie müssen die Daten formatiert werden, damit das Statistikprogramm damit arbeiten kann? Welche statistischen Tests sichern die Aussagen ab? Was war noch mal der Unterschied zwischen Koinzidenz, Korrelation und Kausalität? Sofort schwirrt der Kopf: t-Test, ANOVA einseitig oder zweiseitig? Kreuztabellen und p-Werte, Chi-Quadrat und Normalverteilung? Signifikanz? Oder doch lieber Bonferroni und multivariate Tests?

Spätestens jetzt stehst du vor der Wahl, dich entweder selbst in die Materie einzuarbeiten oder jemanden mit Fachwissen zur Unterstützung zu holen. Bei Statistikerinnen und Statistikern ohne medizinische Kenntnisse kann es schnell zu Kommunikationsproblemen kommen, denn nicht jede mathematisch nachweisbare Korrelation beruht auf einer medizinischen Kausalität.

Wenn deine Daten aus dem Margarineprojekt zeigen, dass ein hoher Margarinekonsum zusammen mit einer hohen Scheidungsrate auftritt, und dein Statistiker oder deine Statistikerin dahinter eine Kausalität sehen (http://www.tylervigen.com/spurious-correlations), dann solltest du dir Hilfe von anderer Seite holen. Und nein, ein Wechsel von Margarine zu Butter als Paartherapeutikum kann daraus nicht abgeleitet werden.

Ja, jetzt nur noch auswerten!

Hast du bereits von Anfang an mit einem Medizinstatistiker oder einer Medizinstatistikerin zusammengearbeitet, bist du aus dem Schneider. In dem Fall wärst du bereits zu Beginn darauf aufmerksam gemacht worden, dass die Scheidungsrate hier ein ungeeignetes Maß für das Wohlbefinden ist. Zusammen könnt ihr erarbeiten, welche Einflussfaktoren tatsächlich zu statistisch signifikanten Veränderungen in deiner Studiengruppe geführt haben.

Wenn du also ein derartiges Projekt in Angriff nehmen und die Fallstricke der Statistik vermeiden willst, stehen dir die Kolleginnen und Kollegen von ACAD WRITE in jeder Phase hilfreich zur Seite.

Artikel teilen