Beispiel: Bildung und sozioökonomischer Status

Die Story

Nehmen wir als Beispiel ein fiktives Forschungsprojekt, in der der Zusammenhang von sozioökonomischem Status und Bildungsniveau (gemessen in Jahren im Bildungssystem) untersucht wird. Das Forschungsteam hat eine Vermutug: Je mehr Bildung eine Person genießt, desto höher ist in der Folge ihr sozioökonomischer Status. Sie fragen 100 Menschen im Alter von 40 Jahren, wie viele Jahre sie im Bildungssystem verbracht haben, das beinhaltet z.B. alle Schulformen, Fachhochschulen und Universitäten. Eine Person, die mit 6 Jahren eingeschult wird und mit 26 ihr Studium abschließt hat somit 20 Jahre im Bildungssystem verbracht. Zusätzlich füllen die Befragten eine Skala aus, mit der ihr sozioökonomischer Status eingeschätzt wird.

Die Analyse

Die Forscher:innen finden einen deutlichen Zusammenhang: Je mehr Jahre Menschen im Bildungssystem verbrachten, desto höher ist ihr sozioökonomischer Status. Pro zusätzlichem Bildungsjahr war der sozioökonomische Status im Mittel um \(\beta\) = 0.12 Standardabweichungen höher (95 %-Konfidenzintervall: [0.06, 0.19]), ein hochgradig signifikanter Zusammenhang (\(t\) = 3.66, p < 0.001). Das Forschungsteam sieht die Hypothese bestätigt: Bildung erhöht den sozioökonomischen Status.

Abbildung 2: Zusammenhang von Bildungsniveau und sozioökonomischem Status. ‘r’ gibt die Korrelation an. Simulierte Daten.

Der Haken

Unsere Wissenschaftler:innen waren leider zu voreilig, denn der beschriebene Zusammenhang ist nicht hinreichend für einen Kausalzusammenhang. Gehen wir unsere drei Kriterien von oben einmal durch:

✅ Korrelation: Wir haben eine Korrelation gefunden.
- An dieser Stelle besteht trotzdem immer das Risiko eines Typ-1-Fehlers, also eines falsch-positiven Befunds. Eine statistisch signifikante Korrelation kann eben auch Zufall sein.
❓ Zeitliche Abfolge: Wir haben keine Daten über eine zeitliche Abfolge der Variablen vorliegen. Damit kann eine umgekehrte Kausalrichtung nicht ausgeschlossen werden. Genau genommen sind drei Szenarien denkbar:
- Das Bildungsniveau verursacht Unterschiede im sozioökonomischen Status
- Sozioökonomischer Status verursacht Unterschiede im Bildungsniveau. Das kann der Fall sein, falls der sozioökonomische Status über die Lebensspanne weitgehend stabil bleibt - so könnten Kinder aus wohlhabenderen Familien aufgrund ihres höheren soz.-ök.-Status es sich möglicherweise eher leisten, mehr Zeit im Bildungssystem zu verbringen.
- Bildungsniveau und sozioökonomischer Status stehen in einer wechselseitigen Ursache-Wirkungs-Beziehung zueinander, d.h. beide sind sowohl Ursache als auch Wirkung: Möglicherweise können Kinder aus wohlhabenderen Familien länger im Bildungssystem bleiben, wodurch sie ihren soziokömomischen Status wiederum weiter verbessern könnten.
❓ Alternativerklärungen sind nicht ausgeschlossen. Damit könnte es sein, dass beide Faktoren durch einen dritten, unbeobachteten Faktor verursacht werden, und dadurch eine Scheinkorrelation entsteht (siehe Konfundierung).

Wie umgehen mit dem Haken?

Korrelation als schwacher Test

Auch wenn Korrelation allein keine hinreichende Bedingung für Kausalität ist, können wir uns den Umstand zunutze machen dass sie immerhin eine notwendige Bedingung ist: Wenn keine Korrelation vorliegt, dann liegt auch kein Kausalzusammenhang vor. Das bedeutet, wir können Korrelationen durchaus als schwachen Test für Theorien und Hypothesen über Kausalität sehen, mit dem wir eine der drei notwendigen Bedingungen für Kausalität überprüfen und eine kausale Theorie falsifizieren können.

Zwei Worte der Vorsicht!

Damit wir überzeugt sein können, dass ein bestimmter Effekt nicht vorliegt, müssen wir besonderes Augenmerk auf unsere Typ-2-Fehlerrate (auch “Beta-Fehler”, im Kontrat zum “Alpha-Fehler”), also den Anteil falsch-negativer Ergebnisse richten. Der häufige Fall einer bloßen nicht-Widerlegung der Nullhypothese (p > 0.05) ist nur bei hoher Power ein wertvoller Hinweis und insgesamt nicht die ideale Methode, um die Abwesenheit eines Effekts zu überprüfen. Zum Test der Abwesenheit eines Effekts können Äquivalenztests eingesetzt werden (siehe Link unten).
Die statistische Korrelation bildet lineare Zusammenhänge ab, in der realen Welt gibt es aber auch nicht-lineare, z.B. exponentielle Zusammenhänge. Deshalb kann das fehlen einer linearen Korrelation nur lineare Kausalzusammenhänge widerlegen.

Was macht einen starken Test aus?

Ein starker Test bezieht alle Bedingungen für Kausalität mit ein:

Korrelation: Der statistische Zusammenhang wird überprüft. Typ-1- und Typ-2-Fehlerrate werden kontrolliert.
Zeitliche Abfolge: Durch das Studiendesign wird sichergestellt, dass die UV vor der AV auftritt, so dass nur eine Kausalrichtung (UV wirkt auf AV) möglich ist. Hierzu dienen bspw. Längsschnittstudien und vorher-nachher-Vergleiche in Experimenten.
Ausschluss von konfundierenden Alternativerklärungen: Der “Gold-Standard” ist das randomisierte Experiment (siehe Konfundierung). Wenn Randomisierung nicht möglich ist, können theoretisch-logischen Überlegungen und der statistischen Kontrolle von potentiellen konfundierenden Störvariablen genutzt werden.

Warum ist der Haken wichtig?

Wir betrachten hier kurz sowohl die wissenschaftliche, als auch die Praktiker-Perspektive.

Wissenschaftliche Perspektive | Die wissenschaftliche Perspektive stellt den Erkenntnisgewinn in den Mittelpunkt: Stimmt unsere Theorie?

Ein passendes statistisches Verfahren, bspw. durch Rechnung einer Korrelation oder Kontrolle von potentiellen konfundierenden Störvariablen, ist eine notwendige, aber keine hinreichende Bedingung für einen starken Test von kausalen Theorien. Das bedeutet, wenn wir einen Datensatz haben, in dem die zweite und dritte Bedingung für Kausalität nicht überprüft werden können, dann können wir dieses Manko nicht durch eine andere rechnerische Analyse kompensieren: Das Studiendesign ist wichtig. Gleichwohl muss auch bei geeignetem Studiendesign natürlich auf die angemessene statistische Analyse geachtet werden.
- Eine Korrelation zwischen zwei Variablen ist konsistent mit einer kausalen Beziehung zwischen diese Variablen. Wenn keine Korrelation gefunden wird (siehe “Zwei Worte der Vorsicht”), spricht das gegen eine kausale Beziehung.
- Eine Korrelation allein ist aber keine überzeugende Evidenz für eine Kausalbeziehung oder für eine bestimmte Richtung einer Kausalbeziehung. Dafür müssen die zeitliche Abfolge berücksichtigt und Alternativerklärungen ausgeschlossen werden.
Das bedeutet: Wenn wir Korrelationen ohne Rücksicht auf das Studiendesign kausal interpretieren, dann riskieren wir falsche Schlussfolgerungen.

Praktiker-Perspektive | Die praktische Perspektive stellt die Nützlichkeit einer aus der Forschung abgeleiteten Intervention in den Mittelpunkt: Sollten wir die Intervention einsetzen?

Wenn wir auf Basis rein korrelativer Daten eine Intervention umsetzen, dann kann es sein, dass der gewünschte Effekt ausbleibt: Vielleicht ist die Kausalrichtung eine andere.
Solche Daten sollten deshalb nicht als einzige Evidenz zur Bedrüngung von praktischen Entscheidungen verwendet werden. Vielmehr sollten sich Praktiker als Risikomanager:innen verstehen und die theoretische Plausibilität und empirische Evidenz ganzheitlich betrachten. Auf dieser Basis können sie verschiedene Szenarien abwägen und eine bestmöglich fundierte Entscheidung treffen.
Dahingehend treffen die gleichen, detaillierteren Überlegungen zu, die wir in unserem Artikel zu Konfundierung (siehe “Warum ist der Haken wichtig?”) geschildert haben.

Studierenden-Perspektive

Besonders für Studierende ist es wichtig, Kernaussagen prägnant zusammenfassen zu können.

Frage: Die Autoren berichten von einer Korrelation zwischen Bildungsjahren und sozioökonomischem Status und werten das als Evidenz für ihre Theorie, dass mehr Bildung zu einem höheren sozioökonomischen Status führt. Wie bewerten Sie die Evidenz?

Mögliche Antwort: Zunächst einmal ist die Korrelation konsistent mit der Theorie. Allerdings kann durch die bloße Berechnung einer Korrelation in dem berichteten Querschnittsdesign weder die umgekehrte Kausalrichtung ausgeschlossen werden, noch können konfundierende Einflüsse von Drittvariablen ausgeschlossen werden. Deshalb handelt es sich allenfalls um einen schwachen Test der Theorie, die Evidenz ist nicht hinreichend für die Schlussfolgerung.

Frage: Würden Sie auf Basis dieser Ergebnisse zusätzliche Investitionen ins Bildungsystem befürworten?

Mögliche Antwort: Diese konkrete Evidenz ist nicht eindeutig und daher keine gute Entscheidungsgrundlage. Die Frage nach Investitionen ins Bildungssystem sollte allerdings mit einem größeren Horizont betrachtet werden: Es gibt durchaus plausible Gründe anzunehmen, dass Investitionen in Bildung von Nutzen sind. Der Umstand, dass die korrelative Evidenz unbefriedigend ist, kann keineswegs als Beleg des Gegenteils gelten.

Literatur und Links

Cook, Thomas D., and Donald T. Campbell. Quasi-Experimentation: Design & Analysis Issues for Field Settings. Houghton Mifflin Company, Boston 1979.
Äquivalenztests: Lakens, D., Scheel, A. M., & Isager, P. M. (2018). Equivalence Testing for Psychological Research: A Tutorial. Advances in Methods and Practices in Psychological Science, 1(2), 259–269. https://doi.org/10.1177/2515245918770963

Kausalität und Korrelation

Johannes Brachem & Christian Treffenstädt

Was ist Kausalität?