Kapitel 3 · Bivariate deskriptive Statistik
Kovarianz & Korrelation
Vom Streudiagramm zur Kovarianz
Das Streudiagramm (Scatterplot) zeigt die Punktwolke . Die Abweichungsprodukte sind positiv im 1./3. Quadranten (bezogen auf den Schwerpunkt ) und negativ im 2./4. Ihre Summe, geteilt durch , ist die empirische Kovarianz:
Sie ist positiv/negativ je nach Richtung — aber nicht normiert (sie hängt von den Maßeinheiten ab). Die Kovarianz mit Nenner heißt .
Pearson-Korrelation
Teilt man die Kovarianz durch das Produkt der Standardabweichungen, erhält man den dimensionslosen Bravais-Pearson-Korrelationskoeffizienten:
Ziehe selbst Punkte und beobachte , die Regressionsgerade und live:
Faustregel: schwach, mittel, stark.
Spearman, Ausreißer und Anscombe
misst nur lineare Zusammenhänge und reagiert empfindlich auf Ausreißer — ein einzelner Punkt kann von auf nahe ziehen. Das berühmte Anscombe-Quartett zeigt vier völlig verschiedene Punktwolken mit identischem . Deshalb: immer zusammen mit dem Streudiagramm interpretieren.
Für ordinale Daten oder robustere Aussagen nutzt man Spearmans — Pearson angewandt auf die Ränge. Es erfasst monotone Zusammenhänge.
Eine zweite Rangkorrelation ist Kendalls : Sie zählt konkordante Paare (gleiche Richtung in und , ) gegen diskordante ():
( = nur in bzw. nur in gebundene Paare). ist interpretierbar als Differenz der Anteile gleich- und gegenläufiger Paare.
Korrelation ≠ Kausalität
Die wichtigste Klausur- und Lebensfalle: Korrelation misst nur einen statistischen Zusammenhang. Sie sagt nichts über Ursache und Wirkung und nicht über die Richtung (, nicht ). Eine dritte Variable kann beide treiben (Scheinkorrelation).
Übungsaufgaben
Übungsaufgabe Heringe & Drinks — Korrelation (Pearson & Spearman)
Student Johnnie Walker vermutet einen Zusammenhang zwischen der Anzahl konsumierter Heringe und der Anzahl der tags zuvor getrunkenen Drinks . An Wochenenden erhob er:
| (Drinks) | 1 | 0 | 9 | 7 | 4 | 6 | 8 |
|---|---|---|---|---|---|---|---|
| (Heringe) | 1 | 2 | 8 | 7 | 3 | 3 | 4 |
a) Zeichne ein Streudiagramm — welcher Zusammenhang ist zu vermuten? b) Ergänze den Schwerpunkt. c) Berechne und interpretiere die Pearson-Korrelation. d) Berechne und interpretiere die Spearman-Korrelation.
R R-Lösung anzeigen
drinks <- c(1, 0, 9, 7, 4, 6, 8)
heringe <- c(1, 2, 8, 7, 3, 3, 4)
plot(drinks, heringe, main = "Streudiagramm")
cor(drinks, heringe) # Pearson
cor(drinks, heringe, method = "spearman") # Spearman [1] 0.8202869
[1] 0.9198053 Lösung
0/8 aufgedecktAbruf-Quiz
Frage 1 / 4Punktwolke mit , , . Wie groß ist Pearsons ? (2 Nachkommastellen)