Kapitel 3 · Bivariate deskriptive Statistik
Zusammenhangsmaße für nominale Merkmale
Idee: beobachtet vs. erwartet
Läge kein Zusammenhang vor, sollten sich die gemeinsamen Häufigkeiten allein aus den Randverteilungen ergeben — das Postulat der empirischen Unabhängigkeit:
Die Diskrepanz zwischen beobachteten und erwarteten misst der χ²-Koeffizient:
Probiere es: Ändere die Zellen und beobachte, wie χ² und Cramérs V reagieren. Setzt du die beobachteten gleich den erwarteten Werten, wird χ² = 0.
Normierung: K, K* und Cramérs V
allein ist schlecht vergleichbar (es wächst mit und der Tafelgröße). Daher normiert man mit :
und liegen in . Für »Bier & Kopfweh« ergibt sich , — also nur ein schwacher Zusammenhang (im Test gegen den Kern reproduziert).
Klausurfalle: Diese Maße messen nur die Stärke, nie die Richtung. Und sie nutzen ausschließlich das Nominalniveau — auch bei höher skalierten Merkmalen. „Positiver Zusammenhang“ ist hier sinnlos.
Übungsaufgaben
Übungsaufgabe Bier & Kopfweh — Kontingenz & χ²
Fiktive Kontingenztafel zu Bierkonsum auf einer Party und Kopfschmerzen am nächsten Tag ():
| Bier | kein Bier | Σ | |
|---|---|---|---|
| Kopfweh | 16 | 40 | 56 |
| kein Kopfweh | 7 | 28 | 35 |
| Σ | 23 | 68 | 91 |
Gibt es einen statistischen Zusammenhang? Berechne den χ²-Koeffizienten und Cramérs V.
R R-Lösung anzeigen
tafel <- matrix(c(16, 40, 7, 28), nrow = 2, byrow = TRUE)
chisq.test(tafel, correct = FALSE)$statistic # chi^2
# Cramérs V:
n <- sum(tafel)
sqrt(chisq.test(tafel, correct = FALSE)$statistic / (n * (min(dim(tafel)) - 1))) X-squared
0.8378525
X-squared
0.09595393 Lösung
0/6 aufgedecktAbruf-Quiz
Frage 1 / 3Tafel [[16,40],[7,28]] (n=91). Welche unter Unabhängigkeit erwartete Häufigkeit gehört in die Zelle „Kopfweh & Bier"? (Zeilensumme 56, Spaltensumme 23)