Kapitel 2 · Univariate deskriptive Statistik
Häufigkeiten
Von der Urliste zur Verteilung
Ausgangspunkt ist die Messung eines Merkmals an statistischen Einheiten. Das Ergebnis der -ten Messung ist , die gesamte unsortierte Reihe heißt Urliste (oder Beobachtungsreihe, Stichprobe).
Absolute und relative Häufigkeit
Für jede mögliche Ausprägung aus :
- Die absoluten Häufigkeiten summieren sich zur Gesamtzahl: .
- Die relativen Häufigkeiten summieren sich zu Eins: .
Die Auflistung der Ausprägungen mit ihren Häufigkeiten ist die Häufigkeitsverteilung — klassisch als Tabelle dargestellt.
Beispiel »Maßkrug Bier«
Urliste (n = 10):
| Ausprägung | 0 | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|---|
| 3 | 1 | 1 | 2 | 2 | 1 | |
| 0,3 | 0,1 | 0,1 | 0,2 | 0,2 | 0,1 |
Kontrolle: und . ✓
Übung: Häufigkeitsverteilung in R
Die Häufigkeitsverteilung lässt sich in R mit einem einzigen Befehl (table)
bestimmen. Probiere es an einem binären Merkmal:
Übungsaufgabe Allergie — Häufigkeiten & Diagramme in R
Für das Merkmal „Allergie” mit den Ausprägungen „ja” (1) und „nein” (0) wurden bei einer Befragung folgende Daten erhoben ():
0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1
Löse in R: a) Bestimme die absolute Häufigkeitsverteilung. b) Erstelle ein Kreisdiagramm. c) Erstelle ein Säulendiagramm der relativen Häufigkeiten. Beschrifte beide Grafiken angemessen.
R R-Lösung anzeigen
Allergie <- c(0,0,1,0,1,0,0,0,1,0,0,0,0,0,0,0,1,0,0,1,0,0,
0,0,0,0,0,0,0,0,1,1,1,0,1)
table(Allergie) # a) absolute Häufigkeiten
pie(table(Allergie), labels = c("nein","ja"),
main = "Allergie, n = 35") # b) Kreisdiagramm
barplot(table(Allergie)/length(Allergie),
names.arg = c("nein","ja"),
main = "Allergie, n = 35",
ylab = "rel. Häufigkeit") # c) Säulendiagramm Allergie
0 1
26 9 Lösung
0/5 aufgedecktNächster Schritt: Diese Verteilung lässt sich grafisch darstellen — und dabei lauert die häufigste Histogramm-Falle.
Abruf-Quiz
Frage 1 / 2Eine Ausprägung kommt 12-mal in Beobachtungen vor. Wie groß ist ihre relative Häufigkeit?