Statistik

R-Kurs · Kapitel 5 · Lage- und Streuungsmaße in R

Lage- und Streuungsmaße in R

Lagemaße

R
x <- rep(c(6, 8, 9, 10, 11), c(1, 4, 5, 8, 2))
mean(x)                    # arithmetisches Mittel
median(x)                  # Median
quantile(x, c(.25, .75))   # unteres/oberes Quartil
fivenum(x)                 # Min, Q1, Median, Q3, Max
Ausgabe
[1] 9.25
[1] 9.5
25%  75%
8.75 10.00
[1]  6.0  8.5  9.5 10.0 11.0
Mini-Aufgabe

Berechne für x <- c(4, 8, 15, 16, 23, 42) das arithmetische Mittel, den Median und das 90 %-Quantil.

Lösung zeigen
R
x <- c(4, 8, 15, 16, 23, 42)
mean(x)
median(x)
quantile(x, 0.9)
Ausgabe
[1] 18
[1] 15.5
90%
32.5

Streuungsmaße

var und sd teilen durch n1n-1 (Stichprobe). Spannweite über range bzw. diff(range(...)), Interquartilsabstand mit IQR.

R
var(x)            # Stichprobenvarianz (/ (n-1))
sd(x)             # Standardabweichung
IQR(x)            # Interquartilsabstand
diff(range(x))    # Spannweite = max - min
sd(x) / mean(x)   # Variationskoeffizient
Ausgabe
[1] 1.460526
[1] 1.208522
[1] 1.25
[1] 5
[1] 0.1306511
Mini-Aufgabe

Bestimme die empirische Varianz (Teiler nn) von c(2, 4, 4, 4, 5, 5, 7, 9).

💡 Tipp

var(x) ist die Stichprobenvarianz; mit (n-1)/n rechnest du sie in die empirische Varianz um.

Lösung zeigen
R
x <- c(2, 4, 4, 4, 5, 5, 7, 9)
# empirische Varianz (Teiler n)
n <- length(x)
var(x) * (n - 1) / n
Ausgabe
[1] 4

Box-Plots

boxplot() zeigt die Fünf-Punkte-Zusammenfassung und markiert Ausreißer (außerhalb 1,5IQR1{,}5\cdot IQR):

R
werte <- c(12, 14, 14, 15, 16, 18, 19, 40)  # 40 = Ausreißer
boxplot(werte, horizontal = TRUE,
      main = "Box-Plot", col = "lightblue")
Ausgabe
# Box 14-18.5, Ausreißer bei 40

Merke: var/sd sind die Stichproben-Größen (Teiler n1n-1). Für die empirische Varianz (Teiler nn) multiplizierst du mit n1n\tfrac{n-1}{n}.

Abruf-Quiz

Frage 1 / 2

Teilt var(x) in R durch n oder durch n−1?