Kapitel 2 · Univariate deskriptive Statistik
Lagemaße
Das Zentrum einer Verteilung
Lagemaße verdichten die Daten zu einem »typischen« Wert. Setze selbst Punkte und beobachte, wie Mittel und Median auf einen Ausreißer reagieren:
Arithmetisches Mittel
Es entspricht dem physikalischen Schwerpunkt, ist nur ab Intervallskala sinnvoll und empfindlich gegenüber Ausreißern.
Median
Der Median ist der Wert in der Mitte der geordneten Reihe :
Er ist robust (ab Ordinalskala) und bei wenigen Werten, Asymmetrie oder Ausreißerverdacht zu bevorzugen.
Modus und geometrisches Mittel
- Modus : häufigste Ausprägung, bereits für nominale Merkmale.
- Geometrisches Mittel : für Wachstums-/Zinsfaktoren. Beispiel: Faktoren → (≈ 4,66 % p. a.).
Quantile und Fünf-Punkte-Zusammenfassung
Das p-Quantil trennt die Daten so, dass mindestens darunter liegen:
Spezialfälle: = Median, = unteres, = oberes Quartil. Die Fünf-Punkte-Zusammenfassung fasst die Verteilung kompakt zusammen (Basis des Box-Plots).
Lageregel als Schiefe-Indikator: Je stärker sich , und unterscheiden, desto schiefer die Verteilung.
Übungsaufgaben
Übungsaufgabe Geometrisches Mittel als R-Funktion schreiben
Schreibe in R eine Funktion geom.Mittel, die für positive Daten
das geometrische Mittel
berechnet. Teste deine Funktion anschließend mit den Daten .
R R-Lösung anzeigen
geom.Mittel <- function(x){
n <- length(x)
prod(x)^(1/n) # n-te Wurzel aus dem Produkt
}
geom.Mittel(x = c(2, 8, 4)) [1] 4 Lösung
0/5 aufgedecktAbruf-Quiz
Frage 1 / 3Median der Werte ? (n=10, geordnet)