Statistik

Kapitel 6 · Stetige Zufallsvariablen und Verteilungen

Normalverteilung

📄 Folien:alle Materialien →

Die wichtigste Verteilung

Summen vieler unabhängiger, gleichgroßer Zufallseinflüsse sind annähernd normalverteilt (Gauß-Verteilung) — daher modelliert sie Messfehler, Körpergrößen, Produktionsabweichungen u. v. m.:

f(x)=1σ2πe12(xμσ)2,E(X)=μ,Var(X)=σ2f(x) = \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}, \qquad E(X) = \mu, \quad \operatorname{Var}(X) = \sigma^2

μ\mu verschiebt die Glockenkurve, σ\sigma bestimmt ihre Breite (Wendepunkte bei μ±σ\mu \pm \sigma). Verschiebe Parameter und Grenzen:

μ85105
P(85 ≤ X ≤ 105) = 0.6247z-Werte: -0.51.5

Ziehe die roten Grenzen, um P(a ≤ X ≤ b) als Fläche abzulesen. Der hellblaue Streifen ist die σ-Umgebung μ ± σ und enthält stets ≈ 68,3 % der Fläche — unabhängig von μ und σ. Standardisierung: z = (x − μ)/σ.

Standardisierung

Es gibt unendlich viele Normalverteilungen, deren Integral sich nicht geschlossen berechnen lässt. Der Trick: standardisieren auf N(0,1)N(0,1).

Z=XμσN(0,1),F(x)=Φ ⁣(xμσ)Z = \frac{X - \mu}{\sigma} \sim N(0,1), \qquad F(x) = \Phi\!\left(\frac{x-\mu}{\sigma}\right)

Damit reicht eine Tabelle — die der Standardnormalverteilung Φ\Phi.

Mit der z-Tabelle rechnen

Beispiel Nüchternblutzucker XN(90,10)X \sim N(90, 10):

P(X<75)=Φ ⁣(759010)=Φ(1,5)=1Φ(1,5)=10,9332=0,0668P(X < 75) = \Phi\!\left(\frac{75-90}{10}\right) = \Phi(-1{,}5) = 1 - \Phi(1{,}5) = 1 - 0{,}9332 = 0{,}0668 P(85<X<105)=Φ(1,5)Φ(0,5)=0,93320,3085=0,6247P(85 < X < 105) = \Phi(1{,}5) - \Phi(-0{,}5) = 0{,}9332 - 0{,}3085 = 0{,}6247

Wegen der Symmetrie gilt Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z). (Im Test reproduziert.)

σ-Regeln und wichtige Quantile

IntervallAnteil
μ±σ\mu \pm \sigma≈ 68,3 %
μ±2σ\mu \pm 2\sigma≈ 95,4 %
μ±3σ\mu \pm 3\sigma≈ 99,7 %

Häufig gebrauchte Quantile: z0,90=1,28z_{0{,}90}=1{,}28, z0,95=1,64z_{0{,}95}=1{,}64, z0,975=1,96z_{0{,}975}=1{,}96, z0,99=2,33z_{0{,}99}=2{,}33. Für N(μ,σ)N(\mu,\sigma) gilt xp=μ+zpσx_p = \mu + z_p\cdot\sigma.

Klausurfalle: Vor dem Tabellennachschlagen standardisieren (z=(xμ)/σz=(x-\mu)/\sigma). Für negative zz die Symmetrie Φ(z)=1Φ(z)\Phi(-z)=1-\Phi(z) nutzen — die Tabelle listet nur z0z \ge 0.

Übungsaufgaben

Übungsaufgabe Schraubenlänge — Normalverteilung & z-Standardisierung mittel Übung 11, Aufgabe 1

Die Schraubenlänge XX (in mm) einer Sorte ist normalverteilt mit μ=30\mu=30 mm und σ=0,2\sigma=0{,}2 mm.

a) Berechne die Wahrscheinlichkeit, dass die Länge (i) größer als 30,27 mm, (ii) kleiner als 29,86 mm, (iii) zwischen 29,86 mm und 30,27 mm ist. c) Bestimme das zentrale Schwankungsintervall, in dem die Länge mit 90 % Wahrscheinlichkeit liegt.

NormalverteilungStandardisierungStandardnormalverteilungzentrales Schwankungsintervall
R R-Lösung anzeigen
R
pnorm(30.27, mean = 30, sd = 0.2, lower.tail = FALSE)  # i) P(X > 30.27)
pnorm(29.86, mean = 30, sd = 0.2)                       # ii) P(X < 29.86)
pnorm(30.27, 30, 0.2) - pnorm(29.86, 30, 0.2)           # iii) dazwischen
qnorm(c(0.05, 0.95), mean = 30, sd = 0.2)               # c) 90%-Intervall
Ausgabe
[1] 0.08851
[1] 0.2419637
[1] 0.6695
[1] 29.671 30.329

Lösung

0/6 aufgedeckt
Übungsaufgabe Nüchternblutzucker — Normalverteilung mittel Vorlesung K6 (Beispiel mit verdeckter Lösung)

Der Nüchternblutzucker XX (in mg/dl) sei normalverteilt mit μ=90\mu = 90 und σ=10\sigma = 10.

Wie groß ist die Wahrscheinlichkeit, dass der Nüchternblutzucker a) unter 75 mg/dl bzw. b) zwischen 85 und 105 mg/dl liegt?

NormalverteilungStandardisierungz-Tabelle
R R-Lösung anzeigen
R
pnorm(75, mean = 90, sd = 10)                     # P(X < 75)
pnorm(105, mean = 90, sd = 10) - pnorm(85, 90, 10) # P(85 < X < 105)
Ausgabe
[1] 0.0668072
[1] 0.6246553

Lösung

0/5 aufgedeckt
Übungsaufgabe Kaffee-Füllgewicht — Normalverteilung in R leicht Übung 12, Aufgabe 2

Ein Unternehmen füllt Kaffee in 500-g-Packungen; das Füllgewicht XX ist normalverteilt mit μ=500\mu=500 g und σ=5\sigma=5 g. Löse in R: a) Berechne die Wahrscheinlichkeit, dass das Füllgewicht (i) weniger als 490,2 g, (ii) mehr als 508,2 g, (iii) zwischen 485 g und 515 g beträgt. b) Bestimme die zentralen Schwankungsintervalle für 68,27 %, 95,45 % und 99,73 %.

RNormalverteilungpnormzentrales SchwankungsintervallSigma-Regeln
R R-Lösung anzeigen
R
pnorm(490.2, mean = 500, sd = 5)                       # i) P(X < 490.2)
pnorm(508.2, mean = 500, sd = 5, lower.tail = FALSE)   # ii) P(X > 508.2)
pnorm(515, 500, 5) - pnorm(485, 500, 5)                # iii) P(485 < X < 515)
500 + c(-1, 1) * 1 * 5      # b) 68.27%-Intervall
500 + c(-1, 1) * 2 * 5      #    95.45%-Intervall
500 + c(-1, 1) * 3 * 5      #    99.73%-Intervall
Ausgabe
[1] 0.0249979
[1] 0.05050258
[1] 0.9973002
[1] 495 505

Lösung

0/6 aufgedeckt
Übungsaufgabe Zufallszahlen & Simulation in R (set.seed) leicht Übung 12, Aufgabe 3

Löse in R: a) Initialisiere den Zufallszahlengenerator mit 42, erzeuge 100 standardnormalverteilte Zufallszahlen und stelle sie in einem Histogramm dar. b) Simuliere 60 Würfe eines fairen Würfels und bestimme die relativen Häufigkeiten (vorher den Generator mit einem festen Wert initialisieren).

RSimulationset.seedrnormsamplerelative Häufigkeit
R R-Lösung anzeigen
R
set.seed(42)
z <- rnorm(100)                 # 100 Werte aus N(0,1)
hist(z, main = "100 x rnorm(1)")
set.seed(1)
wuerfe <- sample(1:6, 60, replace = TRUE)
prop.table(table(wuerfe))       # relative Häufigkeiten
Ausgabe
wuerfe
    1      2      3      4      5      6
0.150  0.183  0.133  0.200  0.167  0.167

Lösung

0/5 aufgedeckt
Quellen:K06 S.361, K06 S.364, K06 S.368, K06 S.371, K06 S.373, K06 S.377, K06 S.378, K06 S.381, K06 S.386

Abruf-Quiz

Frage 1 / 4

Nüchternblutzucker X ~ N(90, 10). Wie groß ist P(X < 75)? (4 Nachkommastellen, Φ(−1,5)=1−0,9332)