Statistik

Kapitel 5 · Diskrete Zufallsvariablen und Verteilungen

Bernoulli, Gleichverteilung & geometrische Verteilung

📄 Folien:alle Materialien →

Bernoulli: der einzelne Versuch

Ein Bernoulli-Experiment hat genau zwei Ausgänge (Erfolg/Misserfolg). Die Bernoulli-Variable ist

X={1Ereignis A tritt ein0sonst,P(X=1)=πX = \begin{cases} 1 & \text{Ereignis } A \text{ tritt ein} \\ 0 & \text{sonst} \end{cases}, \qquad P(X=1)=\pi

mit E(X)=πE(X)=\pi und Var(X)=π(1π)\operatorname{Var}(X)=\pi(1-\pi). Ein Bernoulli-Prozess wiederholt das Experiment nn-mal unabhängig bei konstantem π\pi — die Grundlage für Binomial- und geometrische Verteilung.

Diskrete Gleichverteilung

Sind alle kk Werte gleichwahrscheinlich (P(X=xi)=1/kP(X=x_i)=1/k, z. B. fairer Würfel), liegt die diskrete Gleichverteilung vor. Für {1,,k}\{1,\dots,k\}: E(X)=k+12E(X)=\frac{k+1}{2}, Var(X)=k2112\operatorname{Var}(X)=\frac{k^2-1}{12}.

Geometrisch: Warten auf den ersten Erfolg

Wiederholt man einen Bernoulli-Versuch, bis AA zum ersten Mal eintritt, ist X=X = »Anzahl der Versuche« geometrisch verteilt (Träger {1,2,3,}\{1,2,3,\dots\}):

f(x)=(1π)x1π,F(x)=1(1π)x,E(X)=1πf(x) = (1-\pi)^{x-1}\pi, \qquad F(x) = 1 - (1-\pi)^x, \qquad E(X) = \frac{1}{\pi}

Beispiel (Übung 8): Nur 10 % der Personen sind für eine Studie geeignet. Wahrscheinlichkeit, dass die erste geeignete genau die fünfte ist: 0,940,1=0,065610{,}9^4\cdot 0{,}1 = 0{,}06561. Innerhalb der ersten 5: 10,95=0,409511-0{,}9^5 = 0{,}40951. Erwartete Anzahl: 1/0,1=101/0{,}1 = 10. (Im Test gegen den Kern reproduziert.)

Merke: Geometrisch zählt die Wartezeit bis zum ersten Erfolg (Träger ab 1); binomial zählt die Erfolge bei festem nn (Träger ab 0). Nächster Abschnitt.

Übungsaufgaben

Übungsaufgabe Studien-Screening — geometrische Verteilung mittel Übung 8, Aufgabe 2

Nur 10 % der Personen erfüllen nach Prüfung alle Kriterien einer klinischen Studie. XX sei die Anzahl der Screenings bis zur ersten geeigneten Person.

a) Welche Verteilung hat XX? b) Wahrscheinlichkeit, dass die erste geeignete Person (i) gerade nach vier ungeeigneten gefunden wird, (ii) innerhalb der ersten 5 Screenings, (iii) in den ersten 5 Screenings nicht gefunden wird? c) Erwartete Anzahl Screenings (jedes dauert 2 h)?

Achtung R: dgeom/pgeom zählen die Misserfolge k=x1k = x-1 vor dem ersten Erfolg. Für „die fünfte Person” also dgeom(4, 0.1).

geometrische VerteilungWartezeitErwartungswert
R R-Lösung anzeigen
R
# R zählt MISSERFOLGE vor dem 1. Erfolg (k = x - 1)
dgeom(4, prob = 0.1)        # P(X = 5): 4 Misserfolge, dann Erfolg
pgeom(4, prob = 0.1)        # P(X <= 5)
1 - pgeom(4, prob = 0.1)    # P(X > 5)
1 / 0.1                     # E(X) im "Anzahl Versuche"-Modell
Ausgabe
[1] 0.06561
[1] 0.40951
[1] 0.59049
[1] 10

Lösung

0/7 aufgedeckt
Übungsaufgabe Hotline — geometrische Verteilung in R leicht Übung 9, Aufgabe 3

Ein Kunde erreicht eine Hotline pro Anruf mit Wahrscheinlichkeit π=0,3\pi=0{,}3 (Versuche unabhängig). XX = Anzahl der Versuche bis zum ersten Erfolg ist geometrisch verteilt. Löse in R: a) Berechne die Wahrscheinlichkeit, dass der Kunde (i) beim ersten Versuch, (ii) erst beim fünften Versuch, (iii) innerhalb der ersten 10 Versuche durchkommt. b) Stelle die Wahrscheinlichkeitsfunktion als Stabdiagramm dar.

Rgeometrische VerteilungdgeompgeomStabdiagramm
R R-Lösung anzeigen
R
dgeom(0, prob = 0.3)            # i) P(X = 1) = beim 1. Versuch
dgeom(4, prob = 0.3)            # ii) P(X = 5) = erst beim 5. Versuch
pgeom(9, prob = 0.3)            # iii) P(X <= 10)
x <- 1:15
plot(x, dgeom(x - 1, 0.3), type = "h",
     main = "Geometrische Verteilung (pi = 0.3)",
     xlab = "Versuch x", ylab = "P(X = x)")
Ausgabe
[1] 0.3
[1] 0.07203
[1] 0.9717525

Lösung

0/6 aufgedeckt
Quellen:K04 S.283, K04 S.284, K04 S.289, K04 S.293, K04 S.294, K04 S.313

Abruf-Quiz

Frage 1 / 3

Screening: nur 10 % der Personen sind geeignet. X = Anzahl Screenings bis zur ersten geeigneten (geometrisch, π=0,1). Wie groß ist P(X=5)? (4 Nachkommastellen)