Statistik

Formelsammlung & Glossar

Alle Schlüsselbegriffe und Formeln aus den Kapiteln an einem Ort — durchsuchbar und nach Kapitel filterbar.

👉 Für die Klausur die handgeschriebenen Blätter vorbereiten? Der Formelblatt-Planer kuratiert die Formeln und schätzt den Platz (mit den verbindlichen Regeln).

128 Einträge

Deskriptive Statistik
Beschreiben und Verdichten vorliegender Daten (Kennzahlen, Grafiken) — ohne Verallgemeinerung auf eine Grundgesamtheit.K1 · Wozu Statistik?
Induktive (schließende) Statistik
Schluss von der Stichprobe auf die Grundgesamtheit, inkl. Quantifizierung der Unsicherheit (Schätzen, Testen).K1 · Wozu Statistik?
Explorative Statistik
Suchen nach Strukturen/Auffälligkeiten in Daten, oft als Vorstufe; wird häufig mit der Deskription zusammengefasst.K1 · Wozu Statistik?
Grafische Verzerrung
Manipulation des optischen Eindrucks durch Auseinanderziehen/Zusammenschieben der Skalenwerte (z. B. abgeschnittene y-Achse), ohne die Daten zu ändern.K1 · Missbrauch der Statistik
Nichtrepräsentative Daten
Stichprobe, deren Zusammensetzung systematisch von der Grundgesamtheit abweicht — Schlüsse darauf sind verzerrt.K1 · Missbrauch der Statistik
Statistische Einheit
Objekt, an dem die interessierenden Größen erfasst werden (z. B. Person, Wohnung, Baum).K1 · Grundbegriffe
Grundgesamtheit
Menge aller für die Fragestellung relevanten statistischen Einheiten.K1 · Grundbegriffe
Stichprobe
Tatsächlich untersuchte Teilmenge der Grundgesamtheit.K1 · Grundbegriffe
Merkmal
Für die Untersuchung relevante Größe (z. B. Alter, Nationalität).K1 · Grundbegriffe
Merkmalsausprägung
Möglicher oder beobachteter Wert eines Merkmals (z. B. {0,1,2,…} oder {deutsch, französisch, …}).K1 · Grundbegriffe
Qualitatives Merkmal
Ausprägungen sind Namen/Kategorien (nicht messbar im Mengen-Sinn), z. B. Nationalität, Baumart.K1 · Merkmale & Skalenniveaus
Quantitatives Merkmal
Zählbar/messbar, durch Zahlen erfasst, z. B. Alter, Miete, Durchmesser.K1 · Merkmale & Skalenniveaus
Diskretes Merkmal
Endlich oder abzählbar unendlich viele Ausprägungen (z. B. Zimmerzahl, Geschlecht).K1 · Merkmale & Skalenniveaus
Stetiges Merkmal
Alle Werte eines Intervalls möglich (überabzählbar viele Ausprägungen), z. B. Länge, Temperatur.K1 · Merkmale & Skalenniveaus
Nominalskala
Kategorien ohne Rangfolge; nur = / ≠. Zulässig: Häufigkeiten, Modus.K1 · Merkmale & Skalenniveaus
Ordinalskala
Geordnete Kategorien, Abstände nicht interpretierbar; zusätzlich < / >. Zulässig: Median, Quantile.K1 · Merkmale & Skalenniveaus
Intervallskala
Zahlen mit interpretierbaren Abständen, aber ohne absoluten Nullpunkt (z. B. °C). Zulässig: arithm. Mittel, Varianz.K1 · Merkmale & Skalenniveaus
Verhältnisskala
Zahlen mit absolutem Nullpunkt; Verhältnisse interpretierbar (»doppelt so groß«). Zulässig: alle Maße inkl. Variationskoeffizient.K1 · Merkmale & Skalenniveaus
Urliste
Die rohe Beobachtungsreihe x1,,xnx_1,\dots,x_n — die Ergebnisse der Messung an n statistischen Einheiten, unsortiert.K2 · Häufigkeiten
Absolute Häufigkeit h(aj)h(a_j)
Anzahl der Beobachtungen mit Ausprägung aja_j. Es gilt jhj=n\sum_j h_j = n.K2 · Häufigkeiten
Relative Häufigkeit f(aj)f(a_j)
fj=hj/nf_j = h_j/n — Anteil der Ausprägung aja_j. Es gilt jfj=1\sum_j f_j = 1.K2 · Häufigkeiten
Histogramm
Flächenproportionale Darstellung einer klassierten Häufigkeitsverteilung: Balkenhöhe = hj/djh_j/d_j bzw. fj/djf_j/d_j (Häufigkeitsdichte), Fläche ∝ Häufigkeit.K2 · Grafische Darstellungen
Faustregeln Klassenanzahl
knk \approx \sqrt{n} oder k2nk \approx 2\sqrt{n}. Klassengrenzen möglichst einfach, Breiten möglichst gleich.K2 · Grafische Darstellungen
Uni-/bi-/multimodal
Anzahl ausgeprägter Gipfel der Verteilung: ein Gipfel (unimodal), zwei (bimodal), mehrere (multimodal).K2 · Grafische Darstellungen
Linkssteil vs. rechtssteil
Linkssteil (rechtsschief): Daten links konzentriert, Ausläufer rechts (xmod<xmed<xˉx_{mod}<x_{med}<\bar x). Rechtssteil (linksschief): umgekehrt.K2 · Grafische Darstellungen
Empirische Verteilungsfunktion F(x)F(x)
Anteil der Beobachtungen x\le x: F(x)=i:aixfiF(x)=\sum_{i: a_i \le x} f_i. Monoton wachsende Treppenfunktion, 0 für x<a1x<a_1, 1 für xakx \ge a_k.K2 · Kumulierte Häufigkeiten
Kumulierte absolute Häufigkeit H(x)H(x)
Anzahl der Beobachtungen x\le x: H(x)=i:aixhiH(x)=\sum_{i: a_i \le x} h_i. An den Sprungstellen gilt der obere Wert (Treppenkante).K2 · Kumulierte Häufigkeiten
Arithmetisches Mittel xˉ\bar x
xˉ=1nixi\bar x = \frac{1}{n}\sum_i x_i. Schwerpunkt der Daten; nur ab Intervallskala sinnvoll; empfindlich gegen Ausreißer.K2 · Lagemaße
Median xmedx_{med}
Mittlerer Wert der geordneten Reihe. n ungerade: x((n+1)/2)x_{((n+1)/2)}; n gerade: 12(x(n/2)+x(n/2+1))\tfrac12(x_{(n/2)}+x_{(n/2+1)}). Robust, ab Ordinalskala.K2 · Lagemaße
Modus xmodx_{mod}
Häufigste Ausprägung. Bereits für nominale Merkmale geeignet; nicht immer eindeutig.K2 · Lagemaße
Geometrisches Mittel xgeomx_{geom}
x1xnn\sqrt[n]{x_1\cdots x_n}. Für Wachstums-/Zinsfaktoren. Es gilt stets xgeomxˉx_{geom}\le \bar x.K2 · Lagemaße
p-Quantil xpx_p
Trennt die Daten: mind. p100%p\cdot100\% sind xp\le x_p. npnp nicht ganz: x(np)x_{(\lceil np\rceil)}; npnp ganz: 12(x(np)+x(np+1))\tfrac12(x_{(np)}+x_{(np+1)}).K2 · Lagemaße
Lageregeln (unimodal)
Symmetrisch: xmodxmedxˉx_{mod}\approx x_{med}\approx\bar x. Linkssteil: xmod<xmed<xˉx_{mod}<x_{med}<\bar x. Rechtssteil: xmod>xmed>xˉx_{mod}>x_{med}>\bar x.K2 · Lagemaße
Spannweite RR
R=x(n)x(1)=xmaxxminR = x_{(n)} - x_{(1)} = x_{max}-x_{min}. Sehr empfindlich gegen Ausreißer.K2 · Streuungsmaße
Interquartilsabstand IQR
IQR=x0,75x0,25IQR = x_{0{,}75} - x_{0{,}25}. Robustes Streuungsmaß; Länge der Box im Box-Plot.K2 · Streuungsmaße
Empirische Varianz s~2\tilde s^2
s~2=1ni(xixˉ)2\tilde s^2 = \frac1n\sum_i (x_i-\bar x)^2 — Teilung durch n.K2 · Streuungsmaße
Stichprobenvarianz s2s^2
s2=1n1i(xixˉ)2s^2 = \frac{1}{n-1}\sum_i (x_i-\bar x)^2 — Teilung durch n−1 (erwartungstreu, in der induktiven Statistik bevorzugt).K2 · Streuungsmaße
Standardabweichung ss
s=s2s = \sqrt{s^2}. Gleiche Dimension wie die Daten; beschreibt die Streuung um xˉ\bar x.K2 · Streuungsmaße
Variationskoeffizient vv
v=s/xˉv = s/\bar x (alle xi0x_i\ge0, xˉ>0\bar x>0). Dimensionsloses relatives Streuungsmaß zum Vergleich verschiedener Größenordnungen.K2 · Streuungsmaße
Kontingenztafel
Tabelle der gemeinsamen absoluten Häufigkeiten hij=h(ai,bj)h_{ij}=h(a_i,b_j) zweier diskreter Merkmale, ergänzt um Zeilen- und Spaltensummen.K3 · Kontingenztafeln & bedingte Häufigkeiten
Randhäufigkeit
Zeilensumme hi.=jhijh_{i.}=\sum_j h_{ij} (Verteilung von X) bzw. Spaltensumme h.j=ihijh_{.j}=\sum_i h_{ij} (Verteilung von Y).K3 · Kontingenztafeln & bedingte Häufigkeiten
Bedingte relative Häufigkeit
fY(bjai)=hij/hi.f_Y(b_j\mid a_i)=h_{ij}/h_{i.} — Verteilung von Y für festgehaltenes X=aiX=a_i (Normierung auf die Zeilensumme).K3 · Kontingenztafeln & bedingte Häufigkeiten
Empirische Unabhängigkeit
Erwartete Häufigkeit ohne Zusammenhang: h~ij=hi.h.j/n\tilde h_{ij} = h_{i.}\,h_{.j}/n. Beobachtete = erwartete ⇒ kein Zusammenhang.K3 · Zusammenhangsmaße für nominale Merkmale
χ²-Koeffizient
χ2=i,j(hijh~ij)2h~ij[0,)\chi^2=\sum_{i,j}\frac{(h_{ij}-\tilde h_{ij})^2}{\tilde h_{ij}}\in[0,\infty). Misst die Abweichung von der Unabhängigkeit; hängt von n und Tafelgröße ab.K3 · Zusammenhangsmaße für nominale Merkmale
Kontingenzkoeffizient K
K=χ2/(n+χ2)[0,(M1)/M)K=\sqrt{\chi^2/(n+\chi^2)}\in[0,\sqrt{(M-1)/M}), M=min(k,m)M=\min(k,m). Normiert: K=K/(M1)/M[0,1]K^*=K/\sqrt{(M-1)/M}\in[0,1].K3 · Zusammenhangsmaße für nominale Merkmale
Cramérs V
V=χ2/(n(M1))[0,1]V=\sqrt{\chi^2/(n(M-1))}\in[0,1], M=min(k,m)M=\min(k,m). Bei 2×2-Tafeln gleich dem Phi-Koeffizienten.K3 · Zusammenhangsmaße für nominale Merkmale
Empirische Kovarianz s~XY\tilde s_{XY}
s~XY=1ni(xixˉ)(yiyˉ)\tilde s_{XY}=\frac1n\sum_i (x_i-\bar x)(y_i-\bar y). Vorzeichen = Richtung des linearen Zusammenhangs; nicht normiert (skalenabhängig).K3 · Kovarianz & Korrelation
Pearson-Korrelation rr
r=s~XYs~XXs~YY[1,1]r=\frac{\tilde s_{XY}}{\sqrt{\tilde s_{XX}}\sqrt{\tilde s_{YY}}}\in[-1,1]. Normierte Kovarianz; nur linearer Zusammenhang; ausreißerempfindlich.K3 · Kovarianz & Korrelation
Spearman-Rangkorrelation rSPr_{SP}
Pearson auf den Rängen. Für ordinale Daten; erfasst monotone Zusammenhänge; robuster gegen Ausreißer.K3 · Kovarianz & Korrelation
Faustregel Stärke von |r|
schwach r<0,5|r|<0{,}5, mittel 0,5r<0,80{,}5\le|r|<0{,}8, stark 0,8r0{,}8\le|r|.K3 · Kovarianz & Korrelation
Kendalls τ\tau (Rangkorrelation)
Beruht auf konkordanten (C) und diskordanten (D) Paaren: τb=CD(C+D+Tx)(C+D+Ty)\tau_b=\frac{C-D}{\sqrt{(C+D+T_x)(C+D+T_y)}}. Wie Spearman für ordinale Daten, mit Bindungskorrektur.K3 · Kovarianz & Korrelation
Kleinste-Quadrate-Methode
Minimiert i(yiy^i)2\sum_i (y_i-\hat y_i)^2. Lösung: b1=(xixˉ)(yiyˉ)(xixˉ)2b_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}, b0=yˉb1xˉb_0=\bar y-b_1\bar x.K3 · Regressionsrechnung
Ausgleichsgerade
y^=b0+b1x\hat y = b_0 + b_1 x mit KQ-Schätzern. b1b_1 = Steigung (Änderung von Y je Einheit X), b0b_0 = Achsenabschnitt (Y bei X=0).K3 · Regressionsrechnung
Bestimmtheitsmaß R2R^2
Anteil der durch das Modell erklärten Streuung von Y, R2[0,1]R^2\in[0,1]. Bei Einfachregression R2=r2R^2=r^2.K3 · Regressionsrechnung
Residuen
e^i=yiy^i\hat e_i = y_i - \hat y_i — vertikale Abweichung Datenpunkt ↔ Gerade. Muster im Residuenplot deuten auf Modellverletzungen.K3 · Regressionsrechnung
Zufallsexperiment
Vorgang mit mehreren möglichen, im Voraus nicht sicher bestimmbaren Ausgängen, der (gedanklich) beliebig oft unter gleichen Bedingungen wiederholbar ist.K4 · Zufallsexperimente & Ereignisse
Ergebnisraum Ω
Menge aller möglichen Ausgänge (Elementarereignisse ω) eines Zufallsexperiments. Beispiel Würfel: Ω = {1,2,3,4,5,6}.K4 · Zufallsexperimente & Ereignisse
Ereignis A
Teilmenge des Ergebnisraums, AΩA \subseteq \Omega. Tritt ein, wenn das beobachtete Ergebnis in A liegt.K4 · Zufallsexperimente & Ereignisse
Laplace-Wahrscheinlichkeit
P(A)=#gu¨nstige#mo¨glicheP(A)=\frac{\#\text{günstige}}{\#\text{mögliche}} — gültig nur bei endlich vielen, gleichwahrscheinlichen Elementarereignissen.K4 · Wahrscheinlichkeit
Axiome von Kolmogorov
(1) P(A)0P(A)\ge 0; (2) P(Ω)=1P(\Omega)=1; (3) für disjunkte A,BA,B: P(AB)=P(A)+P(B)P(A\cup B)=P(A)+P(B).K4 · Wahrscheinlichkeit
Additionssatz
P(AB)=P(A)+P(B)P(AB)P(A\cup B)=P(A)+P(B)-P(A\cap B). Für disjunkte Ereignisse entfällt der letzte Term.K4 · Wahrscheinlichkeit
Komplementregel
P(Aˉ)=1P(A)P(\bar A)=1-P(A).K4 · Wahrscheinlichkeit
Empirisches Gesetz der großen Zahlen
fn(A)nP(A)f_n(A)\xrightarrow{n\to\infty} P(A): Für großes n liegt die relative Häufigkeit mit großer Wahrscheinlichkeit nahe bei P(A).K4 · Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit
P(AB)=P(AB)P(B)P(A\mid B)=\dfrac{P(A\cap B)}{P(B)} für P(B)>0P(B)>0. Wahrscheinlichkeit von A, wenn B bereits eingetreten ist.K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
Produktsatz (Multiplikationssatz)
P(AB)=P(AB)P(B)=P(BA)P(A)P(A\cap B)=P(A\mid B)\cdot P(B)=P(B\mid A)\cdot P(A).K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
Stochastische Unabhängigkeit
P(AB)=P(A)P(B)P(A\cap B)=P(A)\cdot P(B), äquivalent P(AB)=P(A)P(A\mid B)=P(A): B liefert keine Information über A.K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
Satz von der totalen Wahrscheinlichkeit
Für eine Zerlegung B1,,BkB_1,\dots,B_k von Ω: P(A)=iP(ABi)P(Bi)P(A)=\sum_i P(A\mid B_i)\,P(B_i).K4 · Totale Wahrscheinlichkeit & Satz von Bayes
Satz von Bayes
P(BjA)=P(ABj)P(Bj)iP(ABi)P(Bi)P(B_j\mid A)=\dfrac{P(A\mid B_j)\,P(B_j)}{\sum_i P(A\mid B_i)\,P(B_i)}. Dreht die Bedingung um (a priori → a posteriori).K4 · Totale Wahrscheinlichkeit & Satz von Bayes
Basisraten-Falle
Vernachlässigung der A-priori-Wahrscheinlichkeit (Prävalenz): Bei seltenen Ereignissen ist die A-posteriori-Wahrscheinlichkeit trotz „guter" Tests klein.K4 · Totale Wahrscheinlichkeit & Satz von Bayes
Permutation
Anordnung aller n Elemente in einer Reihenfolge: n!n! Möglichkeiten.K4 · Kombinatorik
Variation (geordnet, ohne Zurücklegen)
k aus n auswählen UND anordnen: n!(nk)!=n(n1)(nk+1)\frac{n!}{(n-k)!}=n(n-1)\cdots(n-k+1).K4 · Kombinatorik
Kombination (ungeordnet, ohne Zurücklegen)
k aus n auswählen ohne Reihenfolge: (nk)=n!k!(nk)!\binom{n}{k}=\frac{n!}{k!\,(n-k)!}.K4 · Kombinatorik
Binomialkoeffizient
(nk)=n!k!(nk)!\binom{n}{k}=\frac{n!}{k!(n-k)!} — Anzahl der k-elementigen Teilmengen einer n-Menge.K4 · Kombinatorik
Zufallsvariable X
Abbildung, die jedem Ergebnis eines Zufallsvorgangs eine Zahl zuordnet. Großbuchstabe X, Realisierung x.K5 · Diskrete Zufallsvariablen
Wahrscheinlichkeitsfunktion f(x)
f(x)=P(X=xi)=pif(x)=P(X=x_i)=p_i an den Trägerpunkten, sonst 0. Analog zur relativen Häufigkeitsverteilung; ipi=1\sum_i p_i = 1.K5 · Diskrete Zufallsvariablen
Verteilungsfunktion F(x) (diskret)
F(x)=P(Xx)=xixf(xi)F(x)=P(X\le x)=\sum_{x_i\le x} f(x_i). Monoton wachsende Treppenfunktion, 0 links, 1 rechts.K5 · Diskrete Zufallsvariablen
Erwartungswert E(X)
E(X)=μ=ixipiE(X)=\mu=\sum_i x_i\,p_i — mit Wahrscheinlichkeiten gewichtetes Mittel der möglichen Werte; Lage/Zentrum der Verteilung.K5 · Erwartungswert & Varianz
Varianz Var(X)
Var(X)=σ2=i(xiμ)2pi=E(X2)μ2\operatorname{Var}(X)=\sigma^2=\sum_i (x_i-\mu)^2 p_i = E(X^2)-\mu^2. Streuung der Verteilung; σ=Var(X)\sigma=\sqrt{\operatorname{Var}(X)}.K5 · Erwartungswert & Varianz
Rechenregeln E/Var
E(aX+b)=aE(X)+bE(aX+b)=aE(X)+b, E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y). Var(aX+b)=a2Var(X)\operatorname{Var}(aX+b)=a^2\operatorname{Var}(X); für unabhängige X,Y: Var(X+Y)=Var(X)+Var(Y)\operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y).K5 · Erwartungswert & Varianz
Bernoulli-Verteilung
X ∈ {0,1} mit P(X=1)=π. E(X)=πE(X)=\pi, Var(X)=π(1π)\operatorname{Var}(X)=\pi(1-\pi). Modell für einen dichotomen Versuch.K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
Diskrete Gleichverteilung
k gleichwahrscheinliche Werte, P(X=xi)=1/kP(X=x_i)=1/k. E(X)=k+12E(X)=\frac{k+1}{2}, Var(X)=k2112\operatorname{Var}(X)=\frac{k^2-1}{12} (für {1,…,k}).K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
Geometrische Verteilung
X = Anzahl Versuche bis zum 1. Erfolg, Träger {1,2,…}. f(x)=(1π)x1πf(x)=(1-\pi)^{x-1}\pi, F(x)=1(1π)xF(x)=1-(1-\pi)^x, E(X)=1/πE(X)=1/\pi, Var(X)=1ππ2\operatorname{Var}(X)=\frac{1-\pi}{\pi^2}.K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
Binomialverteilung
X = Anzahl Erfolge bei n unabhängigen Bernoulli-Versuchen. f(x)=(nx)πx(1π)nxf(x)=\binom{n}{x}\pi^x(1-\pi)^{n-x}, E(X)=nπE(X)=n\pi, Var(X)=nπ(1π)\operatorname{Var}(X)=n\pi(1-\pi).K5 · Binomial- & Poisson-Verteilung
Poisson-Verteilung
Seltene Ereignisse in festem Intervall. f(x)=λxx!eλf(x)=\frac{\lambda^x}{x!}e^{-\lambda}, Träger {0,1,2,…}, E(X)=Var(X)=λE(X)=\operatorname{Var}(X)=\lambda.K5 · Binomial- & Poisson-Verteilung
Binomial vs. geometrisch
Binomial: Anzahl Erfolge bei festem n (Träger 0…n). Geometrisch: Anzahl Versuche bis zum 1. Erfolg (Träger 1,2,…).K5 · Binomial- & Poisson-Verteilung
Wahrscheinlichkeitsdichte f(x)
f(x)0f(x)\ge 0 mit P(aXb)=abf(x)dxP(a\le X\le b)=\int_a^b f(x)\,dx. Fläche = Wahrscheinlichkeit; f=1\int_{-\infty}^{\infty} f=1.K6 · Stetige Zufallsvariablen & Dichte
Verteilungsfunktion (stetig)
F(x)=P(Xx)=xf(t)dtF(x)=P(X\le x)=\int_{-\infty}^x f(t)\,dt. Stetig, monoton wachsend, von 0 nach 1; F(x)=f(x)F'(x)=f(x).K6 · Stetige Zufallsvariablen & Dichte
P(X = x) bei stetiger ZV
Immer 0. Daher P(aXb)=P(a<X<b)P(a\le X\le b)=P(a<X<b) — die Grenzen spielen keine Rolle.K6 · Stetige Zufallsvariablen & Dichte
Erwartungswert (stetig)
E(X)=μ=xf(x)dxE(X)=\mu=\int_{-\infty}^{\infty} x\,f(x)\,dx. Bei symmetrischer Dichte um c ist E(X)=cE(X)=c.K6 · Maßzahlen & stetige Gleichverteilung
Varianz (stetig)
Var(X)=σ2=(xμ)2f(x)dx\operatorname{Var}(X)=\sigma^2=\int_{-\infty}^{\infty}(x-\mu)^2 f(x)\,dx.K6 · Maßzahlen & stetige Gleichverteilung
p-Quantil (stetig)
xpx_p mit F(xp)=pF(x_p)=p. Teilt die Fläche in p links, 1−p rechts. Median = x0,5x_{0{,}5}.K6 · Maßzahlen & stetige Gleichverteilung
Stetige Gleichverteilung U(a,b)
Dichte f(x)=1baf(x)=\frac{1}{b-a} auf [a,b]. E(X)=a+b2E(X)=\frac{a+b}{2}, Var(X)=(ba)212\operatorname{Var}(X)=\frac{(b-a)^2}{12}.K6 · Maßzahlen & stetige Gleichverteilung
Exponentialverteilung
Dichte f(x)=λeλxf(x)=\lambda e^{-\lambda x} (x0x\ge0), F(x)=1eλxF(x)=1-e^{-\lambda x}, E(X)=1/λE(X)=1/\lambda, Var(X)=1/λ2\operatorname{Var}(X)=1/\lambda^2. Modell für Wartezeiten/Lebensdauern.K6 · Exponentialverteilung
Gedächtnislosigkeit
P(X>s+tX>s)=P(X>t)P(X>s+t\mid X>s)=P(X>t): Ein bereits „überlebtes" Bauteil ist so gut wie neu. Charakteristisch für die Exponentialverteilung.K6 · Exponentialverteilung
Normalverteilung N(μ, σ)
Dichte f(x)=1σ2πe12((xμ)/σ)2f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac12((x-\mu)/\sigma)^2}. Symmetrisch um μ, Wendepunkte bei μ±σ. E(X)=μE(X)=\mu, Var(X)=σ2\operatorname{Var}(X)=\sigma^2.K6 · Normalverteilung
Standardisierung
Ist XN(μ,σ)X\sim N(\mu,\sigma), so ist Z=XμσN(0,1)Z=\frac{X-\mu}{\sigma}\sim N(0,1). Damit F(x)=Φ ⁣(xμσ)F(x)=\Phi\!\left(\frac{x-\mu}{\sigma}\right).K6 · Normalverteilung
σ-Regeln
μ±σ ≈ 68,3 %, μ±2σ ≈ 95,4 %, μ±3σ ≈ 99,7 % der Wahrscheinlichkeitsmasse.K6 · Normalverteilung
Wichtige z-Quantile
z₀,₉₀=1,28; z₀,₉₅=1,64; z₀,₉₇₅=1,96; z₀,₉₉=2,33. Symmetrie: zp=z1pz_p=-z_{1-p}, Φ(z)=1Φ(z)\Phi(-z)=1-\Phi(z).K6 · Normalverteilung
Induktive Statistik
Schluss von der Stichprobe auf die Grundgesamtheit mit Hilfe der Wahrscheinlichkeitstheorie. Teilgebiete: Schätzen und Testen.K7 · Induktive Statistik & Zufallsstichproben
Stichprobenvariablen X1,,XnX_1,\dots,X_n
Modellieren die wiederholte Beobachtung von X: unabhängig und identisch verteilt (i.i.d.) wie X. Realisierungen x1,,xnx_1,\dots,x_n sind die Stichprobenwerte.K7 · Induktive Statistik & Zufallsstichproben
Einfache Zufallsstichprobe
Jedes Element der Grundgesamtheit hat dieselbe bekannte Wahrscheinlichkeit, gezogen zu werden. Voraussetzung für induktive Verfahren.K7 · Induktive Statistik & Zufallsstichproben
Schätzfunktion (Schätzer)
Vorschrift, die aus X1,,XnX_1,\dots,X_n einen Näherungswert für einen Parameter berechnet. Als Funktion von Zufallsvariablen selbst eine Zufallsvariable.K7 · Schätzfunktionen & Güte
Erwartungstreue
E(θ^)=θE(\hat\theta)=\theta — kein systematischer Fehler. Z. B. ist Xˉ\bar X erwartungstreu für μ und S2=1n1(XiXˉ)2S^2=\frac{1}{n-1}\sum(X_i-\bar X)^2 für σ².K7 · Schätzfunktionen & Güte
Konsistenz
Mit wachsendem Stichprobenumfang n wird die Schätzung immer genauer (konvergiert gegen den wahren Wert).K7 · Schätzfunktionen & Güte
Effizienz
Eine Schätzfunktion ist effizient, wenn sie bei gegebenem n möglichst kleine Streuung hat (schon bei kleiner Stichprobe brauchbar).K7 · Schätzfunktionen & Güte
Zentrales Schwankungsintervall
P(μz1α/2σXμ+z1α/2σ)=1αP(\mu - z_{1-\alpha/2}\sigma \le X \le \mu + z_{1-\alpha/2}\sigma)=1-\alpha. Für N(0,1): [−1,64;1,64]→90 %, [−1,96;1,96]→95 %, [−2,58;2,58]→99 %.K7 · Prüfverteilungen: χ² und t
χ²-Verteilung
Summe von Quadraten von n i.i.d. N(0,1)-Variablen, χ²(n). E=nE=n, Var=2n\operatorname{Var}=2n. Rechtsschief, nur für x≥0.K7 · Prüfverteilungen: χ² und t
t-Verteilung
T=XZ/nT=\frac{X}{\sqrt{Z/n}} mit XN(0,1)X\sim N(0,1), Zχ2(n)Z\sim\chi^2(n) unabhängig. Symmetrisch um 0, schwerere Ränder; → N(0,1) für n→∞.K7 · Prüfverteilungen: χ² und t
Konfidenzintervall (1−α)
Zufälliges Intervall, das den festen Parameter mit Wahrscheinlichkeit 1−α überdeckt. α = Irrtumswahrscheinlichkeit (üblich 0,10/0,05/0,01).K7 · Konfidenzintervalle
KI für μ, σ bekannt (z-Intervall)
xˉ±z1α/2σn\bar x \pm z_{1-\alpha/2}\,\dfrac{\sigma}{\sqrt n} (X normalverteilt).K7 · Konfidenzintervalle
KI für μ, σ unbekannt (t-Intervall)
xˉ±t1α/2(n1)sn\bar x \pm t_{1-\alpha/2}(n-1)\,\dfrac{s}{\sqrt n}. Für n>30 ist tzt\approx z (Normalapproximation).K7 · Konfidenzintervalle
Breite des KI
Wächst mit dem Konfidenzniveau (1−α) und mit σ; sinkt mit wachsendem n (∝ 1/√n).K7 · Konfidenzintervalle
Null- und Alternativhypothese
H₀ (Gleichheit/kein Effekt, „zu widerlegen") gegen H₁ (Unterschied/Effekt, „zu zeigen"). Sie schließen einander aus.K8 · Testlogik & Hypothesen
Prüfgröße (Testfunktion)
Aus der Stichprobe berechnete Zahl, deren Verteilung unter H₀ bekannt ist. Beim Gauß-Test: Z=Xˉμ0σ/nN(0,1)Z=\frac{\bar X-\mu_0}{\sigma/\sqrt n}\sim N(0,1).K8 · Testlogik & Hypothesen
Ablehnbereich (kritischer Bereich)
Wertebereich der Prüfgröße, bei dem H₀ verworfen wird. Die Wahrscheinlichkeit, unter H₀ hineinzufallen, ist höchstens α. Grenze = kritischer Wert.K8 · Testlogik & Hypothesen
Gauß-Test
Test für μ bei bekanntem σ. Prüfgröße Z=Xˉμ0σ/nN(0,1)Z=\frac{\bar X-\mu_0}{\sigma/\sqrt n}\sim N(0,1) unter H₀.K8 · Gauß-Test
Ein- vs. zweiseitig
Zweiseitig H₁: μ≠μ₀ → Ablehnung bei |Z|>z_{1−α/2}. Einseitig H₁: μ>μ₀ → Z>z_{1−α}; H₁: μ<μ₀ → Z<−z_{1−α}.K8 · Gauß-Test
Fehler 1. Art (α-Fehler)
H₀ ist wahr, wird aber verworfen. Die Wahrscheinlichkeit wird durch das Signifikanzniveau α kontrolliert: P(Fehler 1. Art) ≤ α.K8 · Fehlerarten & Signifikanz
Fehler 2. Art (β-Fehler)
H₁ ist wahr, H₀ wird aber nicht verworfen. β ist nicht direkt kontrollierbar; 1−β ist die Güte (Power) des Tests.K8 · Fehlerarten & Signifikanz
Signifikanzniveau α
Maximal zugelassene Wahrscheinlichkeit für einen Fehler 1. Art. Übliche Werte 0,10 / 0,05 / 0,01. Vorab festlegen!K8 · Fehlerarten & Signifikanz
Güte (Power) 1−β
Wahrscheinlichkeit, einen tatsächlich vorhandenen Effekt zu entdecken. Steigt mit n, mit der Effektgröße und mit größerem α.K8 · Fehlerarten & Signifikanz
t-Test
Test für μ bei UNBEKANNTEM σ. Prüfgröße T=Xˉμ0S/nt(n1)T=\frac{\bar X-\mu_0}{S/\sqrt n}\sim t(n-1) unter H₀. Für n>30 ≈ N(0,1).K8 · t-Test
Gauß- oder t-Test?
σ bekannt → Gauß-Test (z, N(0,1)). σ unbekannt → t-Test (t(n−1)). Bei n>30 beide ≈ Normalapproximation.K8 · t-Test
p-Wert
Wahrscheinlichkeit unter H₀, den beobachteten oder einen extremeren Prüfgrößenwert (Richtung H₁) zu erhalten. Entscheidung: p < α ⇒ H₀ verwerfen.K8 · p-Wert & formaler Testablauf
p-Wert ein-/zweiseitig
Einseitig: Fläche in einem Ende. Zweiseitig: doppelte Fläche des kleineren Endes, p=2P(Zz)p=2\cdot P(Z\ge|z|).K8 · p-Wert & formaler Testablauf
Auswahl eines Tests
Entscheidend: Funktion des Tests, Datenniveau (nominal/ordinal/metrisch), Verteilung der Daten und Stichprobenart (verbunden/unverbunden).K8 · p-Wert & formaler Testablauf
Binomialtest
Exakter Test für einen Anteil, H₀: π = π₀. Prüfgröße = Erfolgszahl k, Prüfverteilung Bin(n, π₀). Für kleine n genauer als der approximative z-Anteilstest.K8 · Binomialtest & Tests via Konfidenzintervall
Dualität Test ↔ Konfidenzintervall
Ein zweiseitiger Test zum Niveau α verwirft H₀: θ=θ₀ genau dann, wenn θ₀ außerhalb des (1−α)-KI liegt. Das KI = Menge der nicht verwerfbaren θ₀.K8 · Binomialtest & Tests via Konfidenzintervall