Formelsammlung & Glossar

Alle Schlüsselbegriffe und Formeln aus den Kapiteln an einem Ort — durchsuchbar und nach Kapitel filterbar.

👉 Für die Klausur die handgeschriebenen Blätter vorbereiten? Der Formelblatt-Planer kuratiert die Formeln und schätzt den Platz (mit den verbindlichen Regeln).

128 Einträge

Deskriptive Statistik: Beschreiben und Verdichten vorliegender Daten (Kennzahlen, Grafiken) — ohne Verallgemeinerung auf eine Grundgesamtheit.K1 · Wozu Statistik?
Induktive (schließende) Statistik: Schluss von der Stichprobe auf die Grundgesamtheit, inkl. Quantifizierung der Unsicherheit (Schätzen, Testen).K1 · Wozu Statistik?
Explorative Statistik: Suchen nach Strukturen/Auffälligkeiten in Daten, oft als Vorstufe; wird häufig mit der Deskription zusammengefasst.K1 · Wozu Statistik?
Grafische Verzerrung: Manipulation des optischen Eindrucks durch Auseinanderziehen/Zusammenschieben der Skalenwerte (z. B. abgeschnittene y-Achse), ohne die Daten zu ändern.K1 · Missbrauch der Statistik
Nichtrepräsentative Daten: Stichprobe, deren Zusammensetzung systematisch von der Grundgesamtheit abweicht — Schlüsse darauf sind verzerrt.K1 · Missbrauch der Statistik
Statistische Einheit: Objekt, an dem die interessierenden Größen erfasst werden (z. B. Person, Wohnung, Baum).K1 · Grundbegriffe
Grundgesamtheit: Menge aller für die Fragestellung relevanten statistischen Einheiten.K1 · Grundbegriffe
Stichprobe: Tatsächlich untersuchte Teilmenge der Grundgesamtheit.K1 · Grundbegriffe
Merkmal: Für die Untersuchung relevante Größe (z. B. Alter, Nationalität).K1 · Grundbegriffe
Merkmalsausprägung: Möglicher oder beobachteter Wert eines Merkmals (z. B. {0,1,2,…} oder {deutsch, französisch, …}).K1 · Grundbegriffe
Qualitatives Merkmal: Ausprägungen sind Namen/Kategorien (nicht messbar im Mengen-Sinn), z. B. Nationalität, Baumart.K1 · Merkmale & Skalenniveaus
Quantitatives Merkmal: Zählbar/messbar, durch Zahlen erfasst, z. B. Alter, Miete, Durchmesser.K1 · Merkmale & Skalenniveaus
Diskretes Merkmal: Endlich oder abzählbar unendlich viele Ausprägungen (z. B. Zimmerzahl, Geschlecht).K1 · Merkmale & Skalenniveaus
Stetiges Merkmal: Alle Werte eines Intervalls möglich (überabzählbar viele Ausprägungen), z. B. Länge, Temperatur.K1 · Merkmale & Skalenniveaus
Nominalskala: Kategorien ohne Rangfolge; nur = / ≠. Zulässig: Häufigkeiten, Modus.K1 · Merkmale & Skalenniveaus
Ordinalskala: Geordnete Kategorien, Abstände nicht interpretierbar; zusätzlich < / >. Zulässig: Median, Quantile.K1 · Merkmale & Skalenniveaus
Intervallskala: Zahlen mit interpretierbaren Abständen, aber ohne absoluten Nullpunkt (z. B. °C). Zulässig: arithm. Mittel, Varianz.K1 · Merkmale & Skalenniveaus
Verhältnisskala: Zahlen mit absolutem Nullpunkt; Verhältnisse interpretierbar (»doppelt so groß«). Zulässig: alle Maße inkl. Variationskoeffizient.K1 · Merkmale & Skalenniveaus
Urliste: Die rohe Beobachtungsreihe $x_1,\dots,x_n$ — die Ergebnisse der Messung an n statistischen Einheiten, unsortiert.K2 · Häufigkeiten
Absolute Häufigkeit $h(a_j)$: Anzahl der Beobachtungen mit Ausprägung $a_j$ . Es gilt $\sum_j h_j = n$ .K2 · Häufigkeiten
Relative Häufigkeit $f(a_j)$: $f_j = h_j/n$ — Anteil der Ausprägung $a_j$ . Es gilt $\sum_j f_j = 1$ .K2 · Häufigkeiten
Histogramm: Flächenproportionale Darstellung einer klassierten Häufigkeitsverteilung: Balkenhöhe = $h_j/d_j$ bzw. $f_j/d_j$ (Häufigkeitsdichte), Fläche ∝ Häufigkeit.K2 · Grafische Darstellungen
Faustregeln Klassenanzahl: $k \approx \sqrt{n}$ oder $k \approx 2\sqrt{n}$ . Klassengrenzen möglichst einfach, Breiten möglichst gleich.K2 · Grafische Darstellungen
Uni-/bi-/multimodal: Anzahl ausgeprägter Gipfel der Verteilung: ein Gipfel (unimodal), zwei (bimodal), mehrere (multimodal).K2 · Grafische Darstellungen
Linkssteil vs. rechtssteil: Linkssteil (rechtsschief): Daten links konzentriert, Ausläufer rechts ( $x_{mod}<x_{med}<\bar x$ ). Rechtssteil (linksschief): umgekehrt.K2 · Grafische Darstellungen
Empirische Verteilungsfunktion $F(x)$: Anteil der Beobachtungen $\le x$ : $F(x)=\sum_{i: a_i \le x} f_i$ . Monoton wachsende Treppenfunktion, 0 für $x<a_1$ , 1 für $x \ge a_k$ .K2 · Kumulierte Häufigkeiten
Kumulierte absolute Häufigkeit $H(x)$: Anzahl der Beobachtungen $\le x$ : $H(x)=\sum_{i: a_i \le x} h_i$ . An den Sprungstellen gilt der obere Wert (Treppenkante).K2 · Kumulierte Häufigkeiten
Arithmetisches Mittel $\bar x$: $\bar x = \frac{1}{n}\sum_i x_i$ . Schwerpunkt der Daten; nur ab Intervallskala sinnvoll; empfindlich gegen Ausreißer.K2 · Lagemaße
Median $x_{med}$: Mittlerer Wert der geordneten Reihe. n ungerade: $x_{((n+1)/2)}$ ; n gerade: $\tfrac12(x_{(n/2)}+x_{(n/2+1)})$ . Robust, ab Ordinalskala.K2 · Lagemaße
Modus $x_{mod}$: Häufigste Ausprägung. Bereits für nominale Merkmale geeignet; nicht immer eindeutig.K2 · Lagemaße
Geometrisches Mittel $x_{geom}$: $\sqrt[n]{x_1\cdots x_n}$ . Für Wachstums-/Zinsfaktoren. Es gilt stets $x_{geom}\le \bar x$ .K2 · Lagemaße
p-Quantil $x_p$: Trennt die Daten: mind. $p\cdot100\%$ sind $\le x_p$ . $np$ nicht ganz: $x_{(\lceil np\rceil)}$ ; $np$ ganz: $\tfrac12(x_{(np)}+x_{(np+1)})$ .K2 · Lagemaße
Lageregeln (unimodal): Symmetrisch: $x_{mod}\approx x_{med}\approx\bar x$ . Linkssteil: $x_{mod}<x_{med}<\bar x$ . Rechtssteil: $x_{mod}>x_{med}>\bar x$ .K2 · Lagemaße
Spannweite $R$: $R = x_{(n)} - x_{(1)} = x_{max}-x_{min}$ . Sehr empfindlich gegen Ausreißer.K2 · Streuungsmaße
Interquartilsabstand IQR: $IQR = x_{0{,}75} - x_{0{,}25}$ . Robustes Streuungsmaß; Länge der Box im Box-Plot.K2 · Streuungsmaße
Empirische Varianz $\tilde s^2$: $\tilde s^2 = \frac1n\sum_i (x_i-\bar x)^2$ — Teilung durch n.K2 · Streuungsmaße
Stichprobenvarianz $s^2$: $s^2 = \frac{1}{n-1}\sum_i (x_i-\bar x)^2$ — Teilung durch n−1 (erwartungstreu, in der induktiven Statistik bevorzugt).K2 · Streuungsmaße
Standardabweichung $s$: $s = \sqrt{s^2}$ . Gleiche Dimension wie die Daten; beschreibt die Streuung um $\bar x$ .K2 · Streuungsmaße
Variationskoeffizient $v$: $v = s/\bar x$ (alle $x_i\ge0$ , $\bar x>0$ ). Dimensionsloses relatives Streuungsmaß zum Vergleich verschiedener Größenordnungen.K2 · Streuungsmaße
Kontingenztafel: Tabelle der gemeinsamen absoluten Häufigkeiten $h_{ij}=h(a_i,b_j)$ zweier diskreter Merkmale, ergänzt um Zeilen- und Spaltensummen.K3 · Kontingenztafeln & bedingte Häufigkeiten
Randhäufigkeit: Zeilensumme $h_{i.}=\sum_j h_{ij}$ (Verteilung von X) bzw. Spaltensumme $h_{.j}=\sum_i h_{ij}$ (Verteilung von Y).K3 · Kontingenztafeln & bedingte Häufigkeiten
Bedingte relative Häufigkeit: $f_Y(b_j\mid a_i)=h_{ij}/h_{i.}$ — Verteilung von Y für festgehaltenes $X=a_i$ (Normierung auf die Zeilensumme).K3 · Kontingenztafeln & bedingte Häufigkeiten
Empirische Unabhängigkeit: Erwartete Häufigkeit ohne Zusammenhang: $\tilde h_{ij} = h_{i.}\,h_{.j}/n$ . Beobachtete = erwartete ⇒ kein Zusammenhang.K3 · Zusammenhangsmaße für nominale Merkmale
χ²-Koeffizient: $\chi^2=\sum_{i,j}\frac{(h_{ij}-\tilde h_{ij})^2}{\tilde h_{ij}}\in[0,\infty)$ . Misst die Abweichung von der Unabhängigkeit; hängt von n und Tafelgröße ab.K3 · Zusammenhangsmaße für nominale Merkmale
Kontingenzkoeffizient K: $K=\sqrt{\chi^2/(n+\chi^2)}\in[0,\sqrt{(M-1)/M})$ , $M=\min(k,m)$ . Normiert: $K^*=K/\sqrt{(M-1)/M}\in[0,1]$ .K3 · Zusammenhangsmaße für nominale Merkmale
Cramérs V: $V=\sqrt{\chi^2/(n(M-1))}\in[0,1]$ , $M=\min(k,m)$ . Bei 2×2-Tafeln gleich dem Phi-Koeffizienten.K3 · Zusammenhangsmaße für nominale Merkmale
Empirische Kovarianz $\tilde s_{XY}$: $\tilde s_{XY}=\frac1n\sum_i (x_i-\bar x)(y_i-\bar y)$ . Vorzeichen = Richtung des linearen Zusammenhangs; nicht normiert (skalenabhängig).K3 · Kovarianz & Korrelation
Pearson-Korrelation $r$: $r=\frac{\tilde s_{XY}}{\sqrt{\tilde s_{XX}}\sqrt{\tilde s_{YY}}}\in[-1,1]$ . Normierte Kovarianz; nur linearer Zusammenhang; ausreißerempfindlich.K3 · Kovarianz & Korrelation
Spearman-Rangkorrelation $r_{SP}$: Pearson auf den Rängen. Für ordinale Daten; erfasst monotone Zusammenhänge; robuster gegen Ausreißer.K3 · Kovarianz & Korrelation
Faustregel Stärke von |r|: schwach $|r|<0{,}5$ , mittel $0{,}5\le|r|<0{,}8$ , stark $0{,}8\le|r|$ .K3 · Kovarianz & Korrelation
Kendalls $\tau$ (Rangkorrelation): Beruht auf konkordanten (C) und diskordanten (D) Paaren: $\tau_b=\frac{C-D}{\sqrt{(C+D+T_x)(C+D+T_y)}}$ . Wie Spearman für ordinale Daten, mit Bindungskorrektur.K3 · Kovarianz & Korrelation
Kleinste-Quadrate-Methode: Minimiert $\sum_i (y_i-\hat y_i)^2$ . Lösung: $b_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}$ , $b_0=\bar y-b_1\bar x$ .K3 · Regressionsrechnung
Ausgleichsgerade: $\hat y = b_0 + b_1 x$ mit KQ-Schätzern. $b_1$ = Steigung (Änderung von Y je Einheit X), $b_0$ = Achsenabschnitt (Y bei X=0).K3 · Regressionsrechnung
Bestimmtheitsmaß $R^2$: Anteil der durch das Modell erklärten Streuung von Y, $R^2\in[0,1]$ . Bei Einfachregression $R^2=r^2$ .K3 · Regressionsrechnung
Residuen: $\hat e_i = y_i - \hat y_i$ — vertikale Abweichung Datenpunkt ↔ Gerade. Muster im Residuenplot deuten auf Modellverletzungen.K3 · Regressionsrechnung
Zufallsexperiment: Vorgang mit mehreren möglichen, im Voraus nicht sicher bestimmbaren Ausgängen, der (gedanklich) beliebig oft unter gleichen Bedingungen wiederholbar ist.K4 · Zufallsexperimente & Ereignisse
Ergebnisraum Ω: Menge aller möglichen Ausgänge (Elementarereignisse ω) eines Zufallsexperiments. Beispiel Würfel: Ω = {1,2,3,4,5,6}.K4 · Zufallsexperimente & Ereignisse
Ereignis A: Teilmenge des Ergebnisraums, $A \subseteq \Omega$ . Tritt ein, wenn das beobachtete Ergebnis in A liegt.K4 · Zufallsexperimente & Ereignisse
Laplace-Wahrscheinlichkeit: $P(A)=\frac{\#\text{günstige}}{\#\text{mögliche}}$ — gültig nur bei endlich vielen, gleichwahrscheinlichen Elementarereignissen.K4 · Wahrscheinlichkeit
Axiome von Kolmogorov: (1) $P(A)\ge 0$ ; (2) $P(\Omega)=1$ ; (3) für disjunkte $A,B$ : $P(A\cup B)=P(A)+P(B)$ .K4 · Wahrscheinlichkeit
Additionssatz: $P(A\cup B)=P(A)+P(B)-P(A\cap B)$ . Für disjunkte Ereignisse entfällt der letzte Term.K4 · Wahrscheinlichkeit
Komplementregel: $P(\bar A)=1-P(A)$ .K4 · Wahrscheinlichkeit
Empirisches Gesetz der großen Zahlen: $f_n(A)\xrightarrow{n\to\infty} P(A)$ : Für großes n liegt die relative Häufigkeit mit großer Wahrscheinlichkeit nahe bei P(A).K4 · Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit: $P(A\mid B)=\dfrac{P(A\cap B)}{P(B)}$ für $P(B)>0$ . Wahrscheinlichkeit von A, wenn B bereits eingetreten ist.K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
Produktsatz (Multiplikationssatz): $P(A\cap B)=P(A\mid B)\cdot P(B)=P(B\mid A)\cdot P(A)$ .K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
Stochastische Unabhängigkeit: $P(A\cap B)=P(A)\cdot P(B)$ , äquivalent $P(A\mid B)=P(A)$ : B liefert keine Information über A.K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
Satz von der totalen Wahrscheinlichkeit: Für eine Zerlegung $B_1,\dots,B_k$ von Ω: $P(A)=\sum_i P(A\mid B_i)\,P(B_i)$ .K4 · Totale Wahrscheinlichkeit & Satz von Bayes
Satz von Bayes: $P(B_j\mid A)=\dfrac{P(A\mid B_j)\,P(B_j)}{\sum_i P(A\mid B_i)\,P(B_i)}$ . Dreht die Bedingung um (a priori → a posteriori).K4 · Totale Wahrscheinlichkeit & Satz von Bayes
Basisraten-Falle: Vernachlässigung der A-priori-Wahrscheinlichkeit (Prävalenz): Bei seltenen Ereignissen ist die A-posteriori-Wahrscheinlichkeit trotz „guter" Tests klein.K4 · Totale Wahrscheinlichkeit & Satz von Bayes
Permutation: Anordnung aller n Elemente in einer Reihenfolge: $n!$ Möglichkeiten.K4 · Kombinatorik
Variation (geordnet, ohne Zurücklegen): k aus n auswählen UND anordnen: $\frac{n!}{(n-k)!}=n(n-1)\cdots(n-k+1)$ .K4 · Kombinatorik
Kombination (ungeordnet, ohne Zurücklegen): k aus n auswählen ohne Reihenfolge: $\binom{n}{k}=\frac{n!}{k!\,(n-k)!}$ .K4 · Kombinatorik
Binomialkoeffizient: $\binom{n}{k}=\frac{n!}{k!(n-k)!}$ — Anzahl der k-elementigen Teilmengen einer n-Menge.K4 · Kombinatorik
Zufallsvariable X: Abbildung, die jedem Ergebnis eines Zufallsvorgangs eine Zahl zuordnet. Großbuchstabe X, Realisierung x.K5 · Diskrete Zufallsvariablen
Wahrscheinlichkeitsfunktion f(x): $f(x)=P(X=x_i)=p_i$ an den Trägerpunkten, sonst 0. Analog zur relativen Häufigkeitsverteilung; $\sum_i p_i = 1$ .K5 · Diskrete Zufallsvariablen
Verteilungsfunktion F(x) (diskret): $F(x)=P(X\le x)=\sum_{x_i\le x} f(x_i)$ . Monoton wachsende Treppenfunktion, 0 links, 1 rechts.K5 · Diskrete Zufallsvariablen
Erwartungswert E(X): $E(X)=\mu=\sum_i x_i\,p_i$ — mit Wahrscheinlichkeiten gewichtetes Mittel der möglichen Werte; Lage/Zentrum der Verteilung.K5 · Erwartungswert & Varianz
Varianz Var(X): $\operatorname{Var}(X)=\sigma^2=\sum_i (x_i-\mu)^2 p_i = E(X^2)-\mu^2$ . Streuung der Verteilung; $\sigma=\sqrt{\operatorname{Var}(X)}$ .K5 · Erwartungswert & Varianz
Rechenregeln E/Var: $E(aX+b)=aE(X)+b$ , $E(X+Y)=E(X)+E(Y)$ . $\operatorname{Var}(aX+b)=a^2\operatorname{Var}(X)$ ; für unabhängige X,Y: $\operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)$ .K5 · Erwartungswert & Varianz
Bernoulli-Verteilung: X ∈ {0,1} mit P(X=1)=π. $E(X)=\pi$ , $\operatorname{Var}(X)=\pi(1-\pi)$ . Modell für einen dichotomen Versuch.K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
Diskrete Gleichverteilung: k gleichwahrscheinliche Werte, $P(X=x_i)=1/k$ . $E(X)=\frac{k+1}{2}$ , $\operatorname{Var}(X)=\frac{k^2-1}{12}$ (für {1,…,k}).K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
Geometrische Verteilung: X = Anzahl Versuche bis zum 1. Erfolg, Träger {1,2,…}. $f(x)=(1-\pi)^{x-1}\pi$ , $F(x)=1-(1-\pi)^x$ , $E(X)=1/\pi$ , $\operatorname{Var}(X)=\frac{1-\pi}{\pi^2}$ .K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
Binomialverteilung: X = Anzahl Erfolge bei n unabhängigen Bernoulli-Versuchen. $f(x)=\binom{n}{x}\pi^x(1-\pi)^{n-x}$ , $E(X)=n\pi$ , $\operatorname{Var}(X)=n\pi(1-\pi)$ .K5 · Binomial- & Poisson-Verteilung
Poisson-Verteilung: Seltene Ereignisse in festem Intervall. $f(x)=\frac{\lambda^x}{x!}e^{-\lambda}$ , Träger {0,1,2,…}, $E(X)=\operatorname{Var}(X)=\lambda$ .K5 · Binomial- & Poisson-Verteilung
Binomial vs. geometrisch: Binomial: Anzahl Erfolge bei festem n (Träger 0…n). Geometrisch: Anzahl Versuche bis zum 1. Erfolg (Träger 1,2,…).K5 · Binomial- & Poisson-Verteilung
Wahrscheinlichkeitsdichte f(x): $f(x)\ge 0$ mit $P(a\le X\le b)=\int_a^b f(x)\,dx$ . Fläche = Wahrscheinlichkeit; $\int_{-\infty}^{\infty} f=1$ .K6 · Stetige Zufallsvariablen & Dichte
Verteilungsfunktion (stetig): $F(x)=P(X\le x)=\int_{-\infty}^x f(t)\,dt$ . Stetig, monoton wachsend, von 0 nach 1; $F'(x)=f(x)$ .K6 · Stetige Zufallsvariablen & Dichte
P(X = x) bei stetiger ZV: Immer 0. Daher $P(a\le X\le b)=P(a<X<b)$ — die Grenzen spielen keine Rolle.K6 · Stetige Zufallsvariablen & Dichte
Erwartungswert (stetig): $E(X)=\mu=\int_{-\infty}^{\infty} x\,f(x)\,dx$ . Bei symmetrischer Dichte um c ist $E(X)=c$ .K6 · Maßzahlen & stetige Gleichverteilung
Varianz (stetig): $\operatorname{Var}(X)=\sigma^2=\int_{-\infty}^{\infty}(x-\mu)^2 f(x)\,dx$ .K6 · Maßzahlen & stetige Gleichverteilung
p-Quantil (stetig): $x_p$ mit $F(x_p)=p$ . Teilt die Fläche in p links, 1−p rechts. Median = $x_{0{,}5}$ .K6 · Maßzahlen & stetige Gleichverteilung
Stetige Gleichverteilung U(a,b): Dichte $f(x)=\frac{1}{b-a}$ auf [a,b]. $E(X)=\frac{a+b}{2}$ , $\operatorname{Var}(X)=\frac{(b-a)^2}{12}$ .K6 · Maßzahlen & stetige Gleichverteilung
Exponentialverteilung: Dichte $f(x)=\lambda e^{-\lambda x}$ ( $x\ge0$ ), $F(x)=1-e^{-\lambda x}$ , $E(X)=1/\lambda$ , $\operatorname{Var}(X)=1/\lambda^2$ . Modell für Wartezeiten/Lebensdauern.K6 · Exponentialverteilung
Gedächtnislosigkeit: $P(X>s+t\mid X>s)=P(X>t)$ : Ein bereits „überlebtes" Bauteil ist so gut wie neu. Charakteristisch für die Exponentialverteilung.K6 · Exponentialverteilung
Normalverteilung N(μ, σ): Dichte $f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac12((x-\mu)/\sigma)^2}$ . Symmetrisch um μ, Wendepunkte bei μ±σ. $E(X)=\mu$ , $\operatorname{Var}(X)=\sigma^2$ .K6 · Normalverteilung
Standardisierung: Ist $X\sim N(\mu,\sigma)$ , so ist $Z=\frac{X-\mu}{\sigma}\sim N(0,1)$ . Damit $F(x)=\Phi\!\left(\frac{x-\mu}{\sigma}\right)$ .K6 · Normalverteilung
σ-Regeln: μ±σ ≈ 68,3 %, μ±2σ ≈ 95,4 %, μ±3σ ≈ 99,7 % der Wahrscheinlichkeitsmasse.K6 · Normalverteilung
Wichtige z-Quantile: z₀,₉₀=1,28; z₀,₉₅=1,64; z₀,₉₇₅=1,96; z₀,₉₉=2,33. Symmetrie: $z_p=-z_{1-p}$ , $\Phi(-z)=1-\Phi(z)$ .K6 · Normalverteilung
Induktive Statistik: Schluss von der Stichprobe auf die Grundgesamtheit mit Hilfe der Wahrscheinlichkeitstheorie. Teilgebiete: Schätzen und Testen.K7 · Induktive Statistik & Zufallsstichproben
Stichprobenvariablen $X_1,\dots,X_n$: Modellieren die wiederholte Beobachtung von X: unabhängig und identisch verteilt (i.i.d.) wie X. Realisierungen $x_1,\dots,x_n$ sind die Stichprobenwerte.K7 · Induktive Statistik & Zufallsstichproben
Einfache Zufallsstichprobe: Jedes Element der Grundgesamtheit hat dieselbe bekannte Wahrscheinlichkeit, gezogen zu werden. Voraussetzung für induktive Verfahren.K7 · Induktive Statistik & Zufallsstichproben
Schätzfunktion (Schätzer): Vorschrift, die aus $X_1,\dots,X_n$ einen Näherungswert für einen Parameter berechnet. Als Funktion von Zufallsvariablen selbst eine Zufallsvariable.K7 · Schätzfunktionen & Güte
Erwartungstreue: $E(\hat\theta)=\theta$ — kein systematischer Fehler. Z. B. ist $\bar X$ erwartungstreu für μ und $S^2=\frac{1}{n-1}\sum(X_i-\bar X)^2$ für σ².K7 · Schätzfunktionen & Güte
Konsistenz: Mit wachsendem Stichprobenumfang n wird die Schätzung immer genauer (konvergiert gegen den wahren Wert).K7 · Schätzfunktionen & Güte
Effizienz: Eine Schätzfunktion ist effizient, wenn sie bei gegebenem n möglichst kleine Streuung hat (schon bei kleiner Stichprobe brauchbar).K7 · Schätzfunktionen & Güte
Zentrales Schwankungsintervall: $P(\mu - z_{1-\alpha/2}\sigma \le X \le \mu + z_{1-\alpha/2}\sigma)=1-\alpha$ . Für N(0,1): [−1,64;1,64]→90 %, [−1,96;1,96]→95 %, [−2,58;2,58]→99 %.K7 · Prüfverteilungen: χ² und t
χ²-Verteilung: Summe von Quadraten von n i.i.d. N(0,1)-Variablen, χ²(n). $E=n$ , $\operatorname{Var}=2n$ . Rechtsschief, nur für x≥0.K7 · Prüfverteilungen: χ² und t
t-Verteilung: $T=\frac{X}{\sqrt{Z/n}}$ mit $X\sim N(0,1)$ , $Z\sim\chi^2(n)$ unabhängig. Symmetrisch um 0, schwerere Ränder; → N(0,1) für n→∞.K7 · Prüfverteilungen: χ² und t
Konfidenzintervall (1−α): Zufälliges Intervall, das den festen Parameter mit Wahrscheinlichkeit 1−α überdeckt. α = Irrtumswahrscheinlichkeit (üblich 0,10/0,05/0,01).K7 · Konfidenzintervalle
KI für μ, σ bekannt (z-Intervall): $\bar x \pm z_{1-\alpha/2}\,\dfrac{\sigma}{\sqrt n}$ (X normalverteilt).K7 · Konfidenzintervalle
KI für μ, σ unbekannt (t-Intervall): $\bar x \pm t_{1-\alpha/2}(n-1)\,\dfrac{s}{\sqrt n}$ . Für n>30 ist $t\approx z$ (Normalapproximation).K7 · Konfidenzintervalle
Breite des KI: Wächst mit dem Konfidenzniveau (1−α) und mit σ; sinkt mit wachsendem n (∝ 1/√n).K7 · Konfidenzintervalle
Null- und Alternativhypothese: H₀ (Gleichheit/kein Effekt, „zu widerlegen") gegen H₁ (Unterschied/Effekt, „zu zeigen"). Sie schließen einander aus.K8 · Testlogik & Hypothesen
Prüfgröße (Testfunktion): Aus der Stichprobe berechnete Zahl, deren Verteilung unter H₀ bekannt ist. Beim Gauß-Test: $Z=\frac{\bar X-\mu_0}{\sigma/\sqrt n}\sim N(0,1)$ .K8 · Testlogik & Hypothesen
Ablehnbereich (kritischer Bereich): Wertebereich der Prüfgröße, bei dem H₀ verworfen wird. Die Wahrscheinlichkeit, unter H₀ hineinzufallen, ist höchstens α. Grenze = kritischer Wert.K8 · Testlogik & Hypothesen
Gauß-Test: Test für μ bei bekanntem σ. Prüfgröße $Z=\frac{\bar X-\mu_0}{\sigma/\sqrt n}\sim N(0,1)$ unter H₀.K8 · Gauß-Test
Ein- vs. zweiseitig: Zweiseitig H₁: μ≠μ₀ → Ablehnung bei |Z|>z_{1−α/2}. Einseitig H₁: μ>μ₀ → Z>z_{1−α}; H₁: μ<μ₀ → Z<−z_{1−α}.K8 · Gauß-Test
Fehler 1. Art (α-Fehler): H₀ ist wahr, wird aber verworfen. Die Wahrscheinlichkeit wird durch das Signifikanzniveau α kontrolliert: P(Fehler 1. Art) ≤ α.K8 · Fehlerarten & Signifikanz
Fehler 2. Art (β-Fehler): H₁ ist wahr, H₀ wird aber nicht verworfen. β ist nicht direkt kontrollierbar; 1−β ist die Güte (Power) des Tests.K8 · Fehlerarten & Signifikanz
Signifikanzniveau α: Maximal zugelassene Wahrscheinlichkeit für einen Fehler 1. Art. Übliche Werte 0,10 / 0,05 / 0,01. Vorab festlegen!K8 · Fehlerarten & Signifikanz
Güte (Power) 1−β: Wahrscheinlichkeit, einen tatsächlich vorhandenen Effekt zu entdecken. Steigt mit n, mit der Effektgröße und mit größerem α.K8 · Fehlerarten & Signifikanz
t-Test: Test für μ bei UNBEKANNTEM σ. Prüfgröße $T=\frac{\bar X-\mu_0}{S/\sqrt n}\sim t(n-1)$ unter H₀. Für n>30 ≈ N(0,1).K8 · t-Test
Gauß- oder t-Test?: σ bekannt → Gauß-Test (z, N(0,1)). σ unbekannt → t-Test (t(n−1)). Bei n>30 beide ≈ Normalapproximation.K8 · t-Test
p-Wert: Wahrscheinlichkeit unter H₀, den beobachteten oder einen extremeren Prüfgrößenwert (Richtung H₁) zu erhalten. Entscheidung: p < α ⇒ H₀ verwerfen.K8 · p-Wert & formaler Testablauf
p-Wert ein-/zweiseitig: Einseitig: Fläche in einem Ende. Zweiseitig: doppelte Fläche des kleineren Endes, $p=2\cdot P(Z\ge|z|)$ .K8 · p-Wert & formaler Testablauf
Auswahl eines Tests: Entscheidend: Funktion des Tests, Datenniveau (nominal/ordinal/metrisch), Verteilung der Daten und Stichprobenart (verbunden/unverbunden).K8 · p-Wert & formaler Testablauf
Binomialtest: Exakter Test für einen Anteil, H₀: π = π₀. Prüfgröße = Erfolgszahl k, Prüfverteilung Bin(n, π₀). Für kleine n genauer als der approximative z-Anteilstest.K8 · Binomialtest & Tests via Konfidenzintervall
Dualität Test ↔ Konfidenzintervall: Ein zweiseitiger Test zum Niveau α verwirft H₀: θ=θ₀ genau dann, wenn θ₀ außerhalb des (1−α)-KI liegt. Das KI = Menge der nicht verwerfbaren θ₀.K8 · Binomialtest & Tests via Konfidenzintervall