Kapitel 1 · Einführung und Grundlagen
Grundbegriffe
Am Anfang stehen Daten
Daten sind durch Beobachtungen, Messungen oder statistische Erhebungen gewonnene (Zahlen-)Werte.
Sie sind die Grundlage, um Annahmen zu bewerten und neues Wissen zu entdecken. Damit man über Daten präzise sprechen kann, braucht es einige Grundbegriffe.
Die Grundbegriffe
- Statistische Einheit — das Objekt, an dem gemessen wird (Person, Wohnung, Baum …).
- Grundgesamtheit — die Menge aller relevanten statistischen Einheiten (z. B. alle Personen mit Wohnsitz in Freising).
- Stichprobe — die tatsächlich untersuchte Teilmenge der Grundgesamtheit.
- Merkmal — die interessierende Größe (Alter, Nationalität …).
- Merkmalsausprägung — ein möglicher/beobachteter Wert des Merkmals.
Aufbau eines Datensatzes
Ein Datensatz ordnet die erhobenen Daten inhaltlich zusammengehörig. Die Struktur ist immer dieselbe:
- Zeilen → statistische Einheiten
- Spalten → Merkmale
- Zellen → Merkmalsausprägungen
Beispiel »Absolventenfeier« (Auszug):
| Maßkrug Bier | Geschlecht | Einstiegsgehalt | Note im Studium | |
|---|---|---|---|---|
| 1 | 1 | männlich | 45 000 | gut |
| 2 | 0 | weiblich | 46 000 | gut |
| 3 | 3 | männlich | 38 000 | schlecht |
| 4 | 4 | männlich | 42 000 | mittel |
| 5 | 4 | weiblich | 47 000 | mittel |
Jede Spalte hat ein eigenes Skalenniveau (z. B. »Geschlecht« nominal, »Note« ordinal, »Einstiegsgehalt« verhältnisskaliert) — und genau das entscheidet, welche Auswertung erlaubt ist. Das ist Thema des nächsten Abschnitts.
Abruf-Quiz
Frage 1 / 3Erkläre den Unterschied zwischen *Grundgesamtheit* und *Stichprobe*.