Vektoren & Sequenzen
x <- c(3, 1, 4, 1, 5) # Vektor anlegen
y <- rep(c(0, 1), times = c(26, 9)) # 26x 0, 9x 1
s <- seq(0, 2*pi, length.out = 100) # gleichmäßige Folge
1:10 # Ganzzahlfolge
length(x); sort(x); rev(x) # Länge, sortieren, umkehren
x[x > 2] # logische Indizierung
Daten einlesen
df <- read.table("Daten.dat", header = TRUE,
sep = ":", dec = ",")
str(df) # Struktur ansehen
head(df); summary(df)
df$Spalte # Spalte auswählen (NA = fehlender Wert)
Häufigkeiten
table(x) # absolute Häufigkeiten
table(x) / length(x) # relative Häufigkeiten
prop.table(table(x)) # dito
cumsum(table(x)) # kumulierte Häufigkeiten
Grafische Darstellung
barplot(table(x), main = "Titel", ylab = "h(a)") # Säulen
pie(table(x), labels = c("nein", "ja")) # Kreis
hist(x) # Histogramm (Auto-Klassen)
hist(x, breaks = seq(50, 110, by = 5), # eigene Klassen
col = heat.colors(12), xlab = "kg")
plot(s, sin(2*s), type = "l", col = "blue", lwd = 2) # Linie
lines(s, cos(s)) # weitere Linie ergänzen
boxplot(x) # Box-Plot
Lagemaße
mean(x) # arithmetisches Mittel
median(x) # Median
quantile(x, c(.25, .5, .75)) # Quartile
quantile(x, 0.9) # 90%-Quantil
# Modus: Ausprägung mit größter Häufigkeit
names(which.max(table(x)))
Streuungsmaße
var(x) # Stichprobenvarianz (/ (n-1))
sd(x) # Standardabweichung
IQR(x) # Interquartilsabstand
range(x); diff(range(x)) # Min/Max bzw. Spannweite
sd(x) / mean(x) # Variationskoeffizient
Verteilungen
dbinom(k, size = n, prob = p) # Binomial P(X = k)
pbinom(k, n, p) # P(X <= k)
dpois(k, lambda); ppois(k, lambda)
dnorm(x, mean, sd); pnorm(x, mean, sd) # Normal
qnorm(0.975) # Quantil (z-Wert)
rnorm(100, mean = 0, sd = 1) # Zufallszahlen
Schätzen & Testen
t.test(x, mu = 0) # t-Test / KI für mu
t.test(x, conf.level = 0.95)$conf.int # Konfidenzintervall
prop.test(k, n) # Anteilstest
chisq.test(table(a, b)) # Unabhängigkeitstest