Deskriptive Statistik
Das Verständnis Ihrer Daten beginnt mit deskriptiven Statistiken – diese liefern grundlegende Zusammenfassungen über die Verteilung, zentrale Tendenz und Streuung von Variablen.
Grundlegende deskriptive Statistiken
Die gebräuchlichsten statistischen Kennzahlen sind:
- Mittelwert: Durchschnittswert;
- Standardabweichung: Maß für die Streuung der Werte um den Mittelwert;
- Median: Zentralwert;
- Min / Max: kleinster und größter Wert.
Diese Kennzahlen bieten einen schnellen Überblick über die Verteilung Ihrer Variablen.
Base R
Base R stellt einfache Funktionen zur Berechnung von deskriptiven Statistiken bereit. Die Funktion summary()
liefert zudem einen schnellen statistischen Überblick über alle numerischen Spalten.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Mit dplyr
kann summarise()
verwendet werden, um mehrere Statistiken gleichzeitig in einem übersichtlichen und lesbaren Format zu berechnen.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 4
Deskriptive Statistik
Swipe um das Menü anzuzeigen
Das Verständnis Ihrer Daten beginnt mit deskriptiven Statistiken – diese liefern grundlegende Zusammenfassungen über die Verteilung, zentrale Tendenz und Streuung von Variablen.
Grundlegende deskriptive Statistiken
Die gebräuchlichsten statistischen Kennzahlen sind:
- Mittelwert: Durchschnittswert;
- Standardabweichung: Maß für die Streuung der Werte um den Mittelwert;
- Median: Zentralwert;
- Min / Max: kleinster und größter Wert.
Diese Kennzahlen bieten einen schnellen Überblick über die Verteilung Ihrer Variablen.
Base R
Base R stellt einfache Funktionen zur Berechnung von deskriptiven Statistiken bereit. Die Funktion summary()
liefert zudem einen schnellen statistischen Überblick über alle numerischen Spalten.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Mit dplyr
kann summarise()
verwendet werden, um mehrere Statistiken gleichzeitig in einem übersichtlichen und lesbaren Format zu berechnen.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Danke für Ihr Feedback!