Deskriptive Statistik
Das Verständnis Ihrer Daten beginnt mit deskriptiven Statistiken – diese liefern grundlegende Zusammenfassungen über die Verteilung, zentrale Tendenz und Streuung von Variablen.
Grundlegende deskriptive Statistiken
Die gebräuchlichsten statistischen Kennzahlen sind:
- Mittelwert: Durchschnittswert;
- Standardabweichung: Maß für die Streuung der Werte um den Mittelwert;
- Median: Zentralwert;
- Min / Max: kleinster und größter Wert.
Diese Kennzahlen bieten einen schnellen Überblick über die Verteilung Ihrer Variablen.
Base R
Base R stellt einfache Funktionen zur Berechnung von deskriptiven Statistiken bereit. Die Funktion summary() liefert zudem einen schnellen statistischen Überblick über alle numerischen Spalten.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Mit dplyr kann summarise() verwendet werden, um mehrere Statistiken gleichzeitig in einem übersichtlichen und lesbaren Format zu berechnen.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
What is the difference between mean, median, and mode?
Can you explain how to interpret standard deviation and variance?
How do I use dplyr to calculate descriptive statistics for grouped data?
Awesome!
Completion rate improved to 4
Deskriptive Statistik
Swipe um das Menü anzuzeigen
Das Verständnis Ihrer Daten beginnt mit deskriptiven Statistiken – diese liefern grundlegende Zusammenfassungen über die Verteilung, zentrale Tendenz und Streuung von Variablen.
Grundlegende deskriptive Statistiken
Die gebräuchlichsten statistischen Kennzahlen sind:
- Mittelwert: Durchschnittswert;
- Standardabweichung: Maß für die Streuung der Werte um den Mittelwert;
- Median: Zentralwert;
- Min / Max: kleinster und größter Wert.
Diese Kennzahlen bieten einen schnellen Überblick über die Verteilung Ihrer Variablen.
Base R
Base R stellt einfache Funktionen zur Berechnung von deskriptiven Statistiken bereit. Die Funktion summary() liefert zudem einen schnellen statistischen Überblick über alle numerischen Spalten.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Mit dplyr kann summarise() verwendet werden, um mehrere Statistiken gleichzeitig in einem übersichtlichen und lesbaren Format zu berechnen.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Danke für Ihr Feedback!