Estadística Descriptiva
Comprender tus datos comienza con las estadísticas descriptivas: estas proporcionan resúmenes esenciales sobre la distribución, tendencia central y dispersión de las variables.
Estadísticas Descriptivas Básicas
Las medidas estadísticas más comunes son:
- Media: valor promedio;
- Desviación estándar: cuánto se desvían los valores de la media;
- Mediana: valor central;
- Mín / máx: valores más pequeño y más grande.
Estas ofrecen una visión rápida de cómo se distribuyen tus variables.
Base R
Base R proporciona funciones simples para calcular estadísticas descriptivas. La función summary()
también produce una visión estadística rápida de todas las columnas numéricas.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Con dplyr
, se puede utilizar summarise()
para calcular múltiples estadísticas a la vez en un formato limpio y legible.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 4
Estadística Descriptiva
Desliza para mostrar el menú
Comprender tus datos comienza con las estadísticas descriptivas: estas proporcionan resúmenes esenciales sobre la distribución, tendencia central y dispersión de las variables.
Estadísticas Descriptivas Básicas
Las medidas estadísticas más comunes son:
- Media: valor promedio;
- Desviación estándar: cuánto se desvían los valores de la media;
- Mediana: valor central;
- Mín / máx: valores más pequeño y más grande.
Estas ofrecen una visión rápida de cómo se distribuyen tus variables.
Base R
Base R proporciona funciones simples para calcular estadísticas descriptivas. La función summary()
también produce una visión estadística rápida de todas las columnas numéricas.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Con dplyr
, se puede utilizar summarise()
para calcular múltiples estadísticas a la vez en un formato limpio y legible.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
¡Gracias por tus comentarios!