Statistiques Descriptives
Comprendre vos données commence par les statistiques descriptives : elles fournissent des résumés essentiels sur la distribution, la tendance centrale et la dispersion des variables.
Statistiques descriptives de base
Les mesures statistiques les plus courantes sont :
- Moyenne : valeur moyenne ;
- Écart type : mesure de la dispersion des valeurs autour de la moyenne ;
- Médiane : valeur centrale ;
- Min / max : plus petite et plus grande valeurs.
Ces mesures offrent un aperçu rapide de la distribution de vos variables.
Base R
Le langage R de base propose des fonctions simples pour calculer les statistiques descriptives. La fonction summary()
fournit également un aperçu statistique rapide de toutes les colonnes numériques.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Avec dplyr
, il est possible d'utiliser summarise()
pour calculer plusieurs statistiques simultanément dans un format clair et lisible.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
What is the difference between mean, median, and mode?
Can you explain how to interpret standard deviation and variance?
How do I use dplyr to calculate descriptive statistics for grouped data?
Awesome!
Completion rate improved to 4
Statistiques Descriptives
Glissez pour afficher le menu
Comprendre vos données commence par les statistiques descriptives : elles fournissent des résumés essentiels sur la distribution, la tendance centrale et la dispersion des variables.
Statistiques descriptives de base
Les mesures statistiques les plus courantes sont :
- Moyenne : valeur moyenne ;
- Écart type : mesure de la dispersion des valeurs autour de la moyenne ;
- Médiane : valeur centrale ;
- Min / max : plus petite et plus grande valeurs.
Ces mesures offrent un aperçu rapide de la distribution de vos variables.
Base R
Le langage R de base propose des fonctions simples pour calculer les statistiques descriptives. La fonction summary()
fournit également un aperçu statistique rapide de toutes les colonnes numériques.
mean(df$max_power, na.rm = TRUE)
median(df$selling_price, na.rm = TRUE)
min(df$mileage, na.rm = TRUE)
max(df$mileage, na.rm = TRUE)
summary(df)
dplyr
Avec dplyr
, il est possible d'utiliser summarise()
pour calculer plusieurs statistiques simultanément dans un format clair et lisible.
df %>%
summarise(
avg_power = mean(max_power, na.rm = TRUE),
sd_power = sd(max_power, na.rm = TRUE),
median_power = median(max_power, na.rm = TRUE)
)
Merci pour vos commentaires !