Création d'Histogrammes
Pourquoi utiliser des histogrammes ?
Les histogrammes sont utilisés pour visualiser la distribution des données continues (numériques). Ils montrent comment les données sont réparties sur des plages (bacs) et permettent de :
- Détecter l'asymétrie, les valeurs aberrantes ou les lacunes ;
- Comprendre la distribution des fréquences ;
- Évaluer rapidement si les données suivent une distribution normale ou non.
Ils sont particulièrement adaptés pour des variables telles que prix, kilométrage ou âge.
Syntaxe d'un histogramme avec ggplot2
Un histogramme peut être créé avec geom_histogram()
, où la variable x
doit être numérique.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
L'apparence de l'histogramme peut être personnalisée à l'aide d'arguments tels que bins
(nombre de bacs), fill
(couleur des barres), color
(couleur du contour) et theme
pour le style.
Exemple : Distribution des prix de vente
Un histogramme peut être utilisé pour examiner la répartition des prix des voitures dans l'ensemble de données. Dans cet exemple, les barres sont remplies en bleu acier et contournées en noir, tandis que des étiquettes et un thème minimal sont ajoutés pour plus de clarté.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Ce graphique révèle la forme générale de la distribution des prix de vente, ce qui permet de voir facilement si la majorité des voitures se situe dans une certaine fourchette de prix ou s'il existe des valeurs extrêmes en haut ou en bas de l'échelle.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 4
Création d'Histogrammes
Glissez pour afficher le menu
Pourquoi utiliser des histogrammes ?
Les histogrammes sont utilisés pour visualiser la distribution des données continues (numériques). Ils montrent comment les données sont réparties sur des plages (bacs) et permettent de :
- Détecter l'asymétrie, les valeurs aberrantes ou les lacunes ;
- Comprendre la distribution des fréquences ;
- Évaluer rapidement si les données suivent une distribution normale ou non.
Ils sont particulièrement adaptés pour des variables telles que prix, kilométrage ou âge.
Syntaxe d'un histogramme avec ggplot2
Un histogramme peut être créé avec geom_histogram()
, où la variable x
doit être numérique.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
L'apparence de l'histogramme peut être personnalisée à l'aide d'arguments tels que bins
(nombre de bacs), fill
(couleur des barres), color
(couleur du contour) et theme
pour le style.
Exemple : Distribution des prix de vente
Un histogramme peut être utilisé pour examiner la répartition des prix des voitures dans l'ensemble de données. Dans cet exemple, les barres sont remplies en bleu acier et contournées en noir, tandis que des étiquettes et un thème minimal sont ajoutés pour plus de clarté.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Ce graphique révèle la forme générale de la distribution des prix de vente, ce qui permet de voir facilement si la majorité des voitures se situe dans une certaine fourchette de prix ou s'il existe des valeurs extrêmes en haut ou en bas de l'échelle.
Merci pour vos commentaires !