Création d'Histogrammes
Pourquoi utiliser des histogrammes ?
Les histogrammes sont utilisés pour visualiser la distribution des données continues (numériques). Ils montrent comment les données sont réparties sur différents intervalles (bacs) et permettent de :
- Détecter l'asymétrie, les valeurs aberrantes ou les lacunes ;
- Comprendre la distribution des fréquences ;
- Évaluer rapidement si les données suivent une distribution normale ou non.
Ils sont particulièrement adaptés pour des variables telles que prix, kilométrage ou âge.
Syntaxe d'un histogramme dans ggplot2
Un histogramme peut être créé avec geom_histogram()
, où la variable x
doit être numérique.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
L'apparence de l'histogramme peut être personnalisée à l'aide d'arguments tels que bins
(nombre de bacs), fill
(couleur des barres), color
(couleur des contours) et theme
pour le style.
Exemple : Distribution des prix de vente
Un histogramme permet d'examiner comment les prix des voitures sont répartis dans l'ensemble de données. Dans cet exemple, les barres sont remplies en bleu acier et entourées de noir, tandis que des étiquettes et un thème minimal sont ajoutés pour plus de clarté.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Ce graphique révèle la forme générale de la distribution des prix de vente, ce qui permet de voir facilement si la majorité des voitures se situe dans une certaine fourchette de prix ou s'il existe des valeurs extrêmes en haut ou en bas de l'échelle.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain the difference between a histogram and a bar plot?
How do I choose the right number of bins for my histogram?
What does it mean if my histogram is skewed to the right or left?
Awesome!
Completion rate improved to 4
Création d'Histogrammes
Glissez pour afficher le menu
Pourquoi utiliser des histogrammes ?
Les histogrammes sont utilisés pour visualiser la distribution des données continues (numériques). Ils montrent comment les données sont réparties sur différents intervalles (bacs) et permettent de :
- Détecter l'asymétrie, les valeurs aberrantes ou les lacunes ;
- Comprendre la distribution des fréquences ;
- Évaluer rapidement si les données suivent une distribution normale ou non.
Ils sont particulièrement adaptés pour des variables telles que prix, kilométrage ou âge.
Syntaxe d'un histogramme dans ggplot2
Un histogramme peut être créé avec geom_histogram()
, où la variable x
doit être numérique.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
L'apparence de l'histogramme peut être personnalisée à l'aide d'arguments tels que bins
(nombre de bacs), fill
(couleur des barres), color
(couleur des contours) et theme
pour le style.
Exemple : Distribution des prix de vente
Un histogramme permet d'examiner comment les prix des voitures sont répartis dans l'ensemble de données. Dans cet exemple, les barres sont remplies en bleu acier et entourées de noir, tandis que des étiquettes et un thème minimal sont ajoutés pour plus de clarté.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Ce graphique révèle la forme générale de la distribution des prix de vente, ce qui permet de voir facilement si la majorité des voitures se situe dans une certaine fourchette de prix ou s'il existe des valeurs extrêmes en haut ou en bas de l'échelle.
Merci pour vos commentaires !