Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Création d'Histogrammes | Visualisation des Données
Analyse de Données avec R

bookCréation d'Histogrammes

Pourquoi utiliser des histogrammes ?

Les histogrammes sont utilisés pour visualiser la distribution des données continues (numériques). Ils montrent comment les données sont réparties sur des plages (bacs) et permettent de :

  • Détecter l'asymétrie, les valeurs aberrantes ou les lacunes ;
  • Comprendre la distribution des fréquences ;
  • Évaluer rapidement si les données suivent une distribution normale ou non.

Ils sont particulièrement adaptés pour des variables telles que prix, kilométrage ou âge.

Syntaxe d'un histogramme avec ggplot2

Un histogramme peut être créé avec geom_histogram(), où la variable x doit être numérique.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

L'apparence de l'histogramme peut être personnalisée à l'aide d'arguments tels que bins (nombre de bacs), fill (couleur des barres), color (couleur du contour) et theme pour le style.

Exemple : Distribution des prix de vente

Un histogramme peut être utilisé pour examiner la répartition des prix des voitures dans l'ensemble de données. Dans cet exemple, les barres sont remplies en bleu acier et contournées en noir, tandis que des étiquettes et un thème minimal sont ajoutés pour plus de clarté.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Ce graphique révèle la forme générale de la distribution des prix de vente, ce qui permet de voir facilement si la majorité des voitures se situe dans une certaine fourchette de prix ou s'il existe des valeurs extrêmes en haut ou en bas de l'échelle.

question mark

Que contrôle l'argument bins dans geom_histogram() ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 3

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4

bookCréation d'Histogrammes

Glissez pour afficher le menu

Pourquoi utiliser des histogrammes ?

Les histogrammes sont utilisés pour visualiser la distribution des données continues (numériques). Ils montrent comment les données sont réparties sur des plages (bacs) et permettent de :

  • Détecter l'asymétrie, les valeurs aberrantes ou les lacunes ;
  • Comprendre la distribution des fréquences ;
  • Évaluer rapidement si les données suivent une distribution normale ou non.

Ils sont particulièrement adaptés pour des variables telles que prix, kilométrage ou âge.

Syntaxe d'un histogramme avec ggplot2

Un histogramme peut être créé avec geom_histogram(), où la variable x doit être numérique.

ggplot(data = df, aes(x = variable)) +
  geom_histogram()

L'apparence de l'histogramme peut être personnalisée à l'aide d'arguments tels que bins (nombre de bacs), fill (couleur des barres), color (couleur du contour) et theme pour le style.

Exemple : Distribution des prix de vente

Un histogramme peut être utilisé pour examiner la répartition des prix des voitures dans l'ensemble de données. Dans cet exemple, les barres sont remplies en bleu acier et contournées en noir, tandis que des étiquettes et un thème minimal sont ajoutés pour plus de clarté.

ggplot(data = df, aes(x = selling_price)) +
  geom_histogram(fill = "steelblue", color = "black") +
  labs(title = "Distribution of Selling Prices",
       x = "Selling Price (in PKR)",
       y = "Count") +
  theme_minimal()

Ce graphique révèle la forme générale de la distribution des prix de vente, ce qui permet de voir facilement si la majorité des voitures se situe dans une certaine fourchette de prix ou s'il existe des valeurs extrêmes en haut ou en bas de l'échelle.

question mark

Que contrôle l'argument bins dans geom_histogram() ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 3
some-alt