Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Création de Graphiques de Densité | Visualisation des Données
Analyse de Données avec R

bookCréation de Graphiques de Densité

Pourquoi utiliser les graphiques de densité ?

Un graphique de densité est une version lissée d’un histogramme. Il est utile pour :

  • Comprendre la distribution d’une variable numérique ;
  • Comparer les distributions entre différents groupes (comme les types de carburant) ;
  • Repérer les pics, l’asymétrie et la dispersion.

Contrairement aux histogrammes, les graphiques de densité estiment la probabilité qu’une valeur apparaisse dans un certain intervalle.

Syntaxe d’un graphique de densité dans ggplot2

Dans ggplot2, un graphique de densité peut être créé avec geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

Pour comparer des groupes, il est possible d’associer une variable catégorielle à fill et d’ajuster la transparence avec alpha afin que les courbes se superposent clairement.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Cela facilite la comparaison de la distribution d’une variable numérique selon différentes catégories.

Exemple : Distribution du prix de vente

Un graphique de densité offre une représentation lissée de la distribution des prix des voitures. Dans cet exemple, la courbe est remplie en bleu et les axes sont étiquetés pour clarifier la signification des valeurs.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Cette visualisation met en évidence les zones où la majorité des prix des voitures se concentrent, ainsi que l’étendue des prix dans l’ensemble de données. Elle est particulièrement utile pour identifier les pics de la distribution et effectuer des comparaisons avec d’autres variables par la suite.

question mark

Quel argument contrôle la transparence des courbes de densité superposées ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 4

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

What is the difference between a density plot and a histogram?

How do I interpret the peaks and tails in a density plot?

Can you explain how to compare distributions using density plots?

Awesome!

Completion rate improved to 4

bookCréation de Graphiques de Densité

Glissez pour afficher le menu

Pourquoi utiliser les graphiques de densité ?

Un graphique de densité est une version lissée d’un histogramme. Il est utile pour :

  • Comprendre la distribution d’une variable numérique ;
  • Comparer les distributions entre différents groupes (comme les types de carburant) ;
  • Repérer les pics, l’asymétrie et la dispersion.

Contrairement aux histogrammes, les graphiques de densité estiment la probabilité qu’une valeur apparaisse dans un certain intervalle.

Syntaxe d’un graphique de densité dans ggplot2

Dans ggplot2, un graphique de densité peut être créé avec geom_density().

ggplot(data = df, aes(x = variable)) +
  geom_density()

Pour comparer des groupes, il est possible d’associer une variable catégorielle à fill et d’ajuster la transparence avec alpha afin que les courbes se superposent clairement.

ggplot(data = df, aes(x = variable, fill = group_variable)) +
  geom_density(alpha = 0.5)

Cela facilite la comparaison de la distribution d’une variable numérique selon différentes catégories.

Exemple : Distribution du prix de vente

Un graphique de densité offre une représentation lissée de la distribution des prix des voitures. Dans cet exemple, la courbe est remplie en bleu et les axes sont étiquetés pour clarifier la signification des valeurs.

ggplot(df, aes(x = selling_price)) +
  geom_density(fill = "blue") +
  labs(title = "Density Plot of Selling Prices",
       x = "Selling Price",
       y = "Density")

Cette visualisation met en évidence les zones où la majorité des prix des voitures se concentrent, ainsi que l’étendue des prix dans l’ensemble de données. Elle est particulièrement utile pour identifier les pics de la distribution et effectuer des comparaisons avec d’autres variables par la suite.

question mark

Quel argument contrôle la transparence des courbes de densité superposées ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 4
some-alt