Visualisation des Corrélations avec des Nuages de Points
Glissez pour afficher le menu
Bien que les cartes de chaleur de corrélation offrent un résumé des relations linéaires entre les variables, elles ne permettent pas d’identifier les relations non linéaires. Dans ces situations, les nuages de points sont plus utiles.
Pourquoi utiliser des nuages de points ?
Les nuages de points constituent un moyen simple mais puissant de visualiser la relation entre deux variables numériques. Ils permettent de détecter à la fois les tendances linéaires et non linéaires, de mettre en évidence les valeurs aberrantes ou les anomalies, et d’apporter une compréhension plus approfondie des relations qui pourraient n’apparaître que de manière abstraite dans une carte de chaleur de corrélation. En représentant chaque point de données individuellement, les nuages de points offrent une vue claire et intuitive de l’interaction entre les variables.
Exemple : Prix de vente vs. Puissance maximale
Un nuage de points peut être utilisé pour examiner comment la puissance d’une voiture influence sa valeur sur le marché. Dans ce cas, l’axe des abscisses représente la puissance maximale, tandis que l’axe des ordonnées représente le prix de vente.
ggplot(data = df, aes(x = max_power, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Max Power",
x = "Max Power",
y = "Selling Price")
Cette visualisation permet de voir facilement s’il existe une relation linéaire positive, où une puissance plus élevée correspond généralement à un prix de vente plus élevé.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion