Trouver la Corrélation
Enfin, passons à la dernière méthode de cette section appelée .corr(). Elle est très utile pour identifier la relation entre des données numériques. Imaginez que vous disposez d'un ensemble de données sur des maisons :
Examinons la sortie de data.corr() dans notre cas :
Procédons étape par étape : Vous avez des valeurs verticales et horizontales ; chaque paire se recoupe. À chaque recoupement, on peut obtenir une valeur comprise entre -1 et 1.
- 1 signifie que les deux valeurs dépendent l'une de l'autre de manière directement proportionnelle (si l'une augmente, l'autre augmente également) ;
- -1 signifie que les deux valeurs dépendent l'une de l'autre de manière inversement proportionnelle (si l'une augmente, l'autre diminue) ;
- 0 signifie que les deux valeurs dépendantes ne sont pas proportionnelles.
Si le jeu de données contient des colonnes non numériques, comme dans le jeu de données cars.csv utilisé dans la tâche, il convient de définir l’argument numeric_only=True afin de calculer la corrélation uniquement à partir des colonnes numériques.
Swipe to start coding
Vous terminerez cette section par une tâche simple : appliquer la fonction .corr() au jeu de données, sans oublier de passer le paramètre : numeric_only=True. Ensuite, essayez d'analyser les valeurs obtenues.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.03
Trouver la Corrélation
Glissez pour afficher le menu
Enfin, passons à la dernière méthode de cette section appelée .corr(). Elle est très utile pour identifier la relation entre des données numériques. Imaginez que vous disposez d'un ensemble de données sur des maisons :
Examinons la sortie de data.corr() dans notre cas :
Procédons étape par étape : Vous avez des valeurs verticales et horizontales ; chaque paire se recoupe. À chaque recoupement, on peut obtenir une valeur comprise entre -1 et 1.
- 1 signifie que les deux valeurs dépendent l'une de l'autre de manière directement proportionnelle (si l'une augmente, l'autre augmente également) ;
- -1 signifie que les deux valeurs dépendent l'une de l'autre de manière inversement proportionnelle (si l'une augmente, l'autre diminue) ;
- 0 signifie que les deux valeurs dépendantes ne sont pas proportionnelles.
Si le jeu de données contient des colonnes non numériques, comme dans le jeu de données cars.csv utilisé dans la tâche, il convient de définir l’argument numeric_only=True afin de calculer la corrélation uniquement à partir des colonnes numériques.
Swipe to start coding
Vous terminerez cette section par une tâche simple : appliquer la fonction .corr() au jeu de données, sans oublier de passer le paramètre : numeric_only=True. Ensuite, essayez d'analyser les valeurs obtenues.
Solution
Merci pour vos commentaires !
single