Contenu du cours
Techniques Avancées dans Pandas
Techniques Avancées dans Pandas
Trouver la Corrélation
Enfin, passons à la dernière méthode de cette section appelée .corr()
. Elle aide beaucoup à trouver la relation entre les données numériques. Imaginez que vous avez un ensemble de données sur les maisons :
Examinons la sortie de data.corr()
dans notre cas :
Alors, faisons-le étape par étape : Vous avez des valeurs verticales et horizontales ; chaque paire se chevauche. Dans chaque chevauchement, nous pouvons recevoir une valeur de -1 à 1.
- 1 signifie que deux valeurs dépendent l'une de l'autre de manière directement proportionnelle (si une valeur augmente, l'autre augmente aussi);
- -1 signifie que deux valeurs dépendent l'une de l'autre de manière inversement proportionnelle (si une valeur augmente, l'autre diminue);
- 0 signifie que les deux valeurs dépendantes ne sont pas proportionnelles.
Remarque
Si le jeu de données contient des colonnes non numériques, comme dans le jeu de données
cars.csv
utilisé dans la tâche, vous devez définir l'argumentnumeric_only=True
pour calculer la corrélation en utilisant uniquement les colonnes numériques.
Swipe to start coding
Vous terminerez cette section par une tâche simple : appliquez la fonction .corr()
au jeu de données. Ensuite, essayez d'analyser les chiffres que vous obtenez.
Solution
Merci pour vos commentaires !
Trouver la Corrélation
Enfin, passons à la dernière méthode de cette section appelée .corr()
. Elle aide beaucoup à trouver la relation entre les données numériques. Imaginez que vous avez un ensemble de données sur les maisons :
Examinons la sortie de data.corr()
dans notre cas :
Alors, faisons-le étape par étape : Vous avez des valeurs verticales et horizontales ; chaque paire se chevauche. Dans chaque chevauchement, nous pouvons recevoir une valeur de -1 à 1.
- 1 signifie que deux valeurs dépendent l'une de l'autre de manière directement proportionnelle (si une valeur augmente, l'autre augmente aussi);
- -1 signifie que deux valeurs dépendent l'une de l'autre de manière inversement proportionnelle (si une valeur augmente, l'autre diminue);
- 0 signifie que les deux valeurs dépendantes ne sont pas proportionnelles.
Remarque
Si le jeu de données contient des colonnes non numériques, comme dans le jeu de données
cars.csv
utilisé dans la tâche, vous devez définir l'argumentnumeric_only=True
pour calculer la corrélation en utilisant uniquement les colonnes numériques.
Swipe to start coding
Vous terminerez cette section par une tâche simple : appliquez la fonction .corr()
au jeu de données. Ensuite, essayez d'analyser les chiffres que vous obtenez.
Solution
Merci pour vos commentaires !