Remplissage des Valeurs Manquantes
Supprimer les valeurs manquantes n'est pas la seule méthode pour s'en débarrasser. Il est également possible de remplacer tous les NaN par une valeur définie, par exemple, par la valeur moyenne de la colonne ou par des zéros. Cette approche peut s'avérer utile dans de nombreux cas. Vous apprendrez cette technique dans le cours Apprendre les statistiques avec Python.
Consultez l'exemple de remplissage des valeurs manquantes dans la colonne 'Age' avec la valeur médiane de cette colonne :
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Explication :
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()- en utilisant l'argumentvalue, on indique à la méthode.fillna()quoi faire avec les valeursNaN. Dans ce cas, la méthode.fillna()est appliquée à la colonne'Age'et toutes les valeurs manquantes sont remplacées par la médiane de la colonne ;inplace=True- argument permettant de sauvegarder les modifications.
Swipe to start coding
Les valeurs manquantes peuvent poser des problèmes lors de l'analyse des données. L'une des méthodes les plus courantes pour les traiter consiste à remplacer les valeurs manquantes par la moyenne de la colonne.
Votre tâche consiste à :
- Remplacer toutes les valeurs
NaNdans la colonne'Age'par la moyenne de cette colonne.
- Utiliser la méthode
.fillna()avec les argumentsvalue=data['Age'].mean()etinplace=True.
- Calculer et afficher le nombre de valeurs manquantes restantes dans la colonne
'Age'.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.03
Remplissage des Valeurs Manquantes
Glissez pour afficher le menu
Supprimer les valeurs manquantes n'est pas la seule méthode pour s'en débarrasser. Il est également possible de remplacer tous les NaN par une valeur définie, par exemple, par la valeur moyenne de la colonne ou par des zéros. Cette approche peut s'avérer utile dans de nombreux cas. Vous apprendrez cette technique dans le cours Apprendre les statistiques avec Python.
Consultez l'exemple de remplissage des valeurs manquantes dans la colonne 'Age' avec la valeur médiane de cette colonne :
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Explication :
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()- en utilisant l'argumentvalue, on indique à la méthode.fillna()quoi faire avec les valeursNaN. Dans ce cas, la méthode.fillna()est appliquée à la colonne'Age'et toutes les valeurs manquantes sont remplacées par la médiane de la colonne ;inplace=True- argument permettant de sauvegarder les modifications.
Swipe to start coding
Les valeurs manquantes peuvent poser des problèmes lors de l'analyse des données. L'une des méthodes les plus courantes pour les traiter consiste à remplacer les valeurs manquantes par la moyenne de la colonne.
Votre tâche consiste à :
- Remplacer toutes les valeurs
NaNdans la colonne'Age'par la moyenne de cette colonne.
- Utiliser la méthode
.fillna()avec les argumentsvalue=data['Age'].mean()etinplace=True.
- Calculer et afficher le nombre de valeurs manquantes restantes dans la colonne
'Age'.
Solution
Merci pour vos commentaires !
single