Remplissage des Valeurs Manquantes
Supprimer les valeurs manquantes n'est pas la seule méthode pour s'en débarrasser. Il est également possible de remplacer tous les NaN par une valeur définie, par exemple, par la moyenne de la colonne ou par des zéros. Cette approche peut s'avérer utile dans de nombreux cas. Vous l'apprendrez dans le cours Apprendre les statistiques avec Python.
Consultez l'exemple de remplissage des valeurs manquantes dans la colonne 'Age'
avec la médiane de cette colonne :
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Explication :
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– en utilisant l'argumentvalue
, on indique à la méthode.fillna()
comment traiter les valeursNaN
. Dans ce cas, la méthode.fillna()
est appliquée à la colonne'Age'
et toutes les valeurs manquantes sont remplacées par la médiane de la colonne ;inplace=True
– argument permettant de sauvegarder les modifications.
Swipe to start coding
L'une des méthodes les plus courantes pour remplir les valeurs manquantes consiste à les remplacer par la valeur moyenne de la colonne. Votre tâche ici est donc de remplacer les valeurs NaN
dans la colonne 'Age'
par la moyenne de cette colonne (en utilisant l'argument inplace = True
). Ensuite, affichez la somme des valeurs manquantes dans la colonne 'Age'
.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain the difference between using the mean and the median to fill missing values?
What are some other strategies for handling missing data?
Can you show how to fill missing values in multiple columns at once?
Awesome!
Completion rate improved to 3.03
Remplissage des Valeurs Manquantes
Glissez pour afficher le menu
Supprimer les valeurs manquantes n'est pas la seule méthode pour s'en débarrasser. Il est également possible de remplacer tous les NaN par une valeur définie, par exemple, par la moyenne de la colonne ou par des zéros. Cette approche peut s'avérer utile dans de nombreux cas. Vous l'apprendrez dans le cours Apprendre les statistiques avec Python.
Consultez l'exemple de remplissage des valeurs manquantes dans la colonne 'Age'
avec la médiane de cette colonne :
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Explication :
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()
– en utilisant l'argumentvalue
, on indique à la méthode.fillna()
comment traiter les valeursNaN
. Dans ce cas, la méthode.fillna()
est appliquée à la colonne'Age'
et toutes les valeurs manquantes sont remplacées par la médiane de la colonne ;inplace=True
– argument permettant de sauvegarder les modifications.
Swipe to start coding
L'une des méthodes les plus courantes pour remplir les valeurs manquantes consiste à les remplacer par la valeur moyenne de la colonne. Votre tâche ici est donc de remplacer les valeurs NaN
dans la colonne 'Age'
par la moyenne de cette colonne (en utilisant l'argument inplace = True
). Ensuite, affichez la somme des valeurs manquantes dans la colonne 'Age'
.
Solution
Merci pour vos commentaires !
single