single
Remplir les valeurs manquantes
Glissez pour afficher le menu
Supprimer les valeurs manquantes n'est pas la seule façon de s'en débarrasser. Il est également possible de remplacer tous les NaN par une valeur définie, par exemple, par la moyenne de la colonne ou par des zéros. Cette méthode peut s'avérer utile dans de nombreux cas. Vous l'apprendrez dans le cours Apprendre les statistiques avec Python.
Voici un exemple de remplissage des valeurs manquantes dans la colonne 'Age' avec la médiane de cette colonne :
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
Explication :
.fillna(value=data['Age'].median(), inplace=True)
value = data['Age'].median()– avec l'argumentvalue, on indique à la méthode.fillna()quoi faire avec les valeursNaN. Dans ce cas, la méthode.fillna()est appliquée à la colonne'Age'et toutes les valeurs manquantes sont remplacées par la médiane de la colonne ;inplace=True– argument permettant d'enregistrer les modifications.
Glissez pour commencer à coder
Les valeurs manquantes peuvent poser des problèmes lors de l'analyse des données. L'une des méthodes les plus courantes pour les traiter consiste à remplacer les valeurs manquantes par la moyenne de la colonne.
Votre tâche consiste à :
- Remplacer toutes les valeurs
NaNdans la colonne'Age'par la moyenne de cette colonne.
- Utiliser la méthode
.fillna()avec les argumentsvalue=data['Age'].mean()etinplace=True.
- Calculer et afficher le nombre de valeurs manquantes restantes dans la colonne
'Age'.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion