Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Remplissage des Valeurs Manquantes | Prétraitement des Données
Techniques Avancées dans Pandas

bookRemplissage des Valeurs Manquantes

Supprimer les valeurs manquantes n'est pas la seule méthode pour s'en débarrasser. Il est également possible de remplacer tous les NaN par une valeur définie, par exemple, par la valeur moyenne de la colonne ou par des zéros. Cette approche peut s'avérer utile dans de nombreux cas. Vous apprendrez cette technique dans le cours Apprendre les statistiques avec Python.

Consultez l'exemple de remplissage des valeurs manquantes dans la colonne 'Age' avec la valeur médiane de cette colonne :

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Explication :

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() - en utilisant l'argument value, on indique à la méthode .fillna() quoi faire avec les valeurs NaN. Dans ce cas, la méthode .fillna() est appliquée à la colonne 'Age' et toutes les valeurs manquantes sont remplacées par la médiane de la colonne ;
  • inplace=True - argument permettant de sauvegarder les modifications.
Tâche

Swipe to start coding

Les valeurs manquantes peuvent poser des problèmes lors de l'analyse des données. L'une des méthodes les plus courantes pour les traiter consiste à remplacer les valeurs manquantes par la moyenne de la colonne.

Votre tâche consiste à :

  1. Remplacer toutes les valeurs NaN dans la colonne 'Age' par la moyenne de cette colonne.
  • Utiliser la méthode .fillna() avec les arguments value=data['Age'].mean() et inplace=True.
  1. Calculer et afficher le nombre de valeurs manquantes restantes dans la colonne 'Age'.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 5
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 3.03

bookRemplissage des Valeurs Manquantes

Glissez pour afficher le menu

Supprimer les valeurs manquantes n'est pas la seule méthode pour s'en débarrasser. Il est également possible de remplacer tous les NaN par une valeur définie, par exemple, par la valeur moyenne de la colonne ou par des zéros. Cette approche peut s'avérer utile dans de nombreux cas. Vous apprendrez cette technique dans le cours Apprendre les statistiques avec Python.

Consultez l'exemple de remplissage des valeurs manquantes dans la colonne 'Age' avec la valeur médiane de cette colonne :

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic_2', index_col = 0) data['Age'].fillna(value=data['Age'].median(), inplace=True) print(data['Age'].isna().sum())
copy

Explication :

.fillna(value=data['Age'].median(), inplace=True)
  • value = data['Age'].median() - en utilisant l'argument value, on indique à la méthode .fillna() quoi faire avec les valeurs NaN. Dans ce cas, la méthode .fillna() est appliquée à la colonne 'Age' et toutes les valeurs manquantes sont remplacées par la médiane de la colonne ;
  • inplace=True - argument permettant de sauvegarder les modifications.
Tâche

Swipe to start coding

Les valeurs manquantes peuvent poser des problèmes lors de l'analyse des données. L'une des méthodes les plus courantes pour les traiter consiste à remplacer les valeurs manquantes par la moyenne de la colonne.

Votre tâche consiste à :

  1. Remplacer toutes les valeurs NaN dans la colonne 'Age' par la moyenne de cette colonne.
  • Utiliser la méthode .fillna() avec les arguments value=data['Age'].mean() et inplace=True.
  1. Calculer et afficher le nombre de valeurs manquantes restantes dans la colonne 'Age'.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 5
single

single

some-alt