Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Que ferons-nous avec les valeurs NaN ? | Prétraitement des Données
Techniques Avancées dans Pandas

bookQue ferons-nous avec les valeurs NaN ?

Dans le chapitre précédent, vous avez obtenu le résultat :

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Le jeu de données contient 418 lignes. Regardez la colonne Cabin, où l’on compte 327 valeurs manquantes. Il n’est pas pertinent de les remplir car nous disposons de très peu d’informations ici. Ainsi, dans ce cas, la meilleure solution consiste à supprimer la colonne qui n’a pas de sens pour nous. L’une des raisons est que nous pourrions supprimer uniquement les lignes contenant des valeurs manquantes, mais il n’est pas envisageable de supprimer 327 lignes sur 418. Voyons donc comment procéder.

Pour supprimer une colonne, il faut appliquer la méthode .drop() au jeu de données. La syntaxe est la suivante :

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Explication :

  • .drop() — méthode qui supprime des colonnes ;
  • columns = 'column_name' ou columns = ['column_1', 'column_2'] — argument de la fonction où l’on précise le ou les noms des colonnes à supprimer ;
  • inplace = True — argument utile de pandas permettant d’enregistrer toutes les modifications. Il peut également être utilisé dans d’autres fonctions ; nous en découvrirons certaines plus tard.
Tâche

Swipe to start coding

Votre tâche consiste à supprimer la colonne contenant le plus grand nombre de valeurs NaN. Suivez l'algorithme :

  1. Supprimer la colonne 'Cabin' en utilisant l'argument inplace = True.
  2. Afficher 5 lignes aléatoires de l'ensemble de données.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 3
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 3.03

bookQue ferons-nous avec les valeurs NaN ?

Glissez pour afficher le menu

Dans le chapitre précédent, vous avez obtenu le résultat :

PassengerId0
Survived0
Pclass0
Name0
Sex0
Age86
SibSp0
Parch0
Ticket0
Fare1
Cabin327
Embarked0

Le jeu de données contient 418 lignes. Regardez la colonne Cabin, où l’on compte 327 valeurs manquantes. Il n’est pas pertinent de les remplir car nous disposons de très peu d’informations ici. Ainsi, dans ce cas, la meilleure solution consiste à supprimer la colonne qui n’a pas de sens pour nous. L’une des raisons est que nous pourrions supprimer uniquement les lignes contenant des valeurs manquantes, mais il n’est pas envisageable de supprimer 327 lignes sur 418. Voyons donc comment procéder.

Pour supprimer une colonne, il faut appliquer la méthode .drop() au jeu de données. La syntaxe est la suivante :

# If you want to delete one column
data.drop(columns = 'column_name', inplace = True)

# If you want to delete several columns
data.drop(columns = ['column_1', 'column_2'], inplace = True)

Explication :

  • .drop() — méthode qui supprime des colonnes ;
  • columns = 'column_name' ou columns = ['column_1', 'column_2'] — argument de la fonction où l’on précise le ou les noms des colonnes à supprimer ;
  • inplace = True — argument utile de pandas permettant d’enregistrer toutes les modifications. Il peut également être utilisé dans d’autres fonctions ; nous en découvrirons certaines plus tard.
Tâche

Swipe to start coding

Votre tâche consiste à supprimer la colonne contenant le plus grand nombre de valeurs NaN. Suivez l'algorithme :

  1. Supprimer la colonne 'Cabin' en utilisant l'argument inplace = True.
  2. Afficher 5 lignes aléatoires de l'ensemble de données.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 5. Chapitre 3
single

single

some-alt