Contenu du cours
Techniques Avancées dans Pandas
Techniques Avancées dans Pandas
1. Se Familiariser Avec l'Indexation et la Sélection de Données
5. Prétraitement des Données
Vérification des Valeurs ManquantesCalcul du Nombre de Valeurs ManquantesQue Ferons-Nous Avec les Valeurs NaN?Comment Supprimer Uniquement les Valeurs NaN ?Remplir les Valeurs ManquantesGestion des Variables CatégoriellesVérification du Type de ColonneGestion d'une Colonne IncorrecteRenommer la Colonne
Vérification du Type de Colonne
Si vous tombez sur la colonne 'Fare'
, les nombres ici sont séparés par le signe -
. Cela semble étrange, n'est-ce pas ? Nous avions l'habitude d'utiliser .
comme séparateur, et Python ne peut comprendre que les nombres séparés par des points. Vérifions le type de cette colonne. Vous pouvez le faire en utilisant l'attribut .dtypes
. Regardez l'exemple avec la colonne 'Age'
.
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/titanic3.csv', index_col = 0) print(data['Age'].dtypes)
Explication :
La syntaxe .dtypes
est simple ; vous l'appliquez simplement à la colonne ou à l'ensemble du jeu de données. Dans notre cas, le type est float64.
Tout était clair ?
Merci pour vos commentaires !
Section 5. Chapitre 7