Contenu du cours
Premiers Pas Avec Pandas
Premiers Pas Avec Pandas
Valeurs Uniques
Les données sont souvent dupliquées dans les DataFrames. Par exemple, dans le DataFrame countries
, la colonne 'continent'
a des entrées répétées. Il existe une méthode qui récupère un tableau de valeurs distinctes d'une colonne spécifique d'un DataFrame.
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Maintenant, nous allons appliquer la méthode unique()
aux colonnes 'continent'
et 'country'
:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Pour compter le nombre de valeurs distinctes dans une colonne spécifique, vous pouvez utiliser la méthode nunique()
:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Étant donné le DataFrame audi_cars
:
- Identifiez toutes les valeurs distinctes dans les colonnes
'year'
et'fueltype'
. - Déterminez le nombre de types de carburant uniques.
Solution
Merci pour vos commentaires !
Valeurs Uniques
Les données sont souvent dupliquées dans les DataFrames. Par exemple, dans le DataFrame countries
, la colonne 'continent'
a des entrées répétées. Il existe une méthode qui récupère un tableau de valeurs distinctes d'une colonne spécifique d'un DataFrame.
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Maintenant, nous allons appliquer la méthode unique()
aux colonnes 'continent'
et 'country'
:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Pour compter le nombre de valeurs distinctes dans une colonne spécifique, vous pouvez utiliser la méthode nunique()
:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Étant donné le DataFrame audi_cars
:
- Identifiez toutes les valeurs distinctes dans les colonnes
'year'
et'fueltype'
. - Déterminez le nombre de types de carburant uniques.
Solution
Merci pour vos commentaires !