Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Valeurs Uniques | Analyse des Données
Quizzes & Challenges
Quizzes
Challenges
/
Introduction à Pandas

bookValeurs Uniques

Les données sont souvent dupliquées dans les DataFrames. Par exemple, dans le DataFrame countries, la colonne 'continent' contient des entrées répétées. Il existe une méthode permettant d'obtenir un tableau de valeurs distinctes à partir d'une colonne spécifique d'un DataFrame.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Ensuite, appliquer la méthode unique() aux colonnes 'continent' et 'country' :

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Parfois, au lieu de récupérer toutes les valeurs uniques, il peut être utile de connaître combien de valeurs distinctes existent dans une colonne. Dans ce cas, la méthode nunique() peut être utilisée. Elle retourne le nombre d'entrées uniques dans une colonne — et non les valeurs elles-mêmes.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tâche

Swipe to start coding

Vous disposez d'un DataFrame nommé audi_cars. Votre objectif est d'explorer ses données et d'identifier les valeurs uniques à l'aide des méthodes Pandas.

  1. Extraire toutes les valeurs distinctes de la colonne 'year' et les stocker dans la variable unique_years.
  2. Extraire toutes les valeurs distinctes de la colonne 'fueltype' et les stocker dans la variable unique_fueltype.
  3. Déterminer le nombre de types de carburant uniques dans la colonne 'fueltype' en utilisant la méthode .nunique() et stocker le résultat dans la variable count_unique_fueltypes.

Solution

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 15
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

close

Awesome!

Completion rate improved to 3.03

bookValeurs Uniques

Glissez pour afficher le menu

Les données sont souvent dupliquées dans les DataFrames. Par exemple, dans le DataFrame countries, la colonne 'continent' contient des entrées répétées. Il existe une méthode permettant d'obtenir un tableau de valeurs distinctes à partir d'une colonne spécifique d'un DataFrame.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Ensuite, appliquer la méthode unique() aux colonnes 'continent' et 'country' :

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Parfois, au lieu de récupérer toutes les valeurs uniques, il peut être utile de connaître combien de valeurs distinctes existent dans une colonne. Dans ce cas, la méthode nunique() peut être utilisée. Elle retourne le nombre d'entrées uniques dans une colonne — et non les valeurs elles-mêmes.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Tâche

Swipe to start coding

Vous disposez d'un DataFrame nommé audi_cars. Votre objectif est d'explorer ses données et d'identifier les valeurs uniques à l'aide des méthodes Pandas.

  1. Extraire toutes les valeurs distinctes de la colonne 'year' et les stocker dans la variable unique_years.
  2. Extraire toutes les valeurs distinctes de la colonne 'fueltype' et les stocker dans la variable unique_fueltype.
  3. Déterminer le nombre de types de carburant uniques dans la colonne 'fueltype' en utilisant la méthode .nunique() et stocker le résultat dans la variable count_unique_fueltypes.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 15
single

single

some-alt