Unieke Waarden
Gegevens worden vaak gedupliceerd in DataFrames. In de countries
DataFrame bevat bijvoorbeeld de kolom 'continent'
herhaalde waarden. Er is een methode die een array van unieke waarden uit een specifieke DataFrame-kolom ophaalt.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Vervolgens de unique()
-methode toepassen op de kolommen 'continent'
en 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Voor het tellen van het aantal unieke waarden in een specifieke kolom, kan de methode nunique()
worden gebruikt:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Je krijgt een DataFrame
genaamd audi_cars
.
- Identificeer alle unieke waarden in de kolom
'year'
en sla het resultaat op in de kolomunique_years
. - Identificeer alle unieke waarden in de kolom
'fueltype'
en sla het resultaat op in de variabeleunique_fueltype
. - Bepaal het aantal unieke brandstoftypen en sla het resultaat op in de variabele
count_unique_fueltypes
.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
How does the nunique() method work?
Can I use nunique() on multiple columns at once?
What is the difference between unique() and nunique()?
Awesome!
Completion rate improved to 3.03
Unieke Waarden
Veeg om het menu te tonen
Gegevens worden vaak gedupliceerd in DataFrames. In de countries
DataFrame bevat bijvoorbeeld de kolom 'continent'
herhaalde waarden. Er is een methode die een array van unieke waarden uit een specifieke DataFrame-kolom ophaalt.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Vervolgens de unique()
-methode toepassen op de kolommen 'continent'
en 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Voor het tellen van het aantal unieke waarden in een specifieke kolom, kan de methode nunique()
worden gebruikt:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Je krijgt een DataFrame
genaamd audi_cars
.
- Identificeer alle unieke waarden in de kolom
'year'
en sla het resultaat op in de kolomunique_years
. - Identificeer alle unieke waarden in de kolom
'fueltype'
en sla het resultaat op in de variabeleunique_fueltype
. - Bepaal het aantal unieke brandstoftypen en sla het resultaat op in de variabele
count_unique_fueltypes
.
Oplossing
Bedankt voor je feedback!
single