Unieke Waarden
Gegevens worden vaak gedupliceerd in DataFrames. In de countries DataFrame bevat bijvoorbeeld de kolom 'continent' herhaalde waarden. Er is een methode die een array met unieke waarden uit een specifieke DataFrame-kolom ophaalt.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Vervolgens de unique()-methode toepassen op de kolommen 'continent' en 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Soms wil je in plaats van alle unieke waarden op te halen, alleen weten hoeveel verschillende waarden er in een kolom staan. In zulke gevallen kun je de nunique()-methode gebruiken. Deze geeft het aantal unieke items in een kolom terug — niet de waarden zelf.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Je krijgt een DataFrame genaamd audi_cars.
Het doel is om de gegevens te verkennen en unieke waarden te identificeren met behulp van Pandas-methoden.
- Haal alle unieke waarden op uit de kolom
'year'en sla deze op in de variabeleunique_years. - Haal alle unieke waarden op uit de kolom
'fueltype'en sla deze op in de variabeleunique_fueltype. - Bepaal het aantal unieke brandstoftypen in de kolom
'fueltype'met de.nunique()-methode en sla het resultaat op in de variabelecount_unique_fueltypes.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
What does the output of the nunique() method look like?
Can I use nunique() on multiple columns at once?
What happens if there are missing values in the column?
Awesome!
Completion rate improved to 3.03
Unieke Waarden
Veeg om het menu te tonen
Gegevens worden vaak gedupliceerd in DataFrames. In de countries DataFrame bevat bijvoorbeeld de kolom 'continent' herhaalde waarden. Er is een methode die een array met unieke waarden uit een specifieke DataFrame-kolom ophaalt.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Vervolgens de unique()-methode toepassen op de kolommen 'continent' en 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Soms wil je in plaats van alle unieke waarden op te halen, alleen weten hoeveel verschillende waarden er in een kolom staan. In zulke gevallen kun je de nunique()-methode gebruiken. Deze geeft het aantal unieke items in een kolom terug — niet de waarden zelf.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Je krijgt een DataFrame genaamd audi_cars.
Het doel is om de gegevens te verkennen en unieke waarden te identificeren met behulp van Pandas-methoden.
- Haal alle unieke waarden op uit de kolom
'year'en sla deze op in de variabeleunique_years. - Haal alle unieke waarden op uit de kolom
'fueltype'en sla deze op in de variabeleunique_fueltype. - Bepaal het aantal unieke brandstoftypen in de kolom
'fueltype'met de.nunique()-methode en sla het resultaat op in de variabelecount_unique_fueltypes.
Oplossing
Bedankt voor je feedback!
single