Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Unieke Waarden | Gegevens Analyseren
Pandas Eerste Stappen

bookUnieke Waarden

Gegevens worden vaak gedupliceerd in DataFrames. In de countries DataFrame bevat bijvoorbeeld de kolom 'continent' herhaalde waarden. Er is een methode die een array met unieke waarden uit een specifieke DataFrame-kolom ophaalt.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Vervolgens de unique()-methode toepassen op de kolommen 'continent' en 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Soms wil je in plaats van alle unieke waarden op te halen, alleen weten hoeveel verschillende waarden er in een kolom staan. In zulke gevallen kun je de nunique()-methode gebruiken. Deze geeft het aantal unieke items in een kolom terug — niet de waarden zelf.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Taak

Swipe to start coding

Je krijgt een DataFrame genaamd audi_cars. Het doel is om de gegevens te verkennen en unieke waarden te identificeren met behulp van Pandas-methoden.

  1. Haal alle unieke waarden op uit de kolom 'year' en sla deze op in de variabele unique_years.
  2. Haal alle unieke waarden op uit de kolom 'fueltype' en sla deze op in de variabele unique_fueltype.
  3. Bepaal het aantal unieke brandstoftypen in de kolom 'fueltype' met de .nunique()-methode en sla het resultaat op in de variabele count_unique_fueltypes.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 15
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

What does the output of the nunique() method look like?

Can I use nunique() on multiple columns at once?

What happens if there are missing values in the column?

close

Awesome!

Completion rate improved to 3.03

bookUnieke Waarden

Veeg om het menu te tonen

Gegevens worden vaak gedupliceerd in DataFrames. In de countries DataFrame bevat bijvoorbeeld de kolom 'continent' herhaalde waarden. Er is een methode die een array met unieke waarden uit een specifieke DataFrame-kolom ophaalt.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Vervolgens de unique()-methode toepassen op de kolommen 'continent' en 'country':

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Soms wil je in plaats van alle unieke waarden op te halen, alleen weten hoeveel verschillende waarden er in een kolom staan. In zulke gevallen kun je de nunique()-methode gebruiken. Deze geeft het aantal unieke items in een kolom terug — niet de waarden zelf.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Taak

Swipe to start coding

Je krijgt een DataFrame genaamd audi_cars. Het doel is om de gegevens te verkennen en unieke waarden te identificeren met behulp van Pandas-methoden.

  1. Haal alle unieke waarden op uit de kolom 'year' en sla deze op in de variabele unique_years.
  2. Haal alle unieke waarden op uit de kolom 'fueltype' en sla deze op in de variabele unique_fueltype.
  3. Bepaal het aantal unieke brandstoftypen in de kolom 'fueltype' met de .nunique()-methode en sla het resultaat op in de variabele count_unique_fueltypes.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 15
single

single

some-alt