Unike Verdier
Data blir ofte duplisert i DataFrames. For eksempel har kolonnen countries i 'continent' DataFrame gjentatte oppføringer. Det finnes en metode som henter ut et array med unike verdier fra en spesifikk kolonne i en DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Deretter brukes metoden unique() på kolonnene 'continent' og 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Noen ganger, i stedet for å hente ut alle unike verdier, ønsker du kanskje bare å vite hvor mange distinkte verdier som finnes i en kolonne. I slike tilfeller kan du bruke metoden nunique(). Den returnerer antallet unike oppføringer i en kolonne — ikke verdiene selv.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fått en DataFrame kalt audi_cars.
Målet ditt er å utforske dataene og identifisere unike verdier ved hjelp av Pandas-metoder.
- Hent alle distinkte verdier fra
'year'-kolonnen og lagre dem i variabelenunique_years. - Hent alle distinkte verdier fra
'fueltype'-kolonnen og lagre dem i variabelenunique_fueltype. - Finn antall unike drivstofftyper i
'fueltype'-kolonnen ved å bruke.nunique()-metoden og lagre resultatet i variabelencount_unique_fueltypes.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
What does the output of the nunique() method look like?
Can I use nunique() on multiple columns at once?
What happens if there are missing values in the column?
Awesome!
Completion rate improved to 3.03
Unike Verdier
Sveip for å vise menyen
Data blir ofte duplisert i DataFrames. For eksempel har kolonnen countries i 'continent' DataFrame gjentatte oppføringer. Det finnes en metode som henter ut et array med unike verdier fra en spesifikk kolonne i en DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Deretter brukes metoden unique() på kolonnene 'continent' og 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Noen ganger, i stedet for å hente ut alle unike verdier, ønsker du kanskje bare å vite hvor mange distinkte verdier som finnes i en kolonne. I slike tilfeller kan du bruke metoden nunique(). Den returnerer antallet unike oppføringer i en kolonne — ikke verdiene selv.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fått en DataFrame kalt audi_cars.
Målet ditt er å utforske dataene og identifisere unike verdier ved hjelp av Pandas-metoder.
- Hent alle distinkte verdier fra
'year'-kolonnen og lagre dem i variabelenunique_years. - Hent alle distinkte verdier fra
'fueltype'-kolonnen og lagre dem i variabelenunique_fueltype. - Finn antall unike drivstofftyper i
'fueltype'-kolonnen ved å bruke.nunique()-metoden og lagre resultatet i variabelencount_unique_fueltypes.
Løsning
Takk for tilbakemeldingene dine!
single