Unikke Værdier
Data bliver ofte duplikeret i DataFrames. For eksempel har kolonnen countries i DataFrame 'continent' gentagne værdier. Der findes en metode, der henter et array af unikke værdier fra en bestemt DataFrame-kolonne.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anvend derefter metoden unique() på kolonnerne 'continent' og 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Nogle gange ønsker man ikke at hente alle unikke værdier, men blot vide hvor mange forskellige værdier der findes i en kolonne. I sådanne tilfælde kan du anvende metoden nunique(). Den returnerer antallet af unikke poster i en kolonne — ikke selve værdierne.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fået en DataFrame ved navn audi_cars.
Dit mål er at udforske dens data og identificere unikke værdier ved hjælp af Pandas-metoder.
- Hent alle forskellige værdier fra kolonnen
'year'og gem dem i variablenunique_years. - Hent alle forskellige værdier fra kolonnen
'fueltype'og gem dem i variablenunique_fueltype. - Bestem antallet af unikke brændstoftyper i kolonnen
'fueltype'ved at bruge.nunique()-metoden og gem resultatet i variablencount_unique_fueltypes.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
What does the output of the nunique() method look like?
Can I use nunique() on multiple columns at once?
What happens if there are missing values in the column?
Awesome!
Completion rate improved to 3.03
Unikke Værdier
Stryg for at vise menuen
Data bliver ofte duplikeret i DataFrames. For eksempel har kolonnen countries i DataFrame 'continent' gentagne værdier. Der findes en metode, der henter et array af unikke værdier fra en bestemt DataFrame-kolonne.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anvend derefter metoden unique() på kolonnerne 'continent' og 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Nogle gange ønsker man ikke at hente alle unikke værdier, men blot vide hvor mange forskellige værdier der findes i en kolonne. I sådanne tilfælde kan du anvende metoden nunique(). Den returnerer antallet af unikke poster i en kolonne — ikke selve værdierne.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fået en DataFrame ved navn audi_cars.
Dit mål er at udforske dens data og identificere unikke værdier ved hjælp af Pandas-metoder.
- Hent alle forskellige værdier fra kolonnen
'year'og gem dem i variablenunique_years. - Hent alle forskellige værdier fra kolonnen
'fueltype'og gem dem i variablenunique_fueltype. - Bestem antallet af unikke brændstoftyper i kolonnen
'fueltype'ved at bruge.nunique()-metoden og gem resultatet i variablencount_unique_fueltypes.
Løsning
Tak for dine kommentarer!
single