Fantastisk!
Completion rate forbedret til 3.03single
Unikke Værdier
Stryg for at vise menuen
Data bliver ofte duplikeret i DataFrames. For eksempel har kolonnen countries i DataFrame 'continent' gentagne værdier. Der findes en metode, der henter et array af unikke værdier fra en bestemt DataFrame-kolonne.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anvend derefter metoden unique() på kolonnerne 'continent' og 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Nogle gange, i stedet for at hente alle unikke værdier, ønsker du måske blot at vide hvor mange forskellige værdier der findes i en kolonne. I sådanne tilfælde kan du bruge metoden nunique(). Den returnerer antallet af unikke poster i en kolonne — ikke selve værdierne.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fået en DataFrame ved navn audi_cars.
Dit mål er at udforske dens data og identificere unikke værdier ved hjælp af Pandas-metoder.
- Hent alle forskellige værdier fra kolonnen
'year'og gem dem i variablenunique_years. - Hent alle forskellige værdier fra kolonnen
'fueltype'og gem dem i variablenunique_fueltype. - Bestem antallet af unikke brændstoftyper i kolonnen
'fueltype'ved at bruge.nunique()-metoden og gem resultatet i variablencount_unique_fueltypes.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat