Unike Verdier
Data blir ofte duplisert i DataFrames. For eksempel, i countries
DataFrame, har 'continent'
-kolonnen gjentatte oppføringer. Det finnes en metode som henter en array av distinkte verdier fra en spesifikk DataFrame-kolonne.
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Nå skal vi bruke unique()
-metoden på 'continent'
og 'country'
-kolonnene:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
For å telle antall distinkte verdier i en spesifikk kolonne, kan du bruke nunique()
-metoden:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Oppgave
Swipe to start coding
Du har en DataFrame
kalt audi_cars
.
- Identifiser alle distinkte verdier i
'year'
-kolonnen og lagre resultatet iunique_years
-kolonnen. - Identifiser alle distinkte verdier i
'fueltype'
-kolonnen og lagre resultatet iunique_fueltype
-variabelen. - Bestem antall unike drivstofftyper og lagre resultatet i
count_unique_fueltypes
-variabelen.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 15