Unika Värden
Data dupliceras ofta i DataFrames. Till exempel, i countries
DataFrame, har kolumnen 'continent'
upprepade poster. Det finns en metod som hämtar en array av distinkta värden från en specifik DataFrame-kolumn.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Nu ska vi tillämpa unique()
metoden på kolumnerna 'continent'
och 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
För att räkna antalet unika värden i en specifik kolumn kan du använda metoden nunique()
:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fått en DataFrame
som heter audi_cars
.
- Identifiera alla distinkta värden i kolumnen
'year'
och lagra resultatet i kolumnenunique_years
. - Identifiera alla distinkta värden i kolumnen
'fueltype'
och lagra resultatet i variabelnunique_fueltype
. - Bestäm antalet unika bränsletyper och lagra resultatet i variabeln
count_unique_fueltypes
.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
How does the `nunique()` method work?
Can I use `nunique()` on multiple columns at once?
What is the difference between `unique()` and `nunique()`?
Awesome!
Completion rate improved to 3.03
Unika Värden
Svep för att visa menyn
Data dupliceras ofta i DataFrames. Till exempel, i countries
DataFrame, har kolumnen 'continent'
upprepade poster. Det finns en metod som hämtar en array av distinkta värden från en specifik DataFrame-kolumn.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Nu ska vi tillämpa unique()
metoden på kolumnerna 'continent'
och 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
För att räkna antalet unika värden i en specifik kolumn kan du använda metoden nunique()
:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Du har fått en DataFrame
som heter audi_cars
.
- Identifiera alla distinkta värden i kolumnen
'year'
och lagra resultatet i kolumnenunique_years
. - Identifiera alla distinkta värden i kolumnen
'fueltype'
och lagra resultatet i variabelnunique_fueltype
. - Bestäm antalet unika bränsletyper och lagra resultatet i variabeln
count_unique_fueltypes
.
Lösning
Tack för dina kommentarer!
Awesome!
Completion rate improved to 3.03single