Valori Unici
I dati spesso vengono duplicati nei DataFrame. Ad esempio, nel DataFrame countries
, la colonna 'continent'
ha voci ripetute. Esiste un metodo che recupera un array di valori distinti da una specifica colonna del DataFrame.
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Ora, applicheremo il metodo unique()
alle colonne 'continent'
e 'country'
:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Per contare il numero di valori distinti in una colonna specifica, puoi usare il metodo nunique()
:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Compito
Swipe to start coding
Ti viene dato un DataFrame
chiamato audi_cars
.
- Identifica tutti i valori distinti nella colonna
'year'
e memorizza il risultato nella colonnaunique_years
. - Identifica tutti i valori distinti nella colonna
'fueltype'
e memorizza il risultato nella variabileunique_fueltype
. - Determina il numero di tipi di carburante unici e memorizza il risultato nella variabile
count_unique_fueltypes
.
Soluzione
Tutto è chiaro?
Grazie per i tuoi commenti!
Sezione 3. Capitolo 15