Valori Unici
I dati vengono spesso duplicati nei DataFrame. Ad esempio, nel DataFrame countries, la colonna 'continent' contiene voci ripetute. Esiste un metodo che restituisce un array di valori distinti da una specifica colonna di un DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Successivamente, applicare il metodo unique() alle colonne 'continent' e 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
A volte, invece di recuperare tutti i valori unici, può essere utile conoscere quanti valori distinti sono presenti in una colonna. In questi casi, è possibile utilizzare il metodo nunique(). Questo restituisce il conteggio delle voci uniche in una colonna — non i valori stessi.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Ti viene fornito un DataFrame chiamato audi_cars.
L'obiettivo è esplorare i suoi dati e identificare i valori unici utilizzando i metodi di Pandas.
- Recuperare tutti i valori distinti dalla colonna
'year'e salvarli nella variabileunique_years. - Recuperare tutti i valori distinti dalla colonna
'fueltype'e salvarli nella variabileunique_fueltype. - Determinare il numero di tipi di carburante unici nella colonna
'fueltype'utilizzando il metodo.nunique()e salvare il risultato nella variabilecount_unique_fueltypes.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
What does the output of the nunique() method look like?
Can I use nunique() on multiple columns at once?
What happens if there are missing values in the column?
Awesome!
Completion rate improved to 3.03
Valori Unici
Scorri per mostrare il menu
I dati vengono spesso duplicati nei DataFrame. Ad esempio, nel DataFrame countries, la colonna 'continent' contiene voci ripetute. Esiste un metodo che restituisce un array di valori distinti da una specifica colonna di un DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Successivamente, applicare il metodo unique() alle colonne 'continent' e 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
A volte, invece di recuperare tutti i valori unici, può essere utile conoscere quanti valori distinti sono presenti in una colonna. In questi casi, è possibile utilizzare il metodo nunique(). Questo restituisce il conteggio delle voci uniche in una colonna — non i valori stessi.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Ti viene fornito un DataFrame chiamato audi_cars.
L'obiettivo è esplorare i suoi dati e identificare i valori unici utilizzando i metodi di Pandas.
- Recuperare tutti i valori distinti dalla colonna
'year'e salvarli nella variabileunique_years. - Recuperare tutti i valori distinti dalla colonna
'fueltype'e salvarli nella variabileunique_fueltype. - Determinare il numero di tipi di carburante unici nella colonna
'fueltype'utilizzando il metodo.nunique()e salvare il risultato nella variabilecount_unique_fueltypes.
Soluzione
Grazie per i tuoi commenti!
single