Kursinhalt
Pandas Erste Schritte
Pandas Erste Schritte
Eindeutige Werte
Daten werden in DataFrames häufig dupliziert. Zum Beispiel hat die Spalte countries
im 'continent'
DataFrame wiederholte Einträge. Es gibt eine Methode, die ein Array von eindeutigen Werten aus einer bestimmten DataFrame-Spalte abruft.
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Jetzt wenden wir die unique()
Methode auf die Spalten 'continent'
und 'country'
an:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Um die Anzahl der eindeutigen Werte in einer bestimmten Spalte zu zählen, können Sie die Methode nunique()
verwenden:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Gegeben ist der audi_cars
DataFrame:
- Identifizieren Sie alle eindeutigen Werte in den Spalten
'year'
und'fueltype'
. - Bestimmen Sie die Anzahl der einzigartigen Kraftstoffarten.
Lösung
Danke für Ihr Feedback!
Eindeutige Werte
Daten werden in DataFrames häufig dupliziert. Zum Beispiel hat die Spalte countries
im 'continent'
DataFrame wiederholte Einträge. Es gibt eine Methode, die ein Array von eindeutigen Werten aus einer bestimmten DataFrame-Spalte abruft.
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Jetzt wenden wir die unique()
Methode auf die Spalten 'continent'
und 'country'
an:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Um die Anzahl der eindeutigen Werte in einer bestimmten Spalte zu zählen, können Sie die Methode nunique()
verwenden:
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Gegeben ist der audi_cars
DataFrame:
- Identifizieren Sie alle eindeutigen Werte in den Spalten
'year'
und'fueltype'
. - Bestimmen Sie die Anzahl der einzigartigen Kraftstoffarten.
Lösung
Danke für Ihr Feedback!