Eindeutige Werte
Daten werden in DataFrames häufig dupliziert. Zum Beispiel enthält die Spalte countries im DataFrame 'continent' wiederholte Einträge. Es gibt eine Methode, die ein Array mit eindeutigen Werten aus einer bestimmten DataFrame-Spalte abruft.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anschließend die Methode unique() auf die Spalten 'continent' und 'country' anwenden:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Manchmal möchte man anstelle aller eindeutigen Werte lediglich wissen, wie viele verschiedene Werte in einer Spalte vorhanden sind. In solchen Fällen kann die Methode nunique() verwendet werden. Sie gibt die Anzahl der eindeutigen Einträge in einer Spalte zurück – nicht die Werte selbst.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Es steht ein DataFrame mit dem Namen audi_cars zur Verfügung.
Ziel ist es, die darin enthaltenen Daten zu untersuchen und mithilfe von Pandas-Methoden eindeutige Werte zu identifizieren.
- Alle eindeutigen Werte aus der Spalte
'year'abrufen und in der Variablenunique_yearsspeichern. - Alle eindeutigen Werte aus der Spalte
'fueltype'abrufen und in der Variablenunique_fueltypespeichern. - Die Anzahl der unterschiedlichen Kraftstoffarten in der Spalte
'fueltype'mit der Methode.nunique()ermitteln und das Ergebnis in der Variablencount_unique_fueltypesspeichern.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.03
Eindeutige Werte
Swipe um das Menü anzuzeigen
Daten werden in DataFrames häufig dupliziert. Zum Beispiel enthält die Spalte countries im DataFrame 'continent' wiederholte Einträge. Es gibt eine Methode, die ein Array mit eindeutigen Werten aus einer bestimmten DataFrame-Spalte abruft.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anschließend die Methode unique() auf die Spalten 'continent' und 'country' anwenden:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Manchmal möchte man anstelle aller eindeutigen Werte lediglich wissen, wie viele verschiedene Werte in einer Spalte vorhanden sind. In solchen Fällen kann die Methode nunique() verwendet werden. Sie gibt die Anzahl der eindeutigen Einträge in einer Spalte zurück – nicht die Werte selbst.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Es steht ein DataFrame mit dem Namen audi_cars zur Verfügung.
Ziel ist es, die darin enthaltenen Daten zu untersuchen und mithilfe von Pandas-Methoden eindeutige Werte zu identifizieren.
- Alle eindeutigen Werte aus der Spalte
'year'abrufen und in der Variablenunique_yearsspeichern. - Alle eindeutigen Werte aus der Spalte
'fueltype'abrufen und in der Variablenunique_fueltypespeichern. - Die Anzahl der unterschiedlichen Kraftstoffarten in der Spalte
'fueltype'mit der Methode.nunique()ermitteln und das Ergebnis in der Variablencount_unique_fueltypesspeichern.
Lösung
Danke für Ihr Feedback!
single