Eindeutige Werte
Daten werden in DataFrames häufig dupliziert. Zum Beispiel enthält die Spalte countries im DataFrame 'continent' wiederholte Einträge. Es gibt eine Methode, die ein Array mit eindeutigen Werten aus einer bestimmten DataFrame-Spalte abruft.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anschließend die Methode unique() auf die Spalten 'continent' und 'country' anwenden:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Um die Anzahl der unterschiedlichen Werte in einer bestimmten Spalte zu ermitteln, kann die Methode nunique() verwendet werden:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Es steht ein DataFrame mit dem Namen audi_cars zur Verfügung.
- Alle unterschiedlichen Werte in der Spalte
'year'identifizieren und das Ergebnis in der Spalteunique_yearsspeichern. - Alle unterschiedlichen Werte in der Spalte
'fueltype'identifizieren und das Ergebnis in der Variableunique_fueltypespeichern. - Die Anzahl der unterschiedlichen Kraftstoffarten ermitteln und das Ergebnis in der Variable
count_unique_fueltypesspeichern.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.03
Eindeutige Werte
Swipe um das Menü anzuzeigen
Daten werden in DataFrames häufig dupliziert. Zum Beispiel enthält die Spalte countries im DataFrame 'continent' wiederholte Einträge. Es gibt eine Methode, die ein Array mit eindeutigen Werten aus einer bestimmten DataFrame-Spalte abruft.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Anschließend die Methode unique() auf die Spalten 'continent' und 'country' anwenden:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Um die Anzahl der unterschiedlichen Werte in einer bestimmten Spalte zu ermitteln, kann die Methode nunique() verwendet werden:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Es steht ein DataFrame mit dem Namen audi_cars zur Verfügung.
- Alle unterschiedlichen Werte in der Spalte
'year'identifizieren und das Ergebnis in der Spalteunique_yearsspeichern. - Alle unterschiedlichen Werte in der Spalte
'fueltype'identifizieren und das Ergebnis in der Variableunique_fueltypespeichern. - Die Anzahl der unterschiedlichen Kraftstoffarten ermitteln und das Ergebnis in der Variable
count_unique_fueltypesspeichern.
Lösung
Danke für Ihr Feedback!
single