Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Eindeutige Werte | Datenanalyse
Pandas Erste Schritte

bookEindeutige Werte

Daten werden in DataFrames häufig dupliziert. Zum Beispiel enthält die Spalte countries im DataFrame 'continent' wiederholte Einträge. Es gibt eine Methode, die ein Array mit eindeutigen Werten aus einer bestimmten DataFrame-Spalte abruft.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Anschließend die Methode unique() auf die Spalten 'continent' und 'country' anwenden:

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Um die Anzahl der unterschiedlichen Werte in einer bestimmten Spalte zu ermitteln, kann die Methode nunique() verwendet werden:

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Aufgabe

Swipe to start coding

Es steht ein DataFrame mit dem Namen audi_cars zur Verfügung.

  • Alle unterschiedlichen Werte in der Spalte 'year' identifizieren und das Ergebnis in der Spalte unique_years speichern.
  • Alle unterschiedlichen Werte in der Spalte 'fueltype' identifizieren und das Ergebnis in der Variable unique_fueltype speichern.
  • Die Anzahl der unterschiedlichen Kraftstoffarten ermitteln und das Ergebnis in der Variable count_unique_fueltypes speichern.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 15
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.03

bookEindeutige Werte

Swipe um das Menü anzuzeigen

Daten werden in DataFrames häufig dupliziert. Zum Beispiel enthält die Spalte countries im DataFrame 'continent' wiederholte Einträge. Es gibt eine Methode, die ein Array mit eindeutigen Werten aus einer bestimmten DataFrame-Spalte abruft.

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
copy

Anschließend die Methode unique() auf die Spalten 'continent' und 'country' anwenden:

12345678910
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
copy

Um die Anzahl der unterschiedlichen Werte in einer bestimmten Spalte zu ermitteln, kann die Methode nunique() verwendet werden:

1234567
import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
copy
Aufgabe

Swipe to start coding

Es steht ein DataFrame mit dem Namen audi_cars zur Verfügung.

  • Alle unterschiedlichen Werte in der Spalte 'year' identifizieren und das Ergebnis in der Spalte unique_years speichern.
  • Alle unterschiedlichen Werte in der Spalte 'fueltype' identifizieren und das Ergebnis in der Variable unique_fueltype speichern.
  • Die Anzahl der unterschiedlichen Kraftstoffarten ermitteln und das Ergebnis in der Variable count_unique_fueltypes speichern.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 15
single

single

some-alt