Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Ist Die Daten in ...? | Daten Extrahieren
Fortgeschrittene Techniken in Pandas

book
Ist Die Daten in ...?

In diesem Abschnitt werden wir weiterhin Daten mit spezifischen Bedingungen extrahieren. Hier werden Sie mit der hilfreichen Methode .isin() vertraut gemacht. Aber zuerst müssen Sie den Datensatz untersuchen. Schauen Sie sich die ersten fünf Zeilen an:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
print(data.head())
123
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) print(data.head())
copy

Schauen Sie sich nun das Beispiel und die Erklärung unten an:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
data_extracted = data.loc[data['Manufacturer'].isin(models)]
print(data_extracted.head())
12345
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI'] data_extracted = data.loc[data['Manufacturer'].isin(models)] print(data_extracted.head())
copy

Erklärung:

Wenn Sie sich erinnern, setzen wir die Bedingungen immer in das .loc[] Attribut. Hier machen wir dasselbe. Die .isin(list) Methode überprüft, ob die Werte aus der Spalte im Array enthalten sind. In unserem Fall überprüfen wir, ob die Werte aus der Spalte 'Manufacturer' in der Liste models enthalten sind.

Aufgabe

Swipe to start coding

Ihre Aufgabe besteht darin, Daten über Autos zu extrahieren, bei denen die Werte aus der Spalte 'Color' gleich 'Grey', 'White', 'Black' sind. Befolgen Sie den Algorithmus, um die Aufgabe einfach zu bewältigen:

  1. Erstellen Sie die colors Liste mit den Elementen 'Grey', 'White', 'Black' (in dieser Reihenfolge).
  2. Extrahieren Sie Werte aus der Spalte 'Color', die die Liste color enthält. Verwenden Sie das .loc[] Attribut.
  3. Geben Sie die letzten fünf Zeilen des Datensatzes data_extracted aus.

Lösung

import pandas as pd

data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)

# Create a list
colors = ['Grey', 'White', 'Black']
# Extract needed values
data_extracted = data.loc[data['Color'].isin(colors)]

# Output data
print(data_extracted.tail())

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 1
import pandas as pd

data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)

# Create a list
colors = ___
# Extract needed values
data_extracted = data.loc[data[___].___(___)]

# Output data
print(data_extracted.___)
toggle bottom row
some-alt