Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Ermitteln der Kleinsten Werte Einer Spalte | Daten Extrahieren
Fortgeschrittene Techniken in Pandas

bookErmitteln der Kleinsten Werte Einer Spalte

Wir lernen eine weitere wichtige Funktion kennen, die die kleinsten oder größten Werte ausgibt. Sie wissen bereits, dass wir Werte sortieren und dann eine bestimmte Anzahl von Zeilen extrahieren können. Wenig überraschend kann pandas dies mit nur einer Codezeile erledigen. Sehen Sie sich das Beispiel an, wie Sie die fünfzehn ältesten Autos abrufen:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Wenn Sie nach einer Spalte und anschließend nach einer weiteren sortieren möchten, geben Sie einfach eine Liste mit den Spaltennamen in der gewünschten Reihenfolge an. Sehen Sie sich das Beispiel an, in dem wir zuerst nach 'Year' und dann nach 'Engine_volume' sortieren. Dieser Code extrahiert zunächst die 5 ältesten Autos, und falls die Jahre übereinstimmen, erhält das Auto mit dem kleineren Wert in der Spalte 'Engine_volume' den Vorrang:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Vergleichen Sie die beiden folgenden Beispiele. Nun erweitern wir die Funktion etwas. Wir geben unsere Beispiele mit den Werten der Spalte 'Year' zurück. In unserer Spalte können die Werte für 'Year' mehrfach vorkommen. Wenn wir mit der bisherigen Syntax die zehn ältesten Autos ausgeben möchten, gibt unsere Funktion einfach zehn Werte zurück. Es wird nicht berücksichtigt, ob der 11. oder 12. Wert identisch mit dem 10. ist. Um solche Fälle zu vermeiden, kann das Argument keep = 'all' in die Methode .nsmallest() eingefügt werden. Sehen Sie sich das Beispiel an und führen Sie es aus, um den Unterschied zu erkennen:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Aufgabe

Swipe to start coding

Abschließend folgt eine praktische Übung! Gehen Sie dabei nach folgendem Algorithmus vor:

  1. Abrufen der Daten zu Autos, bei denen die Werte in der Spalte 'Year' größer als 2010 sind.
  2. Extrahieren der günstigsten 15 Autos (die 15 kleinsten Werte der Spalte 'Price'). Alle doppelten Werte in der Spalte 'Price' einbeziehen.
  3. Ausgabe aller Werte des Datensatzes data_cheapest.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 5
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain what the `nsmallest()` function does in pandas?

What does the `keep='all'` argument change in the output?

How can I use `nlargest()` instead of `nsmallest()` for the largest values?

close

Awesome!

Completion rate improved to 3.03

bookErmitteln der Kleinsten Werte Einer Spalte

Swipe um das Menü anzuzeigen

Wir lernen eine weitere wichtige Funktion kennen, die die kleinsten oder größten Werte ausgibt. Sie wissen bereits, dass wir Werte sortieren und dann eine bestimmte Anzahl von Zeilen extrahieren können. Wenig überraschend kann pandas dies mit nur einer Codezeile erledigen. Sehen Sie sich das Beispiel an, wie Sie die fünfzehn ältesten Autos abrufen:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Wenn Sie nach einer Spalte und anschließend nach einer weiteren sortieren möchten, geben Sie einfach eine Liste mit den Spaltennamen in der gewünschten Reihenfolge an. Sehen Sie sich das Beispiel an, in dem wir zuerst nach 'Year' und dann nach 'Engine_volume' sortieren. Dieser Code extrahiert zunächst die 5 ältesten Autos, und falls die Jahre übereinstimmen, erhält das Auto mit dem kleineren Wert in der Spalte 'Engine_volume' den Vorrang:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Vergleichen Sie die beiden folgenden Beispiele. Nun erweitern wir die Funktion etwas. Wir geben unsere Beispiele mit den Werten der Spalte 'Year' zurück. In unserer Spalte können die Werte für 'Year' mehrfach vorkommen. Wenn wir mit der bisherigen Syntax die zehn ältesten Autos ausgeben möchten, gibt unsere Funktion einfach zehn Werte zurück. Es wird nicht berücksichtigt, ob der 11. oder 12. Wert identisch mit dem 10. ist. Um solche Fälle zu vermeiden, kann das Argument keep = 'all' in die Methode .nsmallest() eingefügt werden. Sehen Sie sich das Beispiel an und führen Sie es aus, um den Unterschied zu erkennen:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Aufgabe

Swipe to start coding

Abschließend folgt eine praktische Übung! Gehen Sie dabei nach folgendem Algorithmus vor:

  1. Abrufen der Daten zu Autos, bei denen die Werte in der Spalte 'Year' größer als 2010 sind.
  2. Extrahieren der günstigsten 15 Autos (die 15 kleinsten Werte der Spalte 'Price'). Alle doppelten Werte in der Spalte 'Price' einbeziehen.
  3. Ausgabe aller Werte des Datensatzes data_cheapest.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 5
single

single

some-alt