Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Het Vinden van de Kleinste Waarden van een Kolom | Gegevens Extraheren
Data Wrangling met Pandas
Sectie 3. Hoofdstuk 5
single

single

bookHet Vinden van de Kleinste Waarden van een Kolom

Veeg om het menu te tonen

Je leert een andere cruciale functie kennen, die de kleinste of grootste waarden retourneert. Je weet al dat we waarden kunnen sorteren en vervolgens een specifiek aantal rijen kunnen extraheren. Niet verrassend kan pandas dit doen met slechts één regel code. Bekijk het voorbeeld van hoe je de vijftien oudste auto's ophaalt:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Als je wilt sorteren op één kolom en daarna op een andere, plaats je gewoon een lijst met kolomnamen in de gewenste volgorde. Bekijk het voorbeeld waarin we eerst sorteren op 'Year' en daarna op 'Engine_volume'. Deze code haalt eerst de 5 oudste auto's op, en als de jaren gelijk zijn, krijgt de auto met de kleinste waarde in de kolom 'Engine_volume' voorrang:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Vergelijk de twee onderstaande voorbeelden. Nu gaan we de functie iets uitbreiden. We geven onze voorbeelden weer met de waarden van de kolom 'Year'. In onze kolom kunnen de waarden van 'Year' herhaald worden, dus als we de tien oudste auto's willen weergeven met de vorige syntax, neemt onze functie slechts tien waarden. Het maakt niet uit of de 11e of 12e waarde gelijk is aan de 10e. We kunnen het argument keep = 'all' toevoegen aan de .nsmallest()-methode om zulke gevallen te voorkomen. Bekijk het voorbeeld en probeer het uit te voeren om het verschil te zien:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Taak

Veeg om te beginnen met coderen

Volg hierbij het volgende algoritme:

  1. Haal gegevens op van auto's waarbij de waarden in de kolom 'Year' groter zijn dan 2010.
  2. Selecteer de goedkoopste 15 auto's (de 15 kleinste waarden in de kolom 'Price'). Neem alle dubbele waarden van de kolom 'Price' mee.
  3. Geef alle waarden van de dataset data_cheapest weer.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 5
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

some-alt