Het Vinden van de Kleinste Waarden van een Kolom

Je leert een andere cruciale functie kennen, die de kleinste of grootste waarden retourneert. Je weet al dat we waarden kunnen sorteren en vervolgens een specifiek aantal rijen kunnen extraheren. Niet verrassend kan pandas dit doen met slechts één regel code. Bekijk het voorbeeld van hoe je de vijftien oudste auto's ophaalt:


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
data_smallest = data.nsmallest(15, 'Year')
print(data_smallest.head(15))

Als je wilt sorteren op één kolom en daarna op een andere, plaats je gewoon een lijst met kolomnamen in de gewenste volgorde. Bekijk het voorbeeld waarin we eerst sorteren op 'Year' en daarna op 'Engine_volume'. Deze code haalt eerst de 5 oudste auto's op, en als de jaren gelijk zijn, krijgt de auto met de kleinste waarde in de kolom 'Engine_volume' voorrang:


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
data_smallest = data.nsmallest(5, ['Year', 'Engine_volume'])
print(data_smallest.head())

Vergelijk de twee onderstaande voorbeelden. Nu gaan we de functie iets uitbreiden. We geven onze voorbeelden weer met de waarden van de kolom 'Year'. In onze kolom kunnen de waarden van 'Year' herhaald worden, dus als we de tien oudste auto's willen weergeven met de vorige syntax, neemt onze functie slechts tien waarden. Het maakt niet uit of de 11e of 12e waarde gelijk is aan de 10e. We kunnen het argument keep = 'all' toevoegen aan de .nsmallest()-methode om zulke gevallen te voorkomen. Bekijk het voorbeeld en probeer het uit te voeren om het verschil te zien:


              1234567891011
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
# Case without using `keep = 'all'` argument
data_smallest = data.nsmallest(6, 'Year')
print(data_smallest)

data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
# Case with using `keep = 'all'` argument
data_smallest = data.nsmallest(6, 'Year',
                             keep = 'all')
print(data_smallest)

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 5

single

Veeg om het menu te tonen

Je leert een andere cruciale functie kennen, die de kleinste of grootste waarden retourneert. Je weet al dat we waarden kunnen sorteren en vervolgens een specifiek aantal rijen kunnen extraheren. Niet verrassend kan pandas dit doen met slechts één regel code. Bekijk het voorbeeld van hoe je de vijftien oudste auto's ophaalt:


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
data_smallest = data.nsmallest(15, 'Year')
print(data_smallest.head(15))

Als je wilt sorteren op één kolom en daarna op een andere, plaats je gewoon een lijst met kolomnamen in de gewenste volgorde. Bekijk het voorbeeld waarin we eerst sorteren op 'Year' en daarna op 'Engine_volume'. Deze code haalt eerst de 5 oudste auto's op, en als de jaren gelijk zijn, krijgt de auto met de kleinste waarde in de kolom 'Engine_volume' voorrang:


              1234
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
data_smallest = data.nsmallest(5, ['Year', 'Engine_volume'])
print(data_smallest.head())

Vergelijk de twee onderstaande voorbeelden. Nu gaan we de functie iets uitbreiden. We geven onze voorbeelden weer met de waarden van de kolom 'Year'. In onze kolom kunnen de waarden van 'Year' herhaald worden, dus als we de tien oudste auto's willen weergeven met de vorige syntax, neemt onze functie slechts tien waarden. Het maakt niet uit of de 11e of 12e waarde gelijk is aan de 10e. We kunnen het argument keep = 'all' toevoegen aan de .nsmallest()-methode om zulke gevallen te voorkomen. Bekijk het voorbeeld en probeer het uit te voeren om het verschil te zien:


              1234567891011
            
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
# Case without using `keep = 'all'` argument
data_smallest = data.nsmallest(6, 'Year')
print(data_smallest)

data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
# Case with using `keep = 'all'` argument
data_smallest = data.nsmallest(6, 'Year',
                             keep = 'all')
print(data_smallest)

Taak

Veeg om te beginnen met coderen

Volg hierbij het volgende algoritme:

Haal gegevens op van auto's waarbij de waarden in de kolom 'Year' groter zijn dan 2010.
Selecteer de goedkoopste 15 auto's (de 15 kleinste waarden in de kolom 'Price'). Neem alle dubbele waarden van de kolom 'Price' mee.
Geef alle waarden van de dataset data_cheapest weer.

Oplossing

Schakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 5

single

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.