De Kleinste Waarden van een Kolom Vinden
We behandelen een andere essentiële functie, die de kleinste of grootste waarden retourneert. Je weet al dat we waarden kunnen sorteren en vervolgens een specifiek aantal rijen kunnen extraheren. Niet verrassend kan pandas dit doen met slechts één regel code. Bekijk het voorbeeld om de vijftien oudste auto's op te halen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Als je wilt sorteren op één kolom en daarna op een andere, geef dan een lijst met kolomnamen in de gewenste volgorde op. Bekijk het voorbeeld waarin we eerst sorteren op 'Year'
en vervolgens op 'Engine_volume'
. Deze code haalt eerst de 5
oudste auto's op, en als de jaartallen gelijk zijn, krijgt de auto met de kleinste waarde in de kolom 'Engine_volume'
voorrang:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Vergelijk de twee onderstaande voorbeelden. Nu breiden we de functie iets uit. We geven onze voorbeelden weer met de waarden van de kolom 'Year'
. In onze kolom kunnen de waarden van 'Year'
herhaald worden, dus als we de tien oudste auto's willen tonen met de vorige syntaxis, neemt onze functie slechts tien waarden. Het maakt niet uit of de 11e of 12e waarde gelijk is aan de 10e. We kunnen het argument keep = 'all'
toevoegen aan de .nsmallest()
-methode om dergelijke gevallen te voorkomen. Bekijk het voorbeeld en voer het uit om het verschil te zien:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Tijd om te oefenen! Volg hierbij het volgende algoritme:
- Haal gegevens op van auto's waarbij de waarden in de kolom
'Year'
groter zijn dan2010
. - Selecteer de goedkoopste
15
auto's (de15
kleinste waarden in de kolom'Price'
). Neem alle dubbele waarden van de kolom'Price'
mee. - Toon alle waarden van de dataset
data_cheapest
.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.03
De Kleinste Waarden van een Kolom Vinden
Veeg om het menu te tonen
We behandelen een andere essentiële functie, die de kleinste of grootste waarden retourneert. Je weet al dat we waarden kunnen sorteren en vervolgens een specifiek aantal rijen kunnen extraheren. Niet verrassend kan pandas dit doen met slechts één regel code. Bekijk het voorbeeld om de vijftien oudste auto's op te halen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Als je wilt sorteren op één kolom en daarna op een andere, geef dan een lijst met kolomnamen in de gewenste volgorde op. Bekijk het voorbeeld waarin we eerst sorteren op 'Year'
en vervolgens op 'Engine_volume'
. Deze code haalt eerst de 5
oudste auto's op, en als de jaartallen gelijk zijn, krijgt de auto met de kleinste waarde in de kolom 'Engine_volume'
voorrang:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Vergelijk de twee onderstaande voorbeelden. Nu breiden we de functie iets uit. We geven onze voorbeelden weer met de waarden van de kolom 'Year'
. In onze kolom kunnen de waarden van 'Year'
herhaald worden, dus als we de tien oudste auto's willen tonen met de vorige syntaxis, neemt onze functie slechts tien waarden. Het maakt niet uit of de 11e of 12e waarde gelijk is aan de 10e. We kunnen het argument keep = 'all'
toevoegen aan de .nsmallest()
-methode om dergelijke gevallen te voorkomen. Bekijk het voorbeeld en voer het uit om het verschil te zien:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Tijd om te oefenen! Volg hierbij het volgende algoritme:
- Haal gegevens op van auto's waarbij de waarden in de kolom
'Year'
groter zijn dan2010
. - Selecteer de goedkoopste
15
auto's (de15
kleinste waarden in de kolom'Price'
). Neem alle dubbele waarden van de kolom'Price'
mee. - Toon alle waarden van de dataset
data_cheapest
.
Oplossing
Bedankt voor je feedback!
single