Edistynyt Ryhmittely
Laajennetaan tietämystämme .groupby()-menetelmästä. Kuten muistat, voimme käyttää myös .agg()-menetelmää. Tämän funktion tärkein etu on, että voimme soveltaa eri funktioita numeerisiin sarakkeisiin yhdellä ryhmäavaimella. Tarkastele esimerkkiä, jossa ryhmiteltiin lennot sarakkeen 'Airline' mukaan, laskettiin 'Delay'-sarakkeen arvot jokaiselle 'Airline'-arvolle ja laskettiin 'Length'-sarakkeen pienimmät ja suurimmat arvot. Erittäin kätevää, eikö totta?
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data.groupby('Airline').agg({'Delay': 'count', 'Length': ['min', 'max']}) print(data_flights.head(10))
Selitys:
.agg({'Delay': 'count', 'Length': ['min', 'max']})
.agg()– menetelmä, jonka avulla voidaan soveltaa funktioita sarjaan tai jokaiseen alkioon erikseen;{}– käytetään aaltosulkeita sarakkeiden määrittelyyn ja funktioiden suoraan soveltamiseen niihin;'Delay': 'count'– soveltaa.count()-funktiota'Delay'-sarakkeen arvoihin, joilla on sama ryhmäavain;'Length': ['min', 'max']– soveltaa.min()- ja.max()-funktioita'Length'-sarakkeen arvoihin, joilla on sama ryhmäavain. Riittää, että sijoitat funktioon pelkän sarakkeen nimen ilman()- tai.-merkkejä. Huomaa, että jos haluat soveltaa useita funktioita samaan sarakkeeseen, ne tulee laittaa listaan.
Swipe to start coding
Tehtävänäsi on perehtyä tarkemmin ja tarkastella keskimääräisiä ja suurimpia viiveaikoja riippuen siitä, miltä lentokentältä lento lähti ja mille lentokentälle lento päättyi. Tarkastele myös lennon mediaanikestoa. Noudata seuraavaa algoritmia:
Ryhmittele data:
- Käytä
.groupby()-metodia tietojoukkoondata; .groupby()-metodin sisällä aseta sarakkeet'AirportFrom'ja'AirportTo'; järjestyksellä on merkitystä;- Käytä
.agg()-metodia laskeaksesi aggregoidut arvot: sarakkeen'Time'keskiarvo ja maksimiarvo sekä sarakkeen'Length'mediaaniarvo.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain what the output of this code would look like?
What other functions can I use with `.agg()` besides 'count', 'min', and 'max'?
How can I group by multiple columns using `.groupby()` and `.agg()`?
Awesome!
Completion rate improved to 3.03
Edistynyt Ryhmittely
Pyyhkäise näyttääksesi valikon
Laajennetaan tietämystämme .groupby()-menetelmästä. Kuten muistat, voimme käyttää myös .agg()-menetelmää. Tämän funktion tärkein etu on, että voimme soveltaa eri funktioita numeerisiin sarakkeisiin yhdellä ryhmäavaimella. Tarkastele esimerkkiä, jossa ryhmiteltiin lennot sarakkeen 'Airline' mukaan, laskettiin 'Delay'-sarakkeen arvot jokaiselle 'Airline'-arvolle ja laskettiin 'Length'-sarakkeen pienimmät ja suurimmat arvot. Erittäin kätevää, eikö totta?
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data.groupby('Airline').agg({'Delay': 'count', 'Length': ['min', 'max']}) print(data_flights.head(10))
Selitys:
.agg({'Delay': 'count', 'Length': ['min', 'max']})
.agg()– menetelmä, jonka avulla voidaan soveltaa funktioita sarjaan tai jokaiseen alkioon erikseen;{}– käytetään aaltosulkeita sarakkeiden määrittelyyn ja funktioiden suoraan soveltamiseen niihin;'Delay': 'count'– soveltaa.count()-funktiota'Delay'-sarakkeen arvoihin, joilla on sama ryhmäavain;'Length': ['min', 'max']– soveltaa.min()- ja.max()-funktioita'Length'-sarakkeen arvoihin, joilla on sama ryhmäavain. Riittää, että sijoitat funktioon pelkän sarakkeen nimen ilman()- tai.-merkkejä. Huomaa, että jos haluat soveltaa useita funktioita samaan sarakkeeseen, ne tulee laittaa listaan.
Swipe to start coding
Tehtävänäsi on perehtyä tarkemmin ja tarkastella keskimääräisiä ja suurimpia viiveaikoja riippuen siitä, miltä lentokentältä lento lähti ja mille lentokentälle lento päättyi. Tarkastele myös lennon mediaanikestoa. Noudata seuraavaa algoritmia:
Ryhmittele data:
- Käytä
.groupby()-metodia tietojoukkoondata; .groupby()-metodin sisällä aseta sarakkeet'AirportFrom'ja'AirportTo'; järjestyksellä on merkitystä;- Käytä
.agg()-metodia laskeaksesi aggregoidut arvot: sarakkeen'Time'keskiarvo ja maksimiarvo sekä sarakkeen'Length'mediaaniarvo.
Ratkaisu
Kiitos palautteestasi!
single