Ryhmittely Useiden Sarakkeiden Mukaan
Lisätään tietoa .groupby()
-metodista. Voit ryhmitellä useiden sarakkeiden perusteella, mutta järjestyksellä on tällöin ratkaiseva merkitys. Edellisessä luvussa ryhmittelimme tietoja lennon numeron mukaan ja laskimme viiveiden määrän. Voimme monimutkaistaa tätä tehtävää ryhmittelemällä paitsi 'Flight'
-sarakkeen, myös 'Airline'
-sarakkeen mukaan. Kertaa tietoaineiston tiedot ja tarkastele sitten tätä yksinkertaista esimerkkiä (tuloste sisältää vain ensimmäiset 10 riviä):
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay', 'Airline']].groupby(['Flight', 'Airline']).count() print(data_flights.head(10))
Selitys:
data[['Flight', 'Delay', 'Airline']].groupby(['Flight', 'Airline']).count()
data[['Flight', 'Delay', 'Airline']]
– sarakkeet, joiden kanssa työskennellään, mukaan lukien sarakkeet, joiden mukaan ryhmitellään;.groupby(['Flight', 'Airline'])
– tässä'Flight'
ja'Airline'
ovat funktion.groupby()
argumentteja.
Huomioi, että jos haluat ryhmitellä useiden sarakkeiden perusteella, laita ne listaan – järjestyksellä on ratkaiseva merkitys. Tässä tapauksessa, jos tietojoukon riveillä on sama arvo 'Flight'
-sarakkeessa, ne kuuluvat samaan ryhmään. Tämän jälkeen näiden ryhmien sisällä funktio etsii muita ryhmiä riveille, joilla on sama arvo 'Airline'
-sarakkeessa. Lopuksi .count()
-metodi laskee rivien määrän 'Delay'
-sarakkeessa, joilla on sama arvo 'Airline'
-sarakkeessa kullekin 'Flight'
-ryhmälle.
Swipe to start coding
Tehtävänäsi on ryhmitellä 'AirportFrom'
sarakkeiden 'DayOfWeek'
ja 'Time'
mukaan. Laske sarakkeen data
keskiarvo. Noudata alla olevaa algoritmia:
- Poimi sarakkeet:
.groupby()
,.groupby()
ja'AirportFrom'
. - Sovella
'DayOfWeek'
-metodia sarakkeille. - Laske
'Time'
-ryhmittelyn tuloksesta keskiarvo. - Tulosta ensimmäiset
10
riviädata_flights
-taulukosta.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain why the order of columns in `.groupby()` matters?
What does the `.count()` method do in this context?
Can you show how the output would change if we switched the order of the columns in `.groupby()`?
Awesome!
Completion rate improved to 3.03
Ryhmittely Useiden Sarakkeiden Mukaan
Pyyhkäise näyttääksesi valikon
Lisätään tietoa .groupby()
-metodista. Voit ryhmitellä useiden sarakkeiden perusteella, mutta järjestyksellä on tällöin ratkaiseva merkitys. Edellisessä luvussa ryhmittelimme tietoja lennon numeron mukaan ja laskimme viiveiden määrän. Voimme monimutkaistaa tätä tehtävää ryhmittelemällä paitsi 'Flight'
-sarakkeen, myös 'Airline'
-sarakkeen mukaan. Kertaa tietoaineiston tiedot ja tarkastele sitten tätä yksinkertaista esimerkkiä (tuloste sisältää vain ensimmäiset 10 riviä):
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay', 'Airline']].groupby(['Flight', 'Airline']).count() print(data_flights.head(10))
Selitys:
data[['Flight', 'Delay', 'Airline']].groupby(['Flight', 'Airline']).count()
data[['Flight', 'Delay', 'Airline']]
– sarakkeet, joiden kanssa työskennellään, mukaan lukien sarakkeet, joiden mukaan ryhmitellään;.groupby(['Flight', 'Airline'])
– tässä'Flight'
ja'Airline'
ovat funktion.groupby()
argumentteja.
Huomioi, että jos haluat ryhmitellä useiden sarakkeiden perusteella, laita ne listaan – järjestyksellä on ratkaiseva merkitys. Tässä tapauksessa, jos tietojoukon riveillä on sama arvo 'Flight'
-sarakkeessa, ne kuuluvat samaan ryhmään. Tämän jälkeen näiden ryhmien sisällä funktio etsii muita ryhmiä riveille, joilla on sama arvo 'Airline'
-sarakkeessa. Lopuksi .count()
-metodi laskee rivien määrän 'Delay'
-sarakkeessa, joilla on sama arvo 'Airline'
-sarakkeessa kullekin 'Flight'
-ryhmälle.
Swipe to start coding
Tehtävänäsi on ryhmitellä 'AirportFrom'
sarakkeiden 'DayOfWeek'
ja 'Time'
mukaan. Laske sarakkeen data
keskiarvo. Noudata alla olevaa algoritmia:
- Poimi sarakkeet:
.groupby()
,.groupby()
ja'AirportFrom'
. - Sovella
'DayOfWeek'
-metodia sarakkeille. - Laske
'Time'
-ryhmittelyn tuloksesta keskiarvo. - Tulosta ensimmäiset
10
riviädata_flights
-taulukosta.
Ratkaisu
Kiitos palautteestasi!
single