Att Bekanta Sig Med .groupby()-Metoden
Jag är glad att se dig i denna sektion. Här kommer vi att gruppera våra data för att hitta information om olika grupper av rader. Undersök datasettet om förseningar (du kan scrolla tabellen horisontellt):
Att gruppera data är fördelaktigt, och nu kommer vi att fördjupa oss i detta. Föreställ dig att du vill beräkna antalet förseningar för varje flygnummer. Titta på kodexemplet och sedan på förklaringen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Förklaring:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]– Dessa är kolumnerna du arbetar med, inklusive de kolumner du ska gruppera;groupby('Flight')– Kolumnen'Flight'är argumentet för funktionen.groupby(). Detta innebär att rader med samma värde i kolumnen'Flight'kommer att grupperas tillsammans;.sum()– Denna funktion används på rader inom varje grupp som skapats av.groupby(). I detta fall summeras värdena i kolumnen'Delay'för rader som tillhör samma'Flight'-grupp.
Eftersom kolumnen 'Delay' endast innehåller 0 (ingen försening inträffade) eller 1 (en försening inträffade) som möjliga värden, representerar summan av raderna antalet förseningar för varje flyg.
Faktum är att .sum() är en av många aggregeringsfunktioner du kan använda. Du kommer att bekanta dig med alla dessa under kursens gång.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Can you explain how to use other aggregation functions like mean or median?
What does the output look like when grouping by a different column?
Can you show an example of grouping by multiple columns?
Awesome!
Completion rate improved to 3.03
Att Bekanta Sig Med .groupby()-Metoden
Svep för att visa menyn
Jag är glad att se dig i denna sektion. Här kommer vi att gruppera våra data för att hitta information om olika grupper av rader. Undersök datasettet om förseningar (du kan scrolla tabellen horisontellt):
Att gruppera data är fördelaktigt, och nu kommer vi att fördjupa oss i detta. Föreställ dig att du vill beräkna antalet förseningar för varje flygnummer. Titta på kodexemplet och sedan på förklaringen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Förklaring:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]– Dessa är kolumnerna du arbetar med, inklusive de kolumner du ska gruppera;groupby('Flight')– Kolumnen'Flight'är argumentet för funktionen.groupby(). Detta innebär att rader med samma värde i kolumnen'Flight'kommer att grupperas tillsammans;.sum()– Denna funktion används på rader inom varje grupp som skapats av.groupby(). I detta fall summeras värdena i kolumnen'Delay'för rader som tillhör samma'Flight'-grupp.
Eftersom kolumnen 'Delay' endast innehåller 0 (ingen försening inträffade) eller 1 (en försening inträffade) som möjliga värden, representerar summan av raderna antalet förseningar för varje flyg.
Faktum är att .sum() är en av många aggregeringsfunktioner du kan använda. Du kommer att bekanta dig med alla dessa under kursens gång.
Tack för dina kommentarer!