single
Raggruppamento per più colonne
Scorri per mostrare il menu
Aggiunta di informazioni sul metodo .groupby(). Possibilità di raggruppare per più colonne, con importanza dell'ordine. Nel capitolo precedente, raggruppamento dei dati per numero di volo e conteggio dei ritardi. Complicazione del compito raggruppando non solo per la colonna 'Flight', ma anche per la colonna 'Airline'. Revisione delle informazioni sul dataset e osservazione di questo semplice esempio (l'output mostra solo le prime 10 righe):
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay', 'Airline']].groupby(['Flight', 'Airline']).count() print(data_flights.head(10))
Spiegazione:
data[['Flight', 'Delay', 'Airline']].groupby(['Flight', 'Airline']).count()
data[['Flight', 'Delay', 'Airline']]- colonne utilizzate, incluse quelle per il raggruppamento;.groupby(['Flight', 'Airline'])-'Flight'e'Airline'sono argomenti della funzione.groupby().
Attenzione: per raggruppare per più colonne, inserirle in una lista; l'ordine è fondamentale. In questo caso, se le righe del dataset hanno lo stesso valore nella colonna 'Flight', saranno assegnate allo stesso gruppo. All'interno di questi gruppi, la funzione individua altri gruppi per le righe con lo stesso valore nella colonna 'Airline'. Grazie al metodo .count(), che conta le righe, la funzione calcola il numero di righe nella colonna 'Delay' che hanno lo stesso valore nella colonna 'Airline' per ciascun gruppo 'Flight'.
Scorri per iniziare a programmare
Il compito consiste nel raggruppare i dati in base all'aeroporto di partenza del volo e successivamente al giorno della settimana. Calcolare il tempo medio per ciascun gruppo. Seguire il seguente algoritmo per gestire il compito:
- Raggruppamento dei dati:
- Estrarre le colonne
'AirportFrom','DayOfWeek'e'Time'dadata(in questo ordine); - Applicare il metodo
.groupby()alle colonne precedenti; - All'interno del metodo
.groupby(), inserire le colonne'AirportFrom'e'DayOfWeek'; l'ordine è fondamentale; - Calcolare il valore medio della colonna
'Time'.
- Estrarre le colonne
- Visualizzare le prime
10righe didata_flights.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione