Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Raggruppamento per più colonne | Aggregazione dei dati
Data Wrangling con Pandas
Sezione 4. Capitolo 2
single

single

bookRaggruppamento per più colonne

Scorri per mostrare il menu

Aggiunta di informazioni sul metodo .groupby(). Possibilità di raggruppare per più colonne, con importanza dell'ordine. Nel capitolo precedente, raggruppamento dei dati per numero di volo e conteggio dei ritardi. Complicazione del compito raggruppando non solo per la colonna 'Flight', ma anche per la colonna 'Airline'. Revisione delle informazioni sul dataset e osservazione di questo semplice esempio (l'output mostra solo le prime 10 righe):

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay', 'Airline']].groupby(['Flight', 'Airline']).count() print(data_flights.head(10))
copy

Spiegazione:

data[['Flight', 'Delay', 'Airline']].groupby(['Flight', 'Airline']).count()
  • data[['Flight', 'Delay', 'Airline']] - colonne utilizzate, incluse quelle per il raggruppamento;
  • .groupby(['Flight', 'Airline']) - 'Flight' e 'Airline' sono argomenti della funzione .groupby().

Attenzione: per raggruppare per più colonne, inserirle in una lista; l'ordine è fondamentale. In questo caso, se le righe del dataset hanno lo stesso valore nella colonna 'Flight', saranno assegnate allo stesso gruppo. All'interno di questi gruppi, la funzione individua altri gruppi per le righe con lo stesso valore nella colonna 'Airline'. Grazie al metodo .count(), che conta le righe, la funzione calcola il numero di righe nella colonna 'Delay' che hanno lo stesso valore nella colonna 'Airline' per ciascun gruppo 'Flight'.

Compito

Scorri per iniziare a programmare

Il compito consiste nel raggruppare i dati in base all'aeroporto di partenza del volo e successivamente al giorno della settimana. Calcolare il tempo medio per ciascun gruppo. Seguire il seguente algoritmo per gestire il compito:

  1. Raggruppamento dei dati:
    • Estrarre le colonne 'AirportFrom', 'DayOfWeek' e 'Time' da data (in questo ordine);
    • Applicare il metodo .groupby() alle colonne precedenti;
    • All'interno del metodo .groupby(), inserire le colonne 'AirportFrom' e 'DayOfWeek'; l'ordine è fondamentale;
    • Calcolare il valore medio della colonna 'Time'.
  2. Visualizzare le prime 10 righe di data_flights.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 2
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

some-alt