Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: Filtrare Grandi Set di Dati | Working With Large Datasets
Gestione di Grandi Dati con Python
Sezione 1. Capitolo 5
single

single

Sfida: Filtrare Grandi Set di Dati

Scorri per mostrare il menu

Immagina di dover analizzare un file CSV di grandi dimensioni contenente milioni di record—troppo grande per essere caricato interamente in memoria. L'obiettivo è estrarre solo le righe in cui il valore di una colonna specifica supera una determinata soglia, salvando i risultati filtrati in un nuovo file. Questo scenario è comune nell'analisi di dati su larga scala, dove è fondamentale un'elaborazione efficiente e che utilizzi poca memoria.

Compito

Scorri per iniziare a programmare

Implementare una funzione che elabori un file CSV di grandi dimensioni a blocchi e scriva in un nuovo file solo le righe in cui il valore della colonna specificata è superiore alla soglia indicata.

  • Leggere il file CSV di input a blocchi di dimensione chunk_size.
  • Per ogni blocco, filtrare le righe in cui la colonna specificata da column è maggiore di threshold.
  • Scrivere tutte le righe filtrate nel file CSV di output, includendo la riga di intestazione.
  • Se nessuna riga soddisfa la condizione, scrivere solo l'intestazione nel file di output.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 5
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

some-alt