single
Sfida: Filtrare Grandi Set di Dati
Scorri per mostrare il menu
Immagina di dover analizzare un file CSV di grandi dimensioni contenente milioni di record—troppo grande per essere caricato interamente in memoria. L'obiettivo è estrarre solo le righe in cui il valore di una colonna specifica supera una determinata soglia, salvando i risultati filtrati in un nuovo file. Questo scenario è comune nell'analisi di dati su larga scala, dove è fondamentale un'elaborazione efficiente e che utilizzi poca memoria.
Scorri per iniziare a programmare
Implementare una funzione che elabori un file CSV di grandi dimensioni a blocchi e scriva in un nuovo file solo le righe in cui il valore della colonna specificata è superiore alla soglia indicata.
- Leggere il file CSV di input a blocchi di dimensione
chunk_size. - Per ogni blocco, filtrare le righe in cui la colonna specificata da
columnè maggiore dithreshold. - Scrivere tutte le righe filtrate nel file CSV di output, includendo la riga di intestazione.
- Se nessuna riga soddisfa la condizione, scrivere solo l'intestazione nel file di output.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione