Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Filtrering av Stora Datamängder | Working with Large Datasets
Hantering av Stora Datamängder med Python
Avsnitt 1. Kapitel 5
single

single

Utmaning: Filtrering av Stora Datamängder

Svep för att visa menyn

Föreställ dig att du har i uppgift att analysera en massiv CSV-fil med miljontals poster—för stor för att kunna laddas in i minnet på en gång. Målet är att extrahera endast de rader där värdet i en specifik kolumn överstiger en given tröskel och spara de filtrerade resultaten till en ny fil. Detta scenario är vanligt inom storskalig dataanalys, där effektiv och minnessnål bearbetning är avgörande.

Uppgift

Svep för att börja koda

Implementera en funktion som bearbetar en stor CSV-fil i delar och skriver endast de rader där det angivna kolumnvärdet är större än det givna tröskelvärdet till en ny fil.

  • Läs inmatnings-CSV-filen i delar av storleken chunk_size.
  • För varje del, filtrera rader där kolumnen som anges av column är större än threshold.
  • Skriv alla filtrerade rader till utdata-CSV-filen, inklusive rubrikraden.
  • Om inga rader uppfyller villkoret, skriv endast rubriken till utdatafilen.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 5
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

some-alt