single
Challenge: Grote Datasets Filteren
Veeg om het menu te tonen
Stel je voor dat je de taak hebt om een enorm CSV-bestand te analyseren met miljoenen records—te groot om in één keer in het geheugen te laden. Het doel is om alleen die rijen te extraheren waarbij de waarde in een specifieke kolom een bepaalde drempel overschrijdt, en de gefilterde resultaten op te slaan in een nieuw bestand. Dit scenario komt vaak voor bij grootschalige data-analyse, waar efficiënte, geheugenbesparende verwerking essentieel is.
Veeg om te beginnen met coderen
Implementeer een functie die een groot CSV-bestand in delen verwerkt en alleen de rijen schrijft naar een nieuw bestand waarbij de waarde in de opgegeven kolom groter is dan de opgegeven drempel.
- Lees het invoer-CSV-bestand in delen van grootte
chunk_size. - Filter voor elk deel de rijen waarbij de kolom gespecificeerd door
columngroter is danthreshold. - Schrijf alle gefilterde rijen naar het uitvoer-CSV-bestand, inclusief de koprij.
- Als geen enkele rij aan de voorwaarde voldoet, schrijf dan alleen de koprij naar het uitvoerbestand.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.