single
Challenge: Filtering Large Datasets
Stryg for at vise menuen
Forestil dig, at du har til opgave at analysere en enorm CSV-fil med millioner af poster—alt for stor til at blive indlæst i hukommelsen på én gang. Målet er at udtrække kun de rækker, hvor værdien i en bestemt kolonne overstiger en given grænse, og gemme de filtrerede resultater i en ny fil. Dette scenarie er almindeligt inden for storskala dataanalyse, hvor effektiv og hukommelsesvenlig behandling er afgørende.
Swipe to start coding
Implementer en funktion, der behandler en stor CSV-fil i segmenter og kun skriver de rækker til en ny fil, hvor værdien i den angivne kolonne er større end den givne tærskelværdi.
- Læs input-CSV-filen i segmenter af størrelsen
chunk_size. - For hvert segment, filtrer rækker hvor kolonnen angivet af
columner større endthreshold. - Skriv alle filtrerede rækker til output-CSV-filen, inklusive header-rækken.
- Hvis ingen rækker opfylder betingelsen, skrives kun headeren til output-filen.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat