single
Utmaning: Filtrering av Stora Datamängder
Svep för att visa menyn
Föreställ dig att du har i uppgift att analysera en massiv CSV-fil med miljontals poster—för stor för att kunna laddas in i minnet på en gång. Målet är att extrahera endast de rader där värdet i en specifik kolumn överstiger en given tröskel och spara de filtrerade resultaten till en ny fil. Detta scenario är vanligt inom storskalig dataanalys, där effektiv och minnessnål bearbetning är avgörande.
Svep för att börja koda
Implementera en funktion som bearbetar en stor CSV-fil i delar och skriver endast de rader där det angivna kolumnvärdet är större än det givna tröskelvärdet till en ny fil.
- Läs inmatnings-CSV-filen i delar av storleken
chunk_size. - För varje del, filtrera rader där kolumnen som anges av
columnär större änthreshold. - Skriv alla filtrerade rader till utdata-CSV-filen, inklusive rubrikraden.
- Om inga rader uppfyller villkoret, skriv endast rubriken till utdatafilen.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal