Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Filtrering av Store Datasett | Arbeide med store datasett
Håndtering av Store Data med Python
Seksjon 1. Kapittel 5
single

single

Utfordring: Filtrering av Store Datasett

Sveip for å vise menyen

Tenk deg at du har fått i oppgave å analysere en enorm CSV-fil med millioner av poster—altfor stor til å lastes inn i minnet samtidig. Målet ditt er å hente ut kun de radene der verdien i en bestemt kolonne overstiger en gitt terskel, og lagre de filtrerte resultatene i en ny fil. Dette scenariet er vanlig innen storskala dataanalyse, hvor effektiv og minnevennlig behandling er avgjørende.

Oppgave

Sveip for å begynne å kode

Implementer en funksjon som behandler en stor CSV-fil i deler og skriver kun de radene hvor verdien i den angitte kolonnen er større enn den gitte terskelen til en ny fil.

  • Les inn CSV-filen i deler av størrelse chunk_size.
  • For hver del, filtrer rader der kolonnen angitt av column er større enn threshold.
  • Skriv alle filtrerte rader til utdata-CSV-filen, inkludert overskriftsraden.
  • Hvis ingen rader oppfyller betingelsen, skriv kun overskriften til utdatafilen.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 5
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

some-alt