Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Challenge: Suurten Tietoaineistojen Suodatus | Suurten tietoaineistojen käsittely
Suurten datamäärien käsittely Pythonilla
Osio 1. Luku 5
single

single

Challenge: Suurten Tietoaineistojen Suodatus

Pyyhkäise näyttääksesi valikon

Kuvittele, että tehtävänäsi on analysoida valtava CSV-tiedosto, joka sisältää miljoonia rivejä—liian suuri ladattavaksi muistiin kerralla. Tavoitteena on poimia vain ne rivit, joissa tietyn sarakkeen arvo ylittää annetun raja-arvon, ja tallentaa suodatetut tulokset uuteen tiedostoon. Tämä tilanne on yleinen suurten tietomäärien analysoinnissa, jossa tehokas ja muistia säästävä käsittely on olennaista.

Tehtävä

Pyyhkäise aloittaaksesi koodauksen

Toteuta funktio, joka käsittelee suuren CSV-tiedoston osissa ja kirjoittaa uuteen tiedostoon vain ne rivit, joissa määritetyn sarakkeen arvo on suurempi kuin annettu kynnysarvo.

  • Lue syöte-CSV-tiedosto osissa, joiden koko on chunk_size.
  • Suodata jokaisesta osasta rivit, joissa sarakkeen column arvo on suurempi kuin threshold.
  • Kirjoita kaikki suodatetut rivit ulostulo-CSV-tiedostoon, mukaan lukien otsikkorivi.
  • Jos yksikään rivi ei täytä ehtoa, kirjoita ulostulotiedostoon vain otsikkorivi.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 5
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

some-alt