Perustoiminnot Datan Käsittelyssä Polarsilla
Pyyhkäise näyttääksesi valikon
Kun työskentelet suurten tietoaineistojen kanssa, tehokas datan käsittely on olennaista. polars-kirjasto on suunniteltu suorituskykyisiin tietotoimintoihin, minkä vuoksi se on suosittu valinta suurten tietomäärien käsittelyyn Pythonissa. Tässä luvussa opit, kuinka data ladataan, valitaan tietyt sarakkeet ja suodatetaan rivejä käyttäen polars-kirjastoa. Nämä perustoiminnot muodostavat pohjan monimutkaisemmille datamuunnoksille.
Alla oleva taulukko tiivistää tärkeimmät polars-kirjaston funktiot näiden perustoimintojen suorittamiseen.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
Tässä koodissa tuodaan käyttöön polars-kirjasto ja käytetään pl.read_csv()-funktiota tiedoston "data/people.csv" lataamiseen. Tuloksena syntyvä DataFrame tallennetaan muuttujaan df. Kutsumalla df.head() voidaan tarkastella DataFramen viittä ensimmäistä riviä, mikä on hyödyllistä datan nopeaan tarkistamiseen latauksen jälkeen.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Tässä käytetään select()-metodia valitsemaan vain "name"- ja "age"-sarakkeet DataFramesta. Tämä luo uuden selected-nimisen DataFramen, joka sisältää ainoastaan nämä sarakkeet. Sarakkeiden valitseminen on yleinen toimenpide, kun halutaan keskittyä tietyn datan osiin jatkoanalyysiä varten.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme