Grunnleggende Dataoperasjoner i Polars
Sveip for å vise menyen
Når du arbeider med store datasett, er effektiv datamanipulering avgjørende. Biblioteket polars er utviklet for høyytelses dataoperasjoner, noe som gjør det til et populært valg for håndtering av store datamengder i Python. I dette kapittelet lærer du hvordan du laster inn data, velger spesifikke kolonner og filtrerer rader ved hjelp av polars. Disse grunnleggende handlingene danner grunnlaget for mer komplekse datatransformasjoner.
Tabellen nedenfor oppsummerer hovedfunksjonene i polars for å utføre disse grunnleggende operasjonene.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
I denne koden importeres polars-biblioteket, og funksjonen pl.read_csv() brukes for å laste inn data fra en fil med navnet "data/people.csv". Den resulterende DataFrame lagres i variabelen df. Ved å kalle df.head() kan du vise de fem første radene i DataFrame, noe som er nyttig for raskt å inspisere dataene etter innlasting.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Her brukes metoden select() for å velge kun kolonnene "name" og "age" fra DataFrame. Dette oppretter en ny DataFrame kalt selected som kun inneholder disse kolonnene. Å velge kolonner er en vanlig operasjon når du ønsker å fokusere på bestemte deler av dataene for videre analyse.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår