Grundlæggende Dataoperationer i Polars
Stryg for at vise menuen
Når du arbejder med store datasæt, er effektiv datamanipulation afgørende. Biblioteket polars er designet til højtydende dataoperationer og er derfor et populært valg til håndtering af store datamængder i Python. I dette kapitel lærer du, hvordan du indlæser data, vælger specifikke kolonner og filtrerer rækker ved hjælp af polars. Disse grundlæggende handlinger udgør fundamentet for mere komplekse datatransformationer.
Tabellen nedenfor opsummerer de vigtigste funktioner i polars til at udføre disse grundlæggende operationer.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
I denne kode importeres polars-biblioteket, og funktionen pl.read_csv() bruges til at indlæse data fra en fil med navnet "data/people.csv". Den resulterende DataFrame gemmes i variablen df. Ved at kalde df.head() kan du se de første fem rækker af DataFrame'en, hvilket er nyttigt for hurtigt at inspicere dine data efter indlæsning.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Her bruges metoden select() til kun at vælge kolonnerne "name" og "age" fra DataFrame'en. Dette opretter en ny DataFrame kaldet selected, som kun indeholder disse kolonner. Udvælgelse af kolonner er en almindelig operation, når du ønsker at fokusere på specifikke dele af dine data til videre analyse.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat