Lære Grundlæggende Dataoperationer i Polars | Effektiv Datamanipulation med Polars

Stryg for at vise menuen

Når du arbejder med store datasæt, er effektiv datamanipulation afgørende. Biblioteket polars er designet til højtydende dataoperationer og er derfor et populært valg til håndtering af store datamængder i Python. I dette kapitel lærer du, hvordan du indlæser data, vælger specifikke kolonner og filtrerer rækker ved hjælp af polars. Disse grundlæggende handlinger udgør fundamentet for mere komplekse datatransformationer.

Tabellen nedenfor opsummerer de vigtigste funktioner i polars til at udføre disse grundlæggende operationer.


              123456789
            
import polars as pl

url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv"

# Read data from a CSV file
df = pl.read_csv(url)

# Display the first 5 rows
print(df.head())

I denne kode importeres polars-biblioteket, og funktionen pl.read_csv() bruges til at indlæse data fra en fil med navnet "data/people.csv". Den resulterende DataFrame gemmes i variablen df. Ved at kalde df.head() kan du se de første fem rækker af DataFrame'en, hvilket er nyttigt for hurtigt at inspicere dine data efter indlæsning.


              1234567891011
            
import polars as pl

url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv"

# Read data from a CSV file
df = pl.read_csv(url)

# Select the "name" and "age" columns
selected = df.select(["Variable name"])

print(selected)

Her bruges metoden select() til kun at vælge kolonnerne "name" og "age" fra DataFrame'en. Dette opretter en ny DataFrame kaldet selected, som kun indeholder disse kolonner. Udvælgelse af kolonner er en almindelig operation, når du ønsker at fokusere på specifikke dele af dine data til videre analyse.

Var alt klart?

Tak for dine kommentarer!

Sektion 3. Kapitel 2

Spørg AI

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Sektion 3. Kapitel 2