Grundläggande Dataoperationer i Polars
Svep för att visa menyn
När du arbetar med stora datamängder är effektiv datamanipulation avgörande. Biblioteket polars är utformat för högpresterande dataoperationer och är därför ett populärt val för att hantera stora datamängder i Python. I detta kapitel lär du dig hur du läser in data, väljer specifika kolumner och filtrerar rader med hjälp av polars. Dessa grundläggande åtgärder utgör grunden för mer avancerade datatransformationer.
Tabellen nedan sammanfattar de viktigaste funktionerna i polars för att utföra dessa grundläggande operationer.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
I denna kod importeras biblioteket polars och funktionen pl.read_csv() används för att läsa in data från filen "data/people.csv". Den resulterande DataFrame lagras i variabeln df. Genom att anropa df.head() visas de fem första raderna i DataFrame, vilket är användbart för att snabbt granska datan efter inläsning.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Här används metoden select() för att välja endast kolumnerna "name" och "age" från DataFrame. Detta skapar en ny DataFrame kallad selected som innehåller just dessa kolumner. Att välja kolumner är en vanlig operation när du vill fokusera på specifika delar av din data för vidare analys.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal