Basisgegevensbewerkingen in Polars
Veeg om het menu te tonen
Bij het werken met grote datasets is efficiënte gegevensmanipulatie essentieel. De polars-bibliotheek is ontworpen voor hoogwaardige gegevensbewerkingen en is daardoor een populaire keuze voor het verwerken van grote hoeveelheden data in Python. In dit hoofdstuk leer je hoe je data laadt, specifieke kolommen selecteert en rijen filtert met behulp van polars. Deze basisbewerkingen vormen de fundering voor meer complexe datatransformaties.
De onderstaande tabel geeft een overzicht van de belangrijkste functies in polars voor het uitvoeren van deze basisbewerkingen.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
In deze code importeer je de polars-bibliotheek en gebruik je de functie pl.read_csv() om gegevens te laden uit een bestand met de naam "data/people.csv". Het resulterende DataFrame wordt opgeslagen in de variabele df. Door df.head() aan te roepen, kun je de eerste vijf rijen van het DataFrame bekijken, wat handig is om snel je gegevens te inspecteren na het laden.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Hier gebruik je de methode select() om alleen de kolommen "name" en "age" uit het DataFrame te kiezen. Dit creëert een nieuw DataFrame genaamd selected dat alleen deze kolommen bevat. Het selecteren van kolommen is een veelvoorkomende bewerking wanneer je je wilt richten op specifieke delen van je gegevens voor verdere analyse.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.