Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Omgaan met Null-waarden | Strings, Datums, Ontbrekende Data
Data Wrangling met Polars

Omgaan met Null-waarden

Veeg om het menu te tonen

Bij het werken met echte data kom je vaak ontbrekende of null-waarden tegen. In Polars worden deze weergegeven als null in plaats van NaN of andere aanduidingen. Het omgaan met ontbrekende waarden is essentieel voor het behouden van de integriteit van je analyse.

Stel dat je een DataFrame hebt met een kolom steam_deck_status, maar sommige waarden ontbreken. Je kunt deze ontbrekende waarden op twee hoofdmanieren aanpakken: ze opvullen met een standaardwaarde of de rijen volledig verwijderen.

Om ontbrekende waarden in de kolom steam_deck_status op te vullen met de string "Unknown", gebruik je de methode fill_null:

123456789101112
import polars as pl df = pl.DataFrame({ "game": ["Portal", "Half-Life", "Aperture Desk Job", "Counter-Strike"], "steam_deck_status": ["Verified", None, "Playable", None] }) # Fill nulls with "Unknown" df_filled = df.with_columns( pl.col("steam_deck_status").fill_null("Unknown") ) print(df_filled)

Als je liever alle rijen verwijdert waar steam_deck_status ontbreekt, gebruik dan de methode drop_nulls. Dit retourneert een DataFrame met alleen de rijen waarin alle kolommen (of een opgegeven kolom) niet null zijn:

123
# Drop rows where steam_deck_status is null df_no_nulls = df.drop_nulls("steam_deck_status") print(df_no_nulls)

Polars is ontworpen om ontbrekende gegevens efficiënt en expliciet te verwerken. In tegenstelling tot sommige bibliotheken die ontbrekende waarden behandelen als een speciale drijvende-kommawaarde (NaN), gebruikt Polars null als een duidelijke aanduiding van ontbrekende gegevens, ongeacht het gegevenstype. Deze aanpak voorkomt dubbelzinnigheid en zorgt ervoor dat ontbrekende gegevens consequent worden verwerkt over kolommen heen, of ze nu strings, getallen of datums bevatten.

question mark

Welke methode zou je gebruiken om ontbrekende waarden in de kolom steam_deck_status te vervangen door "Unknown"?

Selecteer het correcte antwoord

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 5

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 3. Hoofdstuk 5
some-alt