Summary  
This chapter covers handling missing values by explicitly substituting null entries with defaults or removing them, using fill_null and drop_nulls operations to control how nulls propagate in data.  

General domain of usage  
Data cleaning

This video demonstrates how to handle missing `steam_deck_status` values in a Polars DataFrame using `fill_null` and `drop_null`, and provides insight into Polars' philosophy for managing missing data efficiently.
-- video metadata (use this info when making a video) --

Cut all examples of code to a minimum. Show only the essential code. Show code no longer than 10 lines. Remove all possible pieces to demonstrate some code feature. You may show not full code that will not start, but still demonstrates some feature theoritacally.
If code is longer than 8 lines, move code output  blocks to second column.


Vid arbete med verkliga data stöter du ofta på saknade eller null-värden. I Polars representeras dessa som `null` istället för `NaN` eller andra platshållare. Hantering av saknade värden är avgörande för att upprätthålla analysens integritet.

Anta att du har en DataFrame med en kolumn `steam_deck_status`, men vissa poster saknas. Du kan hantera dessa saknade värden på två huvudsakliga sätt: fylla dem med ett standardvärde eller ta bort raderna helt.

För att fylla saknade värden i kolumnen `steam_deck_status` med strängen `"Unknown"`, använd metoden `fill_null`:

import polars as pl

df = pl.DataFrame({
    "game": ["Portal", "Half-Life", "Aperture Desk Job", "Counter-Strike"],
    "steam_deck_status": ["Verified", None, "Playable", None]
})

# Fill nulls with "Unknown"
df_filled = df.with_columns(
    pl.col("steam_deck_status").fill_null("Unknown")
)
print(df_filled)

Om du föredrar att ta bort alla rader där `steam_deck_status` saknas, använd metoden `drop_nulls`. Detta returnerar en DataFrame som endast innehåller de rader där alla kolumner (eller en angiven kolumn) inte är null:

# Drop rows where steam_deck_status is null
df_no_nulls = df.drop_nulls("steam_deck_status")
print(df_no_nulls)

Polars är utformat för att hantera saknade data effektivt och tydligt. Till skillnad från vissa bibliotek som behandlar saknade värden som ett speciellt flyttalvärde (`NaN`), använder Polars `null` som en tydlig signal för saknad data, oavsett datatyp. Detta tillvägagångssätt undviker tvetydighet och säkerställer att saknade data hanteras konsekvent över kolumner, oavsett om de innehåller **strängar**, **tal** eller **datum**.

`pl.col("steam_deck_status").fill_null("Unknown")`;

Nulls in `steam_deck_status` replaced by "Unknown";

Removes rows with nulls in specified columns;

Rows with nulls in `steam_deck_status` are gone;

Consistent and efficient missing data handling.

Vilken metod skulle du använda för att ersätta saknade värden i kolumnen `steam_deck_status` med `"Unknown"`?

En praktisk, intermediär kurs för Python-utvecklare som vill bemästra datahantering med Polars, med hjälp av verkliga Steam-speldataset. Lär dig Polars kolumnära paradigm, urval, aggregering, sammanslagning, omformning samt viktiga operationer för strängar, datum och hantering av saknade data.

Utforska de grundläggande skillnaderna mellan Polars och traditionella radbaserade DataFrames, med fokus på kolumnbaserade operationer, urval och villkorslogik med hjälp av Steam-speldatasetet.

Få en gedigen förståelse för Polars parallella group-by, aggregering, sammanslagning och omformningsmöjligheter med hjälp av Steam-spel och spioninsiktsdatamängder.

Utforska grunderna i datarensning: textnormalisering, datumtolkning och robust hantering av saknade värden i Polars.

Hantering av Null-värden