Tratamento de Valores Nulos
Deslize para mostrar o menu
Ao trabalhar com dados do mundo real, é comum encontrar valores ausentes ou nulos. No Polars, esses valores são representados como null em vez de NaN ou outros marcadores. O tratamento de valores ausentes é fundamental para manter a integridade da análise.
Suponha que você tenha um DataFrame com uma coluna steam_deck_status, mas algumas entradas estejam ausentes. É possível lidar com esses valores ausentes de duas maneiras principais: preenchendo-os com um valor padrão ou removendo completamente as linhas.
Para preencher valores ausentes na coluna steam_deck_status com a string "Unknown", utilize o método fill_null:
123456789101112import polars as pl df = pl.DataFrame({ "game": ["Portal", "Half-Life", "Aperture Desk Job", "Counter-Strike"], "steam_deck_status": ["Verified", None, "Playable", None] }) # Fill nulls with "Unknown" df_filled = df.with_columns( pl.col("steam_deck_status").fill_null("Unknown") ) print(df_filled)
Se preferir remover todas as linhas em que steam_deck_status está ausente, utilize o método drop_nulls. Isso retornará um DataFrame contendo apenas as linhas em que todas as colunas (ou uma coluna especificada) não são nulas:
123# Drop rows where steam_deck_status is null df_no_nulls = df.drop_nulls("steam_deck_status") print(df_no_nulls)
Polars foi projetado para lidar com dados ausentes de forma eficiente e explícita. Diferente de algumas bibliotecas que tratam valores ausentes como um valor especial de ponto flutuante (NaN), Polars utiliza null como um sinal claro de ausência, independentemente do tipo de dado. Essa abordagem evita ambiguidades e garante que os dados ausentes sejam tratados de maneira consistente entre as colunas, seja com strings, números ou datas.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo