Manejo de Valores Nulos
Desliza para mostrar el menú
Al trabajar con datos del mundo real, a menudo se encuentran valores faltantes o nulos. En Polars, estos se representan como null en lugar de NaN u otros marcadores. El manejo de valores faltantes es esencial para mantener la integridad del análisis.
Suponga que tiene un DataFrame con una columna steam_deck_status, pero algunas entradas están ausentes. Puede abordar estos valores faltantes de dos maneras principales: rellenándolos con un valor predeterminado o eliminando completamente las filas.
Para rellenar los valores faltantes en la columna steam_deck_status con la cadena "Unknown", utilice el método fill_null:
123456789101112import polars as pl df = pl.DataFrame({ "game": ["Portal", "Half-Life", "Aperture Desk Job", "Counter-Strike"], "steam_deck_status": ["Verified", None, "Playable", None] }) # Fill nulls with "Unknown" df_filled = df.with_columns( pl.col("steam_deck_status").fill_null("Unknown") ) print(df_filled)
Si prefiere eliminar cualquier fila donde steam_deck_status esté ausente, utilice el método drop_nulls. Esto devolverá un DataFrame que contiene solo las filas donde todas las columnas (o una columna especificada) no son nulas:
123# Drop rows where steam_deck_status is null df_no_nulls = df.drop_nulls("steam_deck_status") print(df_no_nulls)
Polars está diseñado para gestionar datos faltantes de manera eficiente y explícita. A diferencia de algunas bibliotecas que tratan los valores faltantes como un valor especial de punto flotante (NaN), Polars utiliza null como una señal clara de ausencia de datos, independientemente del tipo de dato. Este enfoque evita ambigüedades y garantiza que los datos faltantes se gestionen de forma coherente en todas las columnas, ya contengan cadenas, números o fechas.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla