Reorganización de Estructuras
Desliza para mostrar el menú
Reformatear los datos suele ser esencial para un análisis efectivo, especialmente cuando es necesario comparar valores entre categorías o preparar los datos para su visualización. En Polars, se pueden utilizar las operaciones de pivot y melt (despivotar) para transformar un DataFrame entre formatos ancho y largo. Supón que tienes un DataFrame llamado games_df con las columnas: game_title, developer y steam_deck_status. Se desea ver cuántos juegos tiene cada desarrollador en cada categoría de compatibilidad de Steam Deck.
Para lograr esto, se puede pivotar la información de modo que cada fila represente un developer, cada columna represente un steam_deck_status único y los valores de las celdas muestren el conteo de juegos. Posteriormente, puede ser útil despivotar (melt) la tabla ancha de nuevo a un formato largo para procesamiento o visualización adicional.
123456789101112131415161718192021222324252627import polars as pl # Sample data games_df = pl.DataFrame({ "game_title": ["Game A", "Game B", "Game C", "Game D", "Game E", "Game F"], "developer": ["Dev1", "Dev2", "Dev1", "Dev2", "Dev3", "Dev1"], "steam_deck_status": ["Verified", "Playable", "Playable", "Verified", "Unsupported", "Playable"] }) # Pivot: count games per developer by steam_deck_status pivoted = games_df.pivot( values="game_title", index="developer", columns="steam_deck_status", aggregate_function="count" ) print("Pivoted (wide format):") print(pivoted) # Unpivot (melt): go back to long format melted = pivoted.melt( id_vars="developer", variable_name="steam_deck_status", value_name="game_count" ) print("\nUnpivoted (long format):") print(melted)
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla