Restructuration des mises en page
Glissez pour afficher le menu
La restructuration de vos données est souvent essentielle pour une analyse efficace, en particulier lorsque vous devez comparer des valeurs entre différentes catégories ou préparer vos données pour la visualisation. Avec Polars, il est possible d'utiliser les opérations pivot et melt (dé-pivotage) pour transformer un DataFrame entre les formats large et long. Supposons que vous disposez d'un DataFrame nommé games_df avec les colonnes : game_title, developer et steam_deck_status. Vous souhaitez savoir combien de jeux chaque développeur possède dans chaque catégorie de compatibilité Steam Deck.
Pour cela, vous pouvez effectuer un pivot des données afin que chaque ligne représente un developer, chaque colonne une valeur unique de steam_deck_status, et que les cellules affichent le nombre de jeux. Par la suite, il peut être utile de dé-pivoter (melt) la table large pour revenir à un format long, en vue d'un traitement ou d'une visualisation supplémentaire.
123456789101112131415161718192021222324252627import polars as pl # Sample data games_df = pl.DataFrame({ "game_title": ["Game A", "Game B", "Game C", "Game D", "Game E", "Game F"], "developer": ["Dev1", "Dev2", "Dev1", "Dev2", "Dev3", "Dev1"], "steam_deck_status": ["Verified", "Playable", "Playable", "Verified", "Unsupported", "Playable"] }) # Pivot: count games per developer by steam_deck_status pivoted = games_df.pivot( values="game_title", index="developer", columns="steam_deck_status", aggregate_function="count" ) print("Pivoted (wide format):") print(pivoted) # Unpivot (melt): go back to long format melted = pivoted.melt( id_vars="developer", variable_name="steam_deck_status", value_name="game_count" ) print("\nUnpivoted (long format):") print(melted)
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion