Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Fusión de Datos | Combinación, agregación
Manipulación de Datos con Polars

Fusión de Datos

Desliza para mostrar el menú

La combinación de datos de múltiples fuentes es una tarea común en el procesamiento de datos, especialmente cuando se necesita enriquecer el conjunto de datos principal con información adicional. En este capítulo, aprenderás cómo unir games_df con spy_insights_df utilizando la columna app_id como clave. Polars ofrece operaciones de unión flexibles y eficientes, lo que facilita la combinación de conjuntos de datos mientras se controla cómo se gestionan las filas no coincidentes. Los dos tipos de unión más comunes que utilizarás son la unión izquierda y la unión interna.

Una unión izquierda devuelve todas las filas del DataFrame izquierdo (games_df) y añade las filas coincidentes del DataFrame derecho (spy_insights_df). Si no hay coincidencia, las columnas del lado derecho se rellenarán con valores nulos. Una unión interna devuelve solo las filas donde hay coincidencia en ambos DataFrames, descartando cualquier fila de cualquiera de los DataFrames que no tenga un app_id correspondiente en el otro.

1234567891011121314151617181920212223
import polars as pl # Sample games_df games_df = pl.DataFrame({ "app_id": [1, 2, 3, 4], "game_name": ["Space Quest", "Jungle Run", "Mystery Manor", "Puzzle Island"] }) # Sample spy_insights_df spy_insights_df = pl.DataFrame({ "app_id": [2, 3, 5], "insight": ["High engagement", "Trending", "Low installs"] }) # Left join: all rows from games_df, matched data from spy_insights_df left_joined = games_df.join(spy_insights_df, on="app_id", how="left") print("Left Join Result:") print(left_joined) # Inner join: only rows with matching app_id in both DataFrames inner_joined = games_df.join(spy_insights_df, on="app_id", how="inner") print("\nInner Join Result:") print(inner_joined)
question mark

¿Qué afirmación describe con precisión la diferencia entre una unión izquierda y una unión interna al combinar games_df y spy_insights_df en app_id?

Selecciona la respuesta correcta

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 3

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 2. Capítulo 3
some-alt