Operaciones Básicas de Datos en Polars
Desliza para mostrar el menú
Cuando se trabaja con conjuntos de datos grandes, la manipulación eficiente de datos es fundamental. La biblioteca polars está diseñada para operaciones de datos de alto rendimiento, lo que la convierte en una opción popular para manejar grandes volúmenes de datos en Python. En este capítulo, aprenderás cómo cargar datos, seleccionar columnas específicas y filtrar filas utilizando polars. Estas acciones básicas constituyen la base para transformaciones de datos más complejas.
La siguiente tabla resume las funciones principales de polars para realizar estas operaciones básicas.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
En este código, se importa la biblioteca polars y se utiliza la función pl.read_csv() para cargar datos desde un archivo llamado "data/people.csv". El DataFrame resultante se almacena en la variable df. Al llamar a df.head(), se pueden visualizar las primeras cinco filas del DataFrame, lo cual es útil para inspeccionar rápidamente los datos después de cargarlos.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Aquí se utiliza el método select() para elegir únicamente las columnas "name" y "age" del DataFrame. Esto crea un nuevo DataFrame llamado selected que contiene solo esas columnas. La selección de columnas es una operación común cuando se desea enfocar en partes específicas de los datos para un análisis posterior.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla