Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Archivos CSV | Lectura de Archivos en Pandas
Introducción a Pandas

bookArchivos CSV

Dado que pandas es la biblioteca principal para el análisis y manipulación de datos, una de sus características clave es su capacidad para leer y escribir varios tipos de archivos, incluidos los archivos CSV.

Un archivo CSV (Comma-Separated Values) es un archivo de texto plano utilizado para almacenar datos tabulares, donde cada fila representa un registro y las columnas están separadas por comas.

Un archivo CSV puede contener los siguientes datos:

  • Números: valores enteros o decimales (por ejemplo, 42, 3.14);
  • Texto: cadenas de texto o datos categóricos (por ejemplo, John, Active);
  • Fechas/Horas: marcas de tiempo (por ejemplo, 2023-12-30);
  • Booleanos: valores lógicos (True, False).

Cada fila debe tener el mismo número de columnas, y la primera fila suele contener los encabezados de columna.

Funciones como read_csv() y to_csv() son útiles para trabajar con datos CSV.

La sintaxis básica de read_csv() y los parámetros clave son los siguientes:

Aquí tienes la versión actualizada con el parámetro index_col añadido y explicado claramente:


pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
  • filepath_or_buffer: ruta al archivo CSV (cadena de texto o URL);
  • sep: delimitador (por defecto es una coma ,);
  • header: número de fila que se usará como encabezados de columna (por defecto es la primera fila);
  • names: lista de nombres de columna a utilizar;
  • usecols: subconjunto de columnas a leer;
  • index_col: columna (o lista de columnas) que se establecerá como índice del DataFrame.
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Nota

Asegúrate de que el enlace al conjunto de datos esté entre comillas.

La sintaxis básica de to_csv() y los parámetros clave son los siguientes:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: ruta del archivo u objeto donde se debe escribir el CSV;
  • sep: delimitador para separar los valores (por defecto es una coma ,);
  • columns: subconjunto de columnas a escribir (por defecto, todas las columnas);
  • header: si se deben incluir los nombres de las columnas como encabezado (por defecto es True);
  • index: si se deben escribir los índices de las filas en el archivo (por defecto es True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Tarea

Swipe to start coding

Se proporciona una URL a un archivo CSV almacenado como una cadena en la variable file_url.

  • Leer el archivo CSV desde la URL proporcionada en un DataFrame llamado wine_data.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 1
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

What does the `index_col` parameter do in `read_csv()`?

Can you explain the difference between `header` and `names` in `read_csv()`?

How can I read only specific columns from a CSV file using pandas?

close

Awesome!

Completion rate improved to 3.03

bookArchivos CSV

Desliza para mostrar el menú

Dado que pandas es la biblioteca principal para el análisis y manipulación de datos, una de sus características clave es su capacidad para leer y escribir varios tipos de archivos, incluidos los archivos CSV.

Un archivo CSV (Comma-Separated Values) es un archivo de texto plano utilizado para almacenar datos tabulares, donde cada fila representa un registro y las columnas están separadas por comas.

Un archivo CSV puede contener los siguientes datos:

  • Números: valores enteros o decimales (por ejemplo, 42, 3.14);
  • Texto: cadenas de texto o datos categóricos (por ejemplo, John, Active);
  • Fechas/Horas: marcas de tiempo (por ejemplo, 2023-12-30);
  • Booleanos: valores lógicos (True, False).

Cada fila debe tener el mismo número de columnas, y la primera fila suele contener los encabezados de columna.

Funciones como read_csv() y to_csv() son útiles para trabajar con datos CSV.

La sintaxis básica de read_csv() y los parámetros clave son los siguientes:

Aquí tienes la versión actualizada con el parámetro index_col añadido y explicado claramente:


pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)
  • filepath_or_buffer: ruta al archivo CSV (cadena de texto o URL);
  • sep: delimitador (por defecto es una coma ,);
  • header: número de fila que se usará como encabezados de columna (por defecto es la primera fila);
  • names: lista de nombres de columna a utilizar;
  • usecols: subconjunto de columnas a leer;
  • index_col: columna (o lista de columnas) que se establecerá como índice del DataFrame.
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Nota

Asegúrate de que el enlace al conjunto de datos esté entre comillas.

La sintaxis básica de to_csv() y los parámetros clave son los siguientes:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: ruta del archivo u objeto donde se debe escribir el CSV;
  • sep: delimitador para separar los valores (por defecto es una coma ,);
  • columns: subconjunto de columnas a escribir (por defecto, todas las columnas);
  • header: si se deben incluir los nombres de las columnas como encabezado (por defecto es True);
  • index: si se deben escribir los índices de las filas en el archivo (por defecto es True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Tarea

Swipe to start coding

Se proporciona una URL a un archivo CSV almacenado como una cadena en la variable file_url.

  • Leer el archivo CSV desde la URL proporcionada en un DataFrame llamado wine_data.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 2. Capítulo 1
single

single

some-alt