Contenido del Curso
Primeros Pasos con Pandas
Primeros Pasos con Pandas
Archivos CSV
Dado que pandas
es la biblioteca de referencia para el análisis y manipulación de datos, una de sus características clave es su capacidad para leer y escribir varios tipos de archivos, incluidos los archivos CSV.
Un archivo CSV (Valores Separados por Comas) es un archivo de texto plano utilizado para almacenar datos tabulares, donde cada fila representa un registro y las columnas están separadas por comas.
Un archivo CSV puede contener los siguientes datos:
- Números: valores enteros o decimales (por ejemplo,
42
,3.14
); - Texto: cadenas o datos categóricos (por ejemplo,
John
,Active
); - Fechas/Tiempos: marcas de tiempo (por ejemplo,
2023-12-30
); - Booleanos: valores lógicos (
True
,False
).
Cada fila debe tener el mismo número de columnas, y la primera fila a menudo contiene encabezados de columna.
Funciones como read_csv()
y to_csv()
son útiles para manejar datos CSV.
La sintaxis básica de read_csv()
y los parámetros clave son los siguientes:
filepath_or_buffer
: ruta al archivo CSV (cadena o URL);sep
: delimitador (por defecto es una coma,
);header
: número de fila a usar como encabezados de columna (por defecto es la primera fila);names
: Lista de nombres de columna a usar;usecols
: columnas a leer (subconjunto de columnas).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Nota
Asegúrate de que el enlace del conjunto de datos esté entre comillas.
La sintaxis básica de to_csv()
y los parámetros clave son los siguientes:
path_or_buf
: ruta del archivo u objeto donde se debe escribir el CSV;sep
: delimitador para separar valores (por defecto es una coma,
);columns
: subconjunto de columnas a escribir (por defecto son todas las columnas);header
: si se deben incluir los nombres de las columnas como encabezado (por defecto esTrue
);index
: si se deben escribir los índices de las filas en el archivo (por defecto esTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Lee el archivo CSV en un DataFrame.
- Muestra el contenido en tu pantalla.
Solución
¡Gracias por tus comentarios!
Archivos CSV
Dado que pandas
es la biblioteca de referencia para el análisis y manipulación de datos, una de sus características clave es su capacidad para leer y escribir varios tipos de archivos, incluidos los archivos CSV.
Un archivo CSV (Valores Separados por Comas) es un archivo de texto plano utilizado para almacenar datos tabulares, donde cada fila representa un registro y las columnas están separadas por comas.
Un archivo CSV puede contener los siguientes datos:
- Números: valores enteros o decimales (por ejemplo,
42
,3.14
); - Texto: cadenas o datos categóricos (por ejemplo,
John
,Active
); - Fechas/Tiempos: marcas de tiempo (por ejemplo,
2023-12-30
); - Booleanos: valores lógicos (
True
,False
).
Cada fila debe tener el mismo número de columnas, y la primera fila a menudo contiene encabezados de columna.
Funciones como read_csv()
y to_csv()
son útiles para manejar datos CSV.
La sintaxis básica de read_csv()
y los parámetros clave son los siguientes:
filepath_or_buffer
: ruta al archivo CSV (cadena o URL);sep
: delimitador (por defecto es una coma,
);header
: número de fila a usar como encabezados de columna (por defecto es la primera fila);names
: Lista de nombres de columna a usar;usecols
: columnas a leer (subconjunto de columnas).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Nota
Asegúrate de que el enlace del conjunto de datos esté entre comillas.
La sintaxis básica de to_csv()
y los parámetros clave son los siguientes:
path_or_buf
: ruta del archivo u objeto donde se debe escribir el CSV;sep
: delimitador para separar valores (por defecto es una coma,
);columns
: subconjunto de columnas a escribir (por defecto son todas las columnas);header
: si se deben incluir los nombres de las columnas como encabezado (por defecto esTrue
);index
: si se deben escribir los índices de las filas en el archivo (por defecto esTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Lee el archivo CSV en un DataFrame.
- Muestra el contenido en tu pantalla.
Solución
¡Gracias por tus comentarios!