Tipos de Datos
La principal herramienta que utilizaremos para manipular los datos es pandas
. Podemos empezar inmediatamente cargando los datos:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.head())
Como comprenderá, cada conjunto de datos puede contener muchos tipos de datos diferentes, por ejemplo, numéricos (enteros, números de coma flotante), cadenas (str) y datetime. Para saber qué tipo de datos tiene una columna, puedes llamar a la propiedad .dtypes
:
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.dtypes)
Supongamos que tienes una columna con valores numéricos pero en formato cadena y quieres cambiar el tipo de datos a numérico. Para ello, utilice el método .astype()
:
pythondf['columna'] = df['columna'].astype(float)
Swipe to start coding
Lee el conjunto de datos penguins.csv
y cambia el tipo de datos de la columna body_mass_g
de float
a int
.
No modifiques el código inicial, sólo sustituye los huecos ___
por el código correcto.
Una vez que hayas completado esta tarea, haz clic en el debajo del código para comprobar tu solución.
Solución
¡Gracias por tus comentarios!