Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Tipos de Datos | Introducción Breve
Procesamiento Previo de Datos

book
Tipos de Datos

La principal herramienta que utilizaremos para manipular los datos es pandas. Podemos empezar inmediatamente cargando los datos:

import pandas as pd

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv')

print(df.head())
12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.head())
copy

Como comprenderá, cada conjunto de datos puede contener muchos tipos de datos diferentes, por ejemplo, numéricos (enteros, números de coma flotante), cadenas (str) y datetime. Para saber qué tipo de datos tiene una columna, puedes llamar a la propiedad .dtypes:

import pandas as pd

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv')

print(df.dtypes)
12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv') print(df.dtypes)
copy

Supongamos que tienes una columna con valores numéricos pero en formato cadena y quieres cambiar el tipo de datos a numérico. Para ello, utilice el método .astype():

python
df['columna'] = df['columna'].astype(float)
Tarea

Swipe to start coding

Lee el conjunto de datos penguins.csv y cambia el tipo de datos de la columna body_mass_g de float a int.

No modifiques el código inicial, sólo sustituye los huecos ___ por el código correcto.

Una vez que hayas completado esta tarea, haz clic en el debajo del código para comprobar tu solución.

Solución

import pandas as pd

# Read dataset
df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv')

# Change column type to int
df['body_mass_g'] = df['body_mass_g'].fillna(0).astype(int)
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 1
import pandas as pd

# Read dataset
df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/penguins.csv')

# Change column type to int
df['body_mass_g'] = df['body_mass_g'].fillna(0).___(___)
toggle bottom row
some-alt