Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Reto | Procesamiento de Datos de Series Temporales
Procesamiento Previo de Datos

book
Reto

Tarea

Swipe to start coding

Ahora que ya sabe cómo trabajar con datos de series temporales, se enfrenta a la tarea de procesarlos:

  1. Convierta el tipo de datos de la columna de str 'Mes' a datetime.
  2. Rellenar los valores NaN utilizando el método de interpolación.
    1. Utilizar el método de la media móvil para eliminar el ruido de los datos.

Solución

import pandas as pd

# Read a dataset
dataset = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/monthly-sunspots.csv')

# Convert 'Month' column to datetime format
dataset['Month'] = pd.to_datetime(dataset['Month'], format='%Y-%m')

# Interpolate missing values
dataset['Sunspots'] = dataset['Sunspots'].interpolate(method='linear')

# Remove noise from the data
dataset['Sunspots'] = dataset['Sunspots'].rolling(window=3).mean()

# Print the transformed dataset
print(dataset)
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 4. Capítulo 6
import pandas as pd

# Read a dataset
dataset = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/9c23bf60-276c-4989-a9d7-3091716b4507/datasets/monthly-sunspots.csv')

# Convert 'Month' column to datetime format
dataset['Month'] = pd.___(dataset['Month'], format=___)

# Interpolate missing values
dataset['Sunspots'] = dataset['Sunspots'].___(method='linear')

# Remove noise from the data
dataset['Sunspots'] = dataset['Sunspots'].___(window=3).mean()

# Print the transformed dataset
print(dataset)
toggle bottom row
some-alt