Contenido del Curso
Análisis de Series Temporales
Análisis de Series Temporales
Serie Temporal Simple
El papel de la visualización en el análisis de series temporales ya le ha quedado demostrado en la sección anterior. Un vistazo experto al gráfico puede bastar para comprender si los datos son estacionarios o no, qué patrones principales hay en ellos, etc.
A pesar de ello, es importante recordar que la valoración de un experto no es exacta, por lo que seguimos recomendando utilizar métodos formales (pruebas) para analizar sus datos.
Ya sabe cómo implementar la visualización 2D:
``python import matplotlib.pyplot as plt
fig, ax = plt.subplots(figsize=(11, 9)) ax.plot(dataset["Fecha"], dataset["NO2"]) ax.set_xlabel("Fecha") ax.set_ylabel("NO2") plt.show()
Pero tomemos como ejemplo una situación en la que necesitamos tener en cuenta 2 o 3 variables que cambian con el tiempo. Por ejemplo, usted tiene una tienda en línea y una tarea de fijación de precios para la que utiliza datos de precios de la competencia. Tienes en cuenta a tus 2 principales competidores. Vea cómo puede poner varias series temporales en un gráfico a la vez:
Cómo se ven los datos en el conjunto de datos: ``python dataset.head() ```
También puedes implementarlo de la siguiente manera a través de un bucle:
``python date = pd.to_datetime(dataset.index)
for i in dataset.columns plt.plot(date, dataset[i])
plt.show() ```
Si tiene una gran cantidad de datos (por ejemplo, quiere explorar más de 20 competidores), puede tener problemas con el análisis del gráfico resultante:
A continuación, puede utilizar la biblioteca seaborn
, que permite comparar varios gráficos entre sí:
import seaborn as sns sns.set_theme(style="dark") flights = sns.load_dataset("flights") g = sns.relplot( data=flights, x="month", y="passengers", col="year", hue="year", kind="line", palette="crest", linewidth=4, zorder=5, col_wrap=3, height=2, aspect=1.5, legend=False, ) for year, ax in g.axes_dict.items(): ax.text(.8, .85, year, transform=ax.transAxes, fontweight="bold") sns.lineplot( data=flights, x="month", y="passengers", units="year", estimator=None, color=".7", linewidth=1, ax=ax, ) ax.set_xticks(ax.get_xticks()[::2]) g.set_axis_labels("", "Passengers") g.tight_layout()
Tarea
Traza el conjunto de datos flights.csv
, que contiene datos de vuelos de 1949 a 1960, cada mes.
- Guarde los nombres de los meses en la variable
all_months
. Los nombres de los meses son nombres de columnasdf
. - Iterar sobre cada año disponible en los datos. Los años son índices del marco de datos
df
.
- Iterar sobre cada año disponible en los datos. Los años son índices del marco de datos
- Dentro del bucle, filtre los datos de los años iterados (utilizando la propiedad
.iloc[]
y la variablen
) y guárdelos en la variableyear_row
. - Dentro del bucle, inicialice un gráfico de líneas con las etiquetas de los meses (
all_months
) en el eje x, los datos respectivos (year_row
) en el eje y, y establezca el parámetrolabel
comoyear
iterado. - Muestra la leyenda del gráfico.
¡Gracias por tus comentarios!
Serie Temporal Simple
El papel de la visualización en el análisis de series temporales ya le ha quedado demostrado en la sección anterior. Un vistazo experto al gráfico puede bastar para comprender si los datos son estacionarios o no, qué patrones principales hay en ellos, etc.
A pesar de ello, es importante recordar que la valoración de un experto no es exacta, por lo que seguimos recomendando utilizar métodos formales (pruebas) para analizar sus datos.
Ya sabe cómo implementar la visualización 2D:
``python import matplotlib.pyplot as plt
fig, ax = plt.subplots(figsize=(11, 9)) ax.plot(dataset["Fecha"], dataset["NO2"]) ax.set_xlabel("Fecha") ax.set_ylabel("NO2") plt.show()
Pero tomemos como ejemplo una situación en la que necesitamos tener en cuenta 2 o 3 variables que cambian con el tiempo. Por ejemplo, usted tiene una tienda en línea y una tarea de fijación de precios para la que utiliza datos de precios de la competencia. Tienes en cuenta a tus 2 principales competidores. Vea cómo puede poner varias series temporales en un gráfico a la vez:
Cómo se ven los datos en el conjunto de datos: ``python dataset.head() ```
También puedes implementarlo de la siguiente manera a través de un bucle:
``python date = pd.to_datetime(dataset.index)
for i in dataset.columns plt.plot(date, dataset[i])
plt.show() ```
Si tiene una gran cantidad de datos (por ejemplo, quiere explorar más de 20 competidores), puede tener problemas con el análisis del gráfico resultante:
A continuación, puede utilizar la biblioteca seaborn
, que permite comparar varios gráficos entre sí:
import seaborn as sns sns.set_theme(style="dark") flights = sns.load_dataset("flights") g = sns.relplot( data=flights, x="month", y="passengers", col="year", hue="year", kind="line", palette="crest", linewidth=4, zorder=5, col_wrap=3, height=2, aspect=1.5, legend=False, ) for year, ax in g.axes_dict.items(): ax.text(.8, .85, year, transform=ax.transAxes, fontweight="bold") sns.lineplot( data=flights, x="month", y="passengers", units="year", estimator=None, color=".7", linewidth=1, ax=ax, ) ax.set_xticks(ax.get_xticks()[::2]) g.set_axis_labels("", "Passengers") g.tight_layout()
Tarea
Traza el conjunto de datos flights.csv
, que contiene datos de vuelos de 1949 a 1960, cada mes.
- Guarde los nombres de los meses en la variable
all_months
. Los nombres de los meses son nombres de columnasdf
. - Iterar sobre cada año disponible en los datos. Los años son índices del marco de datos
df
.
- Iterar sobre cada año disponible en los datos. Los años son índices del marco de datos
- Dentro del bucle, filtre los datos de los años iterados (utilizando la propiedad
.iloc[]
y la variablen
) y guárdelos en la variableyear_row
. - Dentro del bucle, inicialice un gráfico de líneas con las etiquetas de los meses (
all_months
) en el eje x, los datos respectivos (year_row
) en el eje y, y establezca el parámetrolabel
comoyear
iterado. - Muestra la leyenda del gráfico.
¡Gracias por tus comentarios!
Serie Temporal Simple
El papel de la visualización en el análisis de series temporales ya le ha quedado demostrado en la sección anterior. Un vistazo experto al gráfico puede bastar para comprender si los datos son estacionarios o no, qué patrones principales hay en ellos, etc.
A pesar de ello, es importante recordar que la valoración de un experto no es exacta, por lo que seguimos recomendando utilizar métodos formales (pruebas) para analizar sus datos.
Ya sabe cómo implementar la visualización 2D:
``python import matplotlib.pyplot as plt
fig, ax = plt.subplots(figsize=(11, 9)) ax.plot(dataset["Fecha"], dataset["NO2"]) ax.set_xlabel("Fecha") ax.set_ylabel("NO2") plt.show()
Pero tomemos como ejemplo una situación en la que necesitamos tener en cuenta 2 o 3 variables que cambian con el tiempo. Por ejemplo, usted tiene una tienda en línea y una tarea de fijación de precios para la que utiliza datos de precios de la competencia. Tienes en cuenta a tus 2 principales competidores. Vea cómo puede poner varias series temporales en un gráfico a la vez:
Cómo se ven los datos en el conjunto de datos: ``python dataset.head() ```
También puedes implementarlo de la siguiente manera a través de un bucle:
``python date = pd.to_datetime(dataset.index)
for i in dataset.columns plt.plot(date, dataset[i])
plt.show() ```
Si tiene una gran cantidad de datos (por ejemplo, quiere explorar más de 20 competidores), puede tener problemas con el análisis del gráfico resultante:
A continuación, puede utilizar la biblioteca seaborn
, que permite comparar varios gráficos entre sí:
import seaborn as sns sns.set_theme(style="dark") flights = sns.load_dataset("flights") g = sns.relplot( data=flights, x="month", y="passengers", col="year", hue="year", kind="line", palette="crest", linewidth=4, zorder=5, col_wrap=3, height=2, aspect=1.5, legend=False, ) for year, ax in g.axes_dict.items(): ax.text(.8, .85, year, transform=ax.transAxes, fontweight="bold") sns.lineplot( data=flights, x="month", y="passengers", units="year", estimator=None, color=".7", linewidth=1, ax=ax, ) ax.set_xticks(ax.get_xticks()[::2]) g.set_axis_labels("", "Passengers") g.tight_layout()
Tarea
Traza el conjunto de datos flights.csv
, que contiene datos de vuelos de 1949 a 1960, cada mes.
- Guarde los nombres de los meses en la variable
all_months
. Los nombres de los meses son nombres de columnasdf
. - Iterar sobre cada año disponible en los datos. Los años son índices del marco de datos
df
.
- Iterar sobre cada año disponible en los datos. Los años son índices del marco de datos
- Dentro del bucle, filtre los datos de los años iterados (utilizando la propiedad
.iloc[]
y la variablen
) y guárdelos en la variableyear_row
. - Dentro del bucle, inicialice un gráfico de líneas con las etiquetas de los meses (
all_months
) en el eje x, los datos respectivos (year_row
) en el eje y, y establezca el parámetrolabel
comoyear
iterado. - Muestra la leyenda del gráfico.
¡Gracias por tus comentarios!
El papel de la visualización en el análisis de series temporales ya le ha quedado demostrado en la sección anterior. Un vistazo experto al gráfico puede bastar para comprender si los datos son estacionarios o no, qué patrones principales hay en ellos, etc.
A pesar de ello, es importante recordar que la valoración de un experto no es exacta, por lo que seguimos recomendando utilizar métodos formales (pruebas) para analizar sus datos.
Ya sabe cómo implementar la visualización 2D:
``python import matplotlib.pyplot as plt
fig, ax = plt.subplots(figsize=(11, 9)) ax.plot(dataset["Fecha"], dataset["NO2"]) ax.set_xlabel("Fecha") ax.set_ylabel("NO2") plt.show()
Pero tomemos como ejemplo una situación en la que necesitamos tener en cuenta 2 o 3 variables que cambian con el tiempo. Por ejemplo, usted tiene una tienda en línea y una tarea de fijación de precios para la que utiliza datos de precios de la competencia. Tienes en cuenta a tus 2 principales competidores. Vea cómo puede poner varias series temporales en un gráfico a la vez:
Cómo se ven los datos en el conjunto de datos: ``python dataset.head() ```
También puedes implementarlo de la siguiente manera a través de un bucle:
``python date = pd.to_datetime(dataset.index)
for i in dataset.columns plt.plot(date, dataset[i])
plt.show() ```
Si tiene una gran cantidad de datos (por ejemplo, quiere explorar más de 20 competidores), puede tener problemas con el análisis del gráfico resultante:
A continuación, puede utilizar la biblioteca seaborn
, que permite comparar varios gráficos entre sí:
import seaborn as sns sns.set_theme(style="dark") flights = sns.load_dataset("flights") g = sns.relplot( data=flights, x="month", y="passengers", col="year", hue="year", kind="line", palette="crest", linewidth=4, zorder=5, col_wrap=3, height=2, aspect=1.5, legend=False, ) for year, ax in g.axes_dict.items(): ax.text(.8, .85, year, transform=ax.transAxes, fontweight="bold") sns.lineplot( data=flights, x="month", y="passengers", units="year", estimator=None, color=".7", linewidth=1, ax=ax, ) ax.set_xticks(ax.get_xticks()[::2]) g.set_axis_labels("", "Passengers") g.tight_layout()
Tarea
Traza el conjunto de datos flights.csv
, que contiene datos de vuelos de 1949 a 1960, cada mes.
- Guarde los nombres de los meses en la variable
all_months
. Los nombres de los meses son nombres de columnasdf
. - Iterar sobre cada año disponible en los datos. Los años son índices del marco de datos
df
.
- Iterar sobre cada año disponible en los datos. Los años son índices del marco de datos
- Dentro del bucle, filtre los datos de los años iterados (utilizando la propiedad
.iloc[]
y la variablen
) y guárdelos en la variableyear_row
. - Dentro del bucle, inicialice un gráfico de líneas con las etiquetas de los meses (
all_months
) en el eje x, los datos respectivos (year_row
) en el eje y, y establezca el parámetrolabel
comoyear
iterado. - Muestra la leyenda del gráfico.