Conteúdo do Curso
Análise de Séries Temporais
Análise de Séries Temporais
Estacionaridade
Na análise de séries temporais, estacionariedade refere-se a uma característica de um processo estocástico onde as propriedades estatísticas do processo não mudam ao longo do tempo. A média, a variância e a estrutura de autocorrelação do processo permanecem constantes.
Exemplo de dados estacionários:
E dados não estacionários:
Por que essa funcionalidade é importante para nós?
Sua presença é um critério na seleção de modelos que você pode usar para prever os dados. Se os dados são estacionários, é possível usar diversos modelos (Regressão Autoregressiva, Média Móvel, Regressão Linear, etc.). Por outro lado, não existem modelos universais para prever processos não estacionários: algumas séries temporais não estacionárias podem ser convertidas em estacionárias por meio de manipulações matemáticas (modelo ARIMA); outras séries temporais não estacionárias podem ser previstas utilizando tipos especiais de redes neurais.
Vamos proceder à verificação dos dados quanto à estacionaridade. Isso pode ser feito utilizando testes estatísticos chamados "Testes de Raiz Unitária". Existem testes como:
- Teste de Dickey-Fuller Aumentado;
- Kwiatkowski-Phillips-Schmidt-Shin;
- Teste de Philips Perron.
Na maioria das vezes, utilizaremos o teste de Dickey-Fuller Aumentado (ADF), mas você pode levar em conta os resultados de outros testes.
Utilizando a biblioteca statsmodel
, vamos determinar se os dados são estacionários. Isso é feito em poucas linhas de código:
Como podemos interpretar os resultados obtidos?
A hipótese nula deste teste é que a série temporal é não-estacionária. Se o valor-p for inferior a um determinado nível (por exemplo, 0,05), podemos rejeitar a hipótese nula e concluir que a série temporal é estacionária.
Vamos observar o valor-p acima. Ele é igual a 1,0, o que significa que não podemos rejeitar a hipótese nula e nossos dados são não-estacionários. A hipótese nula seria falsa se o valor-p fosse menor que 0,05.
Tarefa
Verifique se o conjunto de dados daily-total-female-births.csv
é estacionário.
- Importe
adfuller
destatsmodels.tsa.stattools
. - Leia o arquivo
csv
. - Realize o teste de Dickey-Fuller aumentado para a coluna
"Births"
dosdados
.
Obrigado pelo seu feedback!
Estacionaridade
Na análise de séries temporais, estacionariedade refere-se a uma característica de um processo estocástico onde as propriedades estatísticas do processo não mudam ao longo do tempo. A média, a variância e a estrutura de autocorrelação do processo permanecem constantes.
Exemplo de dados estacionários:
E dados não estacionários:
Por que essa funcionalidade é importante para nós?
Sua presença é um critério na seleção de modelos que você pode usar para prever os dados. Se os dados são estacionários, é possível usar diversos modelos (Regressão Autoregressiva, Média Móvel, Regressão Linear, etc.). Por outro lado, não existem modelos universais para prever processos não estacionários: algumas séries temporais não estacionárias podem ser convertidas em estacionárias por meio de manipulações matemáticas (modelo ARIMA); outras séries temporais não estacionárias podem ser previstas utilizando tipos especiais de redes neurais.
Vamos proceder à verificação dos dados quanto à estacionaridade. Isso pode ser feito utilizando testes estatísticos chamados "Testes de Raiz Unitária". Existem testes como:
- Teste de Dickey-Fuller Aumentado;
- Kwiatkowski-Phillips-Schmidt-Shin;
- Teste de Philips Perron.
Na maioria das vezes, utilizaremos o teste de Dickey-Fuller Aumentado (ADF), mas você pode levar em conta os resultados de outros testes.
Utilizando a biblioteca statsmodel
, vamos determinar se os dados são estacionários. Isso é feito em poucas linhas de código:
Como podemos interpretar os resultados obtidos?
A hipótese nula deste teste é que a série temporal é não-estacionária. Se o valor-p for inferior a um determinado nível (por exemplo, 0,05), podemos rejeitar a hipótese nula e concluir que a série temporal é estacionária.
Vamos observar o valor-p acima. Ele é igual a 1,0, o que significa que não podemos rejeitar a hipótese nula e nossos dados são não-estacionários. A hipótese nula seria falsa se o valor-p fosse menor que 0,05.
Tarefa
Verifique se o conjunto de dados daily-total-female-births.csv
é estacionário.
- Importe
adfuller
destatsmodels.tsa.stattools
. - Leia o arquivo
csv
. - Realize o teste de Dickey-Fuller aumentado para a coluna
"Births"
dosdados
.
Obrigado pelo seu feedback!
Estacionaridade
Na análise de séries temporais, estacionariedade refere-se a uma característica de um processo estocástico onde as propriedades estatísticas do processo não mudam ao longo do tempo. A média, a variância e a estrutura de autocorrelação do processo permanecem constantes.
Exemplo de dados estacionários:
E dados não estacionários:
Por que essa funcionalidade é importante para nós?
Sua presença é um critério na seleção de modelos que você pode usar para prever os dados. Se os dados são estacionários, é possível usar diversos modelos (Regressão Autoregressiva, Média Móvel, Regressão Linear, etc.). Por outro lado, não existem modelos universais para prever processos não estacionários: algumas séries temporais não estacionárias podem ser convertidas em estacionárias por meio de manipulações matemáticas (modelo ARIMA); outras séries temporais não estacionárias podem ser previstas utilizando tipos especiais de redes neurais.
Vamos proceder à verificação dos dados quanto à estacionaridade. Isso pode ser feito utilizando testes estatísticos chamados "Testes de Raiz Unitária". Existem testes como:
- Teste de Dickey-Fuller Aumentado;
- Kwiatkowski-Phillips-Schmidt-Shin;
- Teste de Philips Perron.
Na maioria das vezes, utilizaremos o teste de Dickey-Fuller Aumentado (ADF), mas você pode levar em conta os resultados de outros testes.
Utilizando a biblioteca statsmodel
, vamos determinar se os dados são estacionários. Isso é feito em poucas linhas de código:
Como podemos interpretar os resultados obtidos?
A hipótese nula deste teste é que a série temporal é não-estacionária. Se o valor-p for inferior a um determinado nível (por exemplo, 0,05), podemos rejeitar a hipótese nula e concluir que a série temporal é estacionária.
Vamos observar o valor-p acima. Ele é igual a 1,0, o que significa que não podemos rejeitar a hipótese nula e nossos dados são não-estacionários. A hipótese nula seria falsa se o valor-p fosse menor que 0,05.
Tarefa
Verifique se o conjunto de dados daily-total-female-births.csv
é estacionário.
- Importe
adfuller
destatsmodels.tsa.stattools
. - Leia o arquivo
csv
. - Realize o teste de Dickey-Fuller aumentado para a coluna
"Births"
dosdados
.
Obrigado pelo seu feedback!
Na análise de séries temporais, estacionariedade refere-se a uma característica de um processo estocástico onde as propriedades estatísticas do processo não mudam ao longo do tempo. A média, a variância e a estrutura de autocorrelação do processo permanecem constantes.
Exemplo de dados estacionários:
E dados não estacionários:
Por que essa funcionalidade é importante para nós?
Sua presença é um critério na seleção de modelos que você pode usar para prever os dados. Se os dados são estacionários, é possível usar diversos modelos (Regressão Autoregressiva, Média Móvel, Regressão Linear, etc.). Por outro lado, não existem modelos universais para prever processos não estacionários: algumas séries temporais não estacionárias podem ser convertidas em estacionárias por meio de manipulações matemáticas (modelo ARIMA); outras séries temporais não estacionárias podem ser previstas utilizando tipos especiais de redes neurais.
Vamos proceder à verificação dos dados quanto à estacionaridade. Isso pode ser feito utilizando testes estatísticos chamados "Testes de Raiz Unitária". Existem testes como:
- Teste de Dickey-Fuller Aumentado;
- Kwiatkowski-Phillips-Schmidt-Shin;
- Teste de Philips Perron.
Na maioria das vezes, utilizaremos o teste de Dickey-Fuller Aumentado (ADF), mas você pode levar em conta os resultados de outros testes.
Utilizando a biblioteca statsmodel
, vamos determinar se os dados são estacionários. Isso é feito em poucas linhas de código:
Como podemos interpretar os resultados obtidos?
A hipótese nula deste teste é que a série temporal é não-estacionária. Se o valor-p for inferior a um determinado nível (por exemplo, 0,05), podemos rejeitar a hipótese nula e concluir que a série temporal é estacionária.
Vamos observar o valor-p acima. Ele é igual a 1,0, o que significa que não podemos rejeitar a hipótese nula e nossos dados são não-estacionários. A hipótese nula seria falsa se o valor-p fosse menor que 0,05.
Tarefa
Verifique se o conjunto de dados daily-total-female-births.csv
é estacionário.
- Importe
adfuller
destatsmodels.tsa.stattools
. - Leia o arquivo
csv
. - Realize o teste de Dickey-Fuller aumentado para a coluna
"Births"
dosdados
.