Eu realmente estou tentando, mas lutando, entender como o Autoregressive and Moving Average funciona. Eu sou muito terrível com a álgebra e ver isso realmente não melhora minha compreensão de algo. O que eu realmente adoraria é um exemplo extremamente simples de dizer 10 observações dependentes do tempo para que eu possa ver como eles funcionam. Então, digamos que você tem os seguintes pontos de dados do preço do ouro: Por exemplo, no período de tempo 10, qual seria a média móvel de Lag 2, MA (2), ou MA (1) e AR (1) ou AR (2) Eu aprendi tradicionalmente sobre a média móvel sendo algo como: Mas ao olhar para os modelos ARMA, o MA é explicado como uma função de termos de erro anteriores, que não consigo entender. É apenas uma maneira mais elegante de calcular o mesmo que achei este post útil: (Como entender o SARIMAX intuitivamente), mas, se a álgebra ajudar, não consigo ver algo de forma muito clara até ver um exemplo simplificado. Dado os dados do preço do ouro, você primeiro estimar o modelo e depois ver como ele funciona (previsões de análise de impulso-resposta). Talvez você deva reduzir a sua pergunta apenas na segunda parte (e deixar a estimação de lado). Ou seja, você forneceria um AR (1) ou MA (1) ou qualquer modelo (por exemplo, xt0.5 x varepsilont) e pergunte-nos, como esse modelo em particular funciona. Ndash Richard Hardy 13 de agosto 15 às 19:58 Para qualquer modelo AR (q), a maneira fácil de estimar o (s) parâmetro (es) é usar OLS - e executar a regressão de: pricet beta0 beta1 cdot price dotso betaq cdot price Vamos fazê-lo (Em R): (Ok, então tratei um pouco e usei a função arima em R, mas produz as mesmas estimativas que a regressão OLS - experimente). Agora vamos dar uma olhada no modelo MA (1). Agora, o modelo MA é muito diferente do modelo AR. O MA é a média ponderada do erro de períodos passados, onde, como o modelo AR usa os valores de dados reais dos períodos anteriores. O MA (1) é: pricet mu wt theta1 cdot w Onde mu é a média, e wt são os termos de erro - não o valor previo de preço (como no modelo AR). Agora, infelizmente, não podemos estimar os parâmetros por algo tão simples quanto o OLS. Não abordarei o método aqui, mas a função R arima usa a máxima semelhança. Vamos tentar: espere que isso ajude. (2) Em relação à pergunta MA (1). Você diz que o residual é 1.0023 para o segundo período. Isso faz sentido. Minha compreensão do residual é a diferença entre o valor previsto e o valor observado. Mas, então, você diz o valor previsto para o período 2, é calculado usando o residual para o período 2. Isso é certo. Não é o valor previsto para o período 2 apenas (0.54230 4.9977) ndash Will TE 17 de agosto 15 às 11: 24Divística serial temporária Data Data Science Para Dummies Similar a como a análise multivariada é a análise de relações entre variáveis múltiplas, a análise univariada é uma análise quantitativa de apenas uma variável. Quando você modela séries temporais univariadas, você está modelando as mudanças de séries temporais que representam mudanças em uma única variável ao longo do tempo. A Média de Mudança Autoregressiva (ARMA) é uma classe de métodos de previsão que você pode usar para prever valores futuros de dados atuais e históricos. Como o próprio nome indica, a família de modelos ARMA combina técnicas de autorregressão (análises que assumem que as observações anteriores são bons preditores de valores futuros e realizam uma análise de autorregressão para prever esses valores futuros) e técnicas de média móvel 8212 modelos que medem o nível de Série de tempo constante e, em seguida, atualize o modelo de previsão se forem detectadas quaisquer alterações. Aqui está um exemplo de uma equação para o modelo ARMA: Nesta equação, y t é igual ao valor real da série temporal no tempo t. Y t 8211 y t 8208 1 é igual à mudança líquida no valor das séries temporais entre o tempo t e o tempo t 8211 1 8212 a alteração do valor das séries temporais ao longo de um intervalo de tempo, em outras palavras. E t 8208 1 é igual ao termo de erro no tempo t 8211 1 (uma quantificação dos processos de erro no modelo no instante t 8211 1). Autoregression assume que as observações p anteriores na série temporal fornecem uma boa estimativa de futuras observações. A parte média móvel do modelo permite que o modelo atualize as previsões se o nível de uma série de tempo constante muda. Se você estiver procurando um modelo simples ou um modelo que funcionará apenas para um pequeno conjunto de dados, o modelo ARMA não é um ajuste adequado às suas necessidades. Uma alternativa neste caso pode ser apenas manter uma regressão linear simples. Para usar o modelo ARMA para resultados confiáveis, você precisa ter pelo menos 50 observações e um analista treinado que possa caber e interpretar o modelo para você. A figura mostra um gráfico do modelo ARMA que corresponde a esta equação: na figura, você pode ver que os dados da previsão do modelo e os dados reais são muito próximos. Isso significa que a equação que foi formulada acima é uma boa representação da série de tempo que modeliza. O RIMA significa modelos de Módulos de Mídia Integrada Autoregressiva. Univariado (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série inteiramente baseada em sua própria inércia. Sua principal aplicação é a previsão de curto prazo que requer pelo menos 40 pontos de dados históricos. Ele funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers. Às vezes, chamado Box-Jenkins (após os autores originais), o ARIMA geralmente é superior às técnicas de suavização exponencial quando os dados são razoavelmente longos e a correlação entre observações passadas é estável. Se o dado for curto ou altamente volátil, algum método de suavização poderá ser melhor. Se você não tem pelo menos 38 pontos de dados, você deve considerar algum outro método que o ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionaria. A estacionarização implica que a série permanece em um nível bastante constante ao longo do tempo. Se houver uma tendência, como na maioria das aplicações econômicas ou comerciais, seus dados NÃO são estacionários. Os dados também devem mostrar uma variância constante em suas flutuações ao longo do tempo. Isso é facilmente visto com uma série que é fortemente sazonal e cresce a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem essas condições de estacionaridade que estão sendo atendidas, muitos dos cálculos associados ao processo não podem ser computados. Se um gráfico gráfico dos dados indicar não-estacionária, então você deve diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não estacionária em uma estacionária. Isso é feito subtraindo a observação no período atual do anterior. Se essa transformação for feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados. Este processo elimina essencialmente a tendência se sua série estiver crescendo a uma taxa bastante constante. Se estiver crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferenciar os dados novamente. Seus dados seriam então diferenciados em segundo lugar. As autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede quão fortemente os valores de dados em um número especificado de períodos separados estão correlacionados um com o outro ao longo do tempo. O número de períodos separados geralmente é chamado de atraso. Por exemplo, uma autocorrelação no intervalo 1 mede como os valores de 1 período separado estão correlacionados entre si ao longo da série. Uma autocorrelação no intervalo 2 mede como os dados separados por dois períodos estão correlacionados ao longo da série. As autocorrelações podem variar de 1 a -1. Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo a -1 implica uma alta correlação negativa. Essas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagram traça os valores de auto-correlação para uma determinada série em diferentes atrasos. Isso é referido como a função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em uma série de tempo estacionária como uma função do que são chamados parâmetros de média autorregressiva e móvel. Estes são referidos como parâmetros AR (autoregessivos) e MA (médias móveis). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) o parâmetro autorregressivo da ordem 1 X (t-1) a série temporal atrasou 1 período E (T) o termo de erro do modelo Isso significa simplesmente que qualquer valor X (t) determinado pode ser explicado por alguma função do seu valor anterior, X (t-1), além de algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse de .30, então o valor atual da série estaria relacionado a 30 de seu valor 1 há algum tempo. Claro, a série pode estar relacionada com mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente precedentes, X (t-1) e X (t-2), além de algum erro aleatório E (t). Nosso modelo agora é um modelo autoregressivo de ordem 2. Modelos médios em movimento: um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora esses modelos pareçam muito parecidos com o modelo AR, o conceito por trás deles é bastante diferente. Os parâmetros médios em movimento relacionam o que ocorre no período t apenas com os erros aleatórios ocorridos em períodos passados, ou seja, E (t-1), E (t-2), etc., em vez de X (t-1), X ( T-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo de MA pode ser escrito da seguinte forma. X (t) - B (1) E (t-1) E (t) O termo B (1) é chamado de MA da ordem 1. O sinal negativo na frente do parâmetro é usado apenas para convenção e geralmente é impresso Automaticamente pela maioria dos programas de computador. O modelo acima simplesmente diz que qualquer valor dado de X (t) está diretamente relacionado apenas ao erro aleatório no período anterior, E (t-1) e ao termo de erro atual, E (t). Como no caso de modelos autoregressivos, os modelos de média móvel podem ser estendidos para estruturas de ordem superior que cobrem diferentes combinações e comprimentos médios móveis. A metodologia ARIMA também permite a criação de modelos que incorporam parâmetros de média autorregressiva e móvel em conjunto. Estes modelos são frequentemente referidos como modelos mistos. Embora isso faça para uma ferramenta de previsão mais complicada, a estrutura pode simular a série melhor e produzir uma previsão mais precisa. Modelos puros implicam que a estrutura consiste apenas em parâmetros AR ou MA - nem ambos. Os modelos desenvolvidos por esta abordagem geralmente são chamados de modelos ARIMA porque eles usam uma combinação de autoregressivo (AR), integração (I) - referente ao processo reverso de diferenciação para produzir as operações de previsão e média móvel (MA). Um modelo ARIMA geralmente é declarado como ARIMA (p, d, q). Isso representa a ordem dos componentes autorregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo médio móvel. Por exemplo, ARIMA (2,1,1) significa que você possui um modelo autoregressivo de segunda ordem com um componente de média móvel de primeira ordem, cuja série foi diferenciada uma vez para induzir a estacionaria. Escolhendo a Especificação Direita: O principal problema na caixa clássica da Caixa-Jenkins está tentando decidir qual a especificação ARIMA para usar - isto é. Quantos parâmetros AR e ou MA devem incluir. Isto é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Dependia da avaliação gráfica e numérica da autocorrelação da amostra e das funções de autocorrelação parcial. Bem, para os seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que se parecem de uma certa maneira. No entanto, quando você aumenta a complexidade, os padrões não são facilmente detectados. Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isso significa que erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é uma arte e não uma ciência.
No comments:
Post a Comment