Um modelo de análise estatística que usa dados de séries temporais para prever as tendências futuras É uma forma de análise de regressão que procura prever movimentos futuros ao longo da caminhada aparentemente aleatória tomada por estoques E o mercado financeiro examinando as diferenças entre os valores da série em vez de usar os valores de dados reais Lags das séries diferenciadas são referidos como auto-regressivos e os atrasos dentro dos dados previstos são referidos como média móvel. BREAKING DOWN Média Movente Autorestrada - ARIMA . Este tipo de modelo é geralmente referido como ARIMA p, d, q, com os inteiros referindo-se a parte autorregressiva integrada e média móvel do conjunto de dados, respectivamente modelagem ARIMA pode ter em conta tendências, ciclos de sazonalidade, erros e não-estacionário Aspectos de um conjunto de dados ao fazer previsões. Introdução a ARIMA não sazonais models. ARIMA p, d, q forec Os modelos ARIMA são, em teoria, a classe mais geral de modelos para prever uma série de tempo que pode ser feita para ser estacionária por diferenciação, se necessário, talvez em conjunto com transformações não-lineares como logging ou deflação, se necessário Uma variável aleatória que é Uma série de tempo é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ele wiggles de forma consistente ou seja, seus padrões de tempo aleatório de curto prazo sempre olhar o mesmo Em um sentido estatístico Esta última condição significa que suas correlações de autocorrelações com seus próprios desvios prévios em relação à média permanecem constantes ao longo do tempo ou, de forma equivalente, que seu espectro de poder permanece constante ao longo do tempo Uma variável aleatória desta forma pode ser vista como usual como uma combinação De sinal e ruído, eo sinal se for aparente poderia ser um padrão de reversão média rápida ou lenta, ou oscilatório sinusoidal Ion, ou alternância rápida no sinal, e poderia também ter um componente seasonal Um modelo de ARIMA pode ser visto como um filtro que tente separar o sinal do ruído, eo sinal é extrapolated então no futuro para obter forecast. The ARIMA A equação de previsão para uma série de tempo estacionária é uma equação linear do tipo de regressão, em que os preditores consistem em defasagens da variável dependente e / ou defasagens dos erros de previsão. Isto é. Valor predefinido de Y uma constante e ou uma soma ponderada de um ou Valores mais recentes de Y e / ou uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores defasados de Y é um modelo auto-regressivo autoregressivo puro, que é apenas um caso especial de um modelo de regressão E por exemplo, um modelo de regressão AR de 1ª ordem para Y é um modelo de regressão simples em que a variável independente é apenas Y retardada por um período LAG Y, 1 em Statgraphics ou Y LAG1 em RegressIt Se alguns dos preditores são defasagens dos erros, um modelo ARIMA não é um modelo de regressão linear, porque não há maneira de especificar o erro do último período s como uma variável independente os erros devem ser computados em um período-para De um ponto de vista técnico, o problema com o uso de erros retardados como preditores é que as previsões do modelo não são funções lineares dos coeficientes mesmo que sejam funções lineares dos dados passados. Assim, os coeficientes Em modelos ARIMA que incluem erros defasados devem ser estimados por métodos de otimização não-linear hill-climbing em vez de apenas resolver um sistema de equações. A sigla ARIMA significa Auto-Regressive Integrated Moving Average Lags da série estacionária na equação de previsão são chamados de auto-regressivo Termos, os atrasos dos erros de previsão são chamados de termos de média móvel, e uma série de tempo que precisa ser diferenciada para ser A versão ralada de uma série estacionária Random-caminhada e modelos de tendência aleatória, modelos autorregressivos e modelos de suavização exponencial são todos casos especiais de modelos ARIMA. Um modelo ARIMA não sazonal é classificado como um modelo ARIMA p, d, q, onde p é O número de termos autorregressivos. D é o número de diferenças não sazonais necessárias para a estacionariedade, eq é o número de erros de previsão defasados na equação de previsão. A equação de previsão é construída da seguinte forma: Primeiro, vamos y representar a d diferença de Y O que significa. Note que a segunda diferença de Y o caso d 2 não é a diferença de 2 períodos atrás. Antes, é a diferença de primeira diferença da primeira diferença que é o análogo discreto de uma segunda derivada, ou seja, o local Aceleração da série em vez de sua tendência local. Em termos de y a equação de previsão geral é. Aqui os parâmetros de média móvel s são definidos de modo que seus sinais são negativos na equação, seguindo a convenção introduzida por Box e Jen Kins Alguns autores e software, incluindo a linguagem de programação R definem-los de modo que eles têm mais sinais ao invés Quando números reais são conectados à equação, não há ambigüidade, mas é importante saber qual convenção seu software usa quando você está lendo a saída Freqüentemente os parâmetros são indicados por AR 1, AR 2,, e MA 1, MA 2, etc. Para identificar o modelo ARIMA apropriado para Y você começa determinando a ordem de diferenciação d precisando estacionar a série e remover as características brutas De sazonalidade, talvez em conjunto com uma transformação estabilizadora de variância, como o logging ou o deflação Se você parar neste ponto e prever que a série diferenciada é constante, você tem apenas montado uma caminhada aleatória ou um modelo de tendência aleatória. No entanto, a série estacionária ainda pode Têm erros autocorrelacionados, sugerindo que algum número de termos AR p 1 e ou algum número de termos MA q 1 também são necessários na equação de previsão. E os valores de p, d e q que são melhores para uma determinada série de tempo serão discutidos em seções posteriores das notas cujos links estão no topo desta página, mas uma prévia de alguns dos tipos de modelos não-sazonais ARIMA que são Geralmente encontrada é dada abaixo. ARIMA 1,0,0 modelo de auto-regressão de primeira ordem se a série é estacionária e autocorrelacionada, talvez ele pode ser previsto como um múltiplo de seu próprio valor anterior, mais uma constante A equação de previsão neste caso é. Que é Y regressa sobre si mesmo retardado por um período Este é um modelo constante ARIMA 1,0,0 Se a média de Y for zero, então o termo constante não seria incluído. Se o coeficiente de inclinação 1 for positivo e menor que 1 em Magnitude deve ser menor que 1 em magnitude se Y estiver parado, o modelo descreve o comportamento de reversão de média no qual o valor do próximo período deve ser predito como sendo 1 vezes mais distante da média do valor deste período Se 1 for negativo, Prediz comportamento de reversão de média com alternância de signo S, isto é, também prediz que Y estará abaixo do próximo período médio se estiver acima da média desse período. Em um modelo autorregressivo de segunda ordem ARIMA 2,0,0, haveria um termo Y t-2 à direita E assim por diante. Dependendo dos sinais e magnitudes dos coeficientes, um modelo ARIMA 2,0,0 poderia descrever um sistema cuja reversão média ocorre de forma sinusoidal oscilante, como o movimento de uma massa em uma mola que é Submetido a choques aleatórios. ARIMA 0,1,0 caminhada randômica Se a série Y não é estacionária, o modelo mais simples possível para ele é um modelo randômico randômico, que pode ser considerado como um caso limitante de um modelo AR 1 no qual o autorregressivo Coeficiente é igual a 1, ou seja, uma série com inversão média infinitamente lenta A equação de predição para este modelo pode ser escrita como. quando o termo constante é a variação média período-período, ou seja, a deriva de longo prazo em Y Este modelo poderia ser montado Como um modelo de regressão sem interceptação em que a primeira diferença de Y é a d Variável dependente Uma vez que inclui apenas uma diferença não sazonal e um termo constante, é classificada como modelo ARIMA 0,1,0 com constante. O modelo randômico-sem-desvio seria um modelo ARIMA 0,1,0 sem constante. ARIMA 1,1,0 modelo autoregressivo de primeira ordem diferenciado Se os erros de um modelo de caminhada aleatória são autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente à equação de predição - isto é, regressando a primeira diferença de Y em si mesmo retardado por um período Isso resultaria na seguinte equação de previsão que pode ser rearranjada para. Este é um modelo autorregressivo de primeira ordem com uma ordem de diferenciamento não sazonal e um termo constante - ou seja, um modelo ARIMA 1,1,0.ARIMA 0,1,1 sem suavização exponencial simples constante Outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples Lembre-se de que para algumas séries temporais não estacionárias, por exemplo, as que exibem flucus ruidosos Em vez de tomar a observação mais recente como a previsão da próxima observação, é melhor usar uma média Das últimas observações para filtrar o ruído e estimar com maior precisão a média local O modelo de suavização exponencial simples usa uma média móvel exponencialmente ponderada de valores passados para alcançar esse efeito A equação de predição para o modelo de suavização exponencial simples pode ser escrita em Um número de formas matematicamente equivalentes, uma das quais é a chamada forma de correcção de erro, na qual a previsão anterior é ajustada na direcção do erro que cometeu. Porque e t-1 Y t-1 - t-1 por definição, Isto pode ser reescrito como. que é uma equação de previsão ARIMA 0,1,1-sem-constante com 1 1 - Isso significa que você pode ajustar uma suavização exponencial simples, especificando-a como um modelo ARIMA 0,1,1 sem con E o coeficiente MA 1 estimado corresponde a 1-menos-alfa na fórmula SES. Lembre-se que no modelo SES, a idade média dos dados nas previsões de 1 período antecipado é 1, o que significa que eles tenderão a ficar para trás Tendências ou pontos de viragem por cerca de 1 períodos Segue-se que a média de idade dos dados nas previsões de um período de um modelo ARIMA 0,1,1 sem constante é 1 1 - 1 Assim, por exemplo, se 1 0 8, a média de idade é de 5 Como 1 aproxima-se de 1, o modelo ARIMA 0,1,1-sem-constante torna-se uma média móvel de muito longo prazo, e quando 1 se aproxima de 0 torna-se um aleatório-pé-sem-deriva Nos dois modelos anteriores discutidos acima, o problema de erros autocorrelacionados em um modelo de caminhada aleatória foi fixado de duas maneiras diferentes, adicionando um valor defasado para os valores diferenciados Série para a equação ou adicionando um valor defasado do erro de previsão Qual abordagem é melhor Uma regra de ouro para esta s Que será discutido mais detalhadamente mais adiante, é que a autocorrelação positiva é geralmente melhor tratada pela adição de um termo AR ao modelo e autocorrelação negativa é geralmente melhor tratada pela adição de um termo MA Em business e séries de tempo econômico, autocorrelação negativa muitas vezes Surge como um artefato de diferenciação. Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa. Assim, o modelo ARIMA 0,1,1, no qual a diferenciação é acompanhada por um termo MA, é mais usado do que Um modelo ARIMA 1,1,0.ARIMA 0,1,1 com alisamento exponencial simples constante com crescimento Ao implementar o modelo SES como modelo ARIMA, você realmente ganha alguma flexibilidade Em primeiro lugar, o coeficiente MA 1 estimado pode ser Negativo, isto corresponde a um factor de suavização maior do que 1 num modelo SES, o que normalmente não é permitido pelo procedimento de ajustamento do modelo SES. Em segundo lugar, tem a opção de incluir um termo constante em t O modelo ARIMA, se desejar, para estimar uma tendência média não-zero O modelo ARIMA 0,1,1 com constante tem a equação de predição. As previsões de um período de antecedência deste modelo são qualitativamente semelhantes às do SES , Exceto que a trajetória das previsões de longo prazo é tipicamente uma linha inclinada cuja inclinação é igual a mu em vez de uma linha horizontal. ARIMA 0,2,1 ou 0,2,2 sem alisamento exponencial linear constante Modelos lineares de suavização exponencial São modelos ARIMA que usam duas diferenças não sazonais em conjunção com os termos MA A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma retardada por dois períodos, mas sim é a primeira diferença da primeira diferença --e a mudança Assim, a segunda diferença de Y no período t é igual a Y t - Y t-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t -2 Uma segunda diferença de uma função discreta é análoga a uma segunda derivada de uma função contínua ele measu Res a aceleração ou curvatura na função em um determinado ponto no tempo. O modelo ARIMA 0,2,2 sem constante prevê que a segunda diferença da série é igual a uma função linear dos últimos dois erros de previsão. Que pode ser rearranjado como. Onde 1 e 2 são os coeficientes MA 1 e MA 2 Este é um modelo de suavização exponencial linear geral essencialmente o mesmo que o modelo de Holt e o modelo de Brown s é um caso especial. Utiliza médias móveis exponencialmente ponderadas para estimar um nível local e um Tendência local na série As previsões de longo prazo a partir deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA 1,1,2 sem suavização exponencial linear de tendência amortecida constante. Este modelo É ilustrado nos slides acompanhantes nos modelos ARIMA extrapola a tendência local no final da série mas aplana-a em horizontes de previsão mais longos para introduzir uma nota de conservadorismo, uma prática que tem suporte empírico Veja o artigo sobre Por que o Damped Trend funciona por Gardner e McKenzie eo artigo da regra de ouro por Armstrong et al para detalhes. É geralmente aconselhável ficar com modelos em que pelo menos um de p e q não é maior do que 1, ou seja, fazer Não tentar encaixar um modelo como ARIMA 2,1,2, pois isso é susceptível de levar a overfitting e fatores comuns fatores que são discutidos com mais detalhes nas notas sobre a estrutura matemática de ARIMA models. Spreadsheet implementação modelos ARIMA Como os descritos acima são fáceis de implementar em uma planilha eletrônica A equação de predição é simplesmente uma equação linear que se refere a valores passados de séries temporais originais e valores passados dos erros Assim, você pode configurar uma planilha de previsão ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os dados de erros menos as previsões na coluna C A fórmula de previsão numa célula típica na coluna B seria simplesmente uma expressão linear referindo-se a valores nas linhas precedentes das colunas A e C , Multiplicado pelos coeficientes AR ou MA apropriados armazenados em células em outra parte da planilha. Média Móvel Arrependente ARMA p, q Modelos para Análise de Série de Tempo - Parte 3.Este é o terceiro e último post da mini-série sobre Média Movente Autoresgressiva ARMA Modelos para análise de séries temporais Introduzimos modelos auto-regressivos e modelos de média móvel nos dois artigos anteriores Agora é hora de combiná-los para produzir um modelo mais sofisticado. Finalmente, isso nos levará aos modelos ARIMA e GARCH que nos permitirão prever Retorno de ativos e volatilidade de previsão Estes modelos formam a base para sinais de negociação e técnicas de gerenciamento de risco. Se você leu Parte 1 e Parte 2 você terá visto que tendemos a seguir um padrão para a nossa análise de um modelo de série de tempo eu vou repetir Ele brevemente aqui. Racional - Por que estamos interessados neste modelo particular. Definição - Uma definição matemática para reduzir a ambigüidade. Correlograma - Traçar um correlograma amostra para visual Um modelo behaviour. Simulation e montagem - Ajustar o modelo para simulações, a fim de garantir que nós entendemos o modelo corretamente. Dados Financeiros Racionais - Aplicar o modelo de preços de ativos reais reais. Previsão - Previsão de valores subseqüentes para construir sinais de negociação ou filtros. Para seguir este artigo, é aconselhável dar uma olhada nos artigos anteriores sobre a análise de séries temporais. Eles podem ser encontrados aqui. Bayesian Informações Criterion. In Parte 1 deste artigo série vimos o Akaike Informações Critério AIC como um Meios de ajudar-nos a escolher entre melhores modelos de séries temporais diferentes. Uma ferramenta estreitamente relacionada é o critério de informação Bayesian BIC Essencialmente, tem um comportamento semelhante ao AIC, na medida em que penaliza os modelos por ter muitos parâmetros Isto pode levar a overfitting A diferença entre o BIC E AIC é que o BIC é mais rigoroso com a sua penalização de parâmetros adicionais. Bayesian Information Criterion. If tomamos a função de verossimilhança para um Modelo estatístico, que tem parâmetros k, e L maximiza a probabilidade, em seguida, o critério Bayesiano de Informação é dado por. Quando n é o número de pontos de dados na série temporal. Nós estaremos usando o AIC e BIC abaixo ao escolher apropriado ARMA p, Q models. Ljung-Box Test. In Parte 1 deste artigo série Rajan mencionado no Disqus comentários que o teste Ljung-Box foi mais apropriado do que usar o critério de informação Akaike do critério Bayesiano de Informação para decidir se um modelo ARMA foi um bom Ajustado a uma série de tempo. O teste de Ljung-Box é um teste de hipóteses clássico que é projetado para testar se um conjunto de autocorrelações de um modelo de séries de tempo ajustado diferem significativamente de zero O teste não testa cada atraso individual para aleatoriedade, A aleatoriedade sobre um grupo de lags. Ljung-Box Test. We definir a hipótese nula como Os dados da série de tempo em cada lag são iid que é, as correlações entre os valores da série de população são zero. E hipótese alternativa como Os dados da série de tempo não são iid e possuem correlação serial. Nós calculamos a seguinte estatística de teste Q. Quando n é o comprimento da amostra da série de tempo, chapéu k é a autocorrelação da amostra em lag k e h é o número de Retarda sob o teste. A regra da decisão para rejeitar a hipótese nula é verificar se Q chi 2, para uma distribuição do qui-quadrado com h graus de liberdade no percentile de 100 1- alfa. Mesmo que os detalhes do teste Pode parecer um pouco complexo, podemos de fato usar R para calcular o teste para nós, simplificando um pouco o procedimento. A média móvel movediça ARMA Modelos de ordem p, q. Agora que discutimos o BIC eo teste de Ljung-Box, estamos Pronto para discutir o nosso primeiro modelo misto, ou seja, a Média Móvel Autoregressiva de ordem p, q, ou ARMA p, q. Para data consideramos processos autorregressivos e processos de média móvel. O modelo anterior considera seu próprio comportamento passado como entradas para o modelo E como tais tentativas Para capturar efeitos de participantes no mercado, tais como momentum e reversão média em negociação de ações. O último modelo é usado para caracterizar informações de choque para uma série, como um anúncio de ganhos surpresa ou evento inesperado, como o derramamento de óleo BP Deepwater Horizon. Por isso, Um modelo ARMA tenta capturar esses dois aspectos ao modelar séries de tempo financeiro. Note que um modelo ARMA não leva em conta a volatilidade clustering, um fenômeno empírico chave de muitas séries de tempo financeiro não é um modelo condicionalmente heteroscedastic Para isso vamos precisar Para esperar os modelos de ARCH e de GARCH. O modelo de ARMA p, q é uma combinação linear de dois modelos lineares e assim é em si mesmo linear. Autoredressive Moving Average Modelo de ordem p, qA modelo de série de tempo, é um modelo de média móvel autorregressivo De ordem p, q ARMA p, q, if. Begin xt alpha1 x alfa2 x ldots wt beta1 w beta2 w ldots betaq w end. Where é ruído branco com E wt 0 e variância sigma 2.If consideramos o operador de mudança para trás ver um artigo anterior, em seguida, podemos reescrever o acima como uma função Theta e phi de. Podemos ver diretamente que, ao definir p neq 0 e q 0, recuperamos o modelo AR p Similarmente, se colocarmos p 0 e q neq 0, recuperamos o modelo MA q. Uma das principais características do modelo ARMA É que é parcimonioso e redundante em seus parâmetros. Ou seja, um modelo ARMA geralmente requer menos parâmetros do que um modelo AR p ou MA q sozinho. Além disso, se reescrevemos a equação em termos do BSO, então os polinômios theta e phi podem Às vezes compartilham um fator comum, conduzindo assim a um modelo mais simples. Simulações e Correlograms. As com os modelos autorregressive e média movente nós simularemos agora várias séries de ARMA e tentamos caber modelos de ARMA a estas realizações Eu levo isto para fora porque eu quero Assegurar que entendamos O procedimento de montagem, incluindo como calcular intervalos de confiança para os modelos, bem como garantir que o procedimento realmente recuperar estimativas razoáveis para os parâmetros ARMA original. Na Parte 1 e Parte 2 construímos manualmente as séries AR e MA por desenho N amostras A partir de uma distribuição normal e, em seguida, elaborar o modelo de série de tempo específico usando atrasos dessas amostras. No entanto, há uma maneira mais simples de simular AR, MA, ARMA e ARIMA dados, simplesmente usando o método em R. Vamos começar com O modelo mais simples possível ARMA não-trivial, ou seja, o modelo ARMA 1,1 Ou seja, um modelo autorregressivo de ordem um combinado com um modelo de média móvel de ordem um tal modelo tem apenas dois coeficientes, alfa e beta, que representam a primeira Atrasos da série de tempo em si e os termos de ruído de choque branco tal modelo é dado por. Precisamos especificar os coeficientes antes da simulação Vamos tomar alpha 0 5 e beta -0 5. A saída é a seguinte. F um modelo ARMA 1,1, com alfa 0 5 e beta 0 5. Vamos também traçar o correlograma. Correlograma de um modelo ARMA 1,1, com alfa 0 5 e beta 0 5. Podemos ver que não há significância Autocorrelação, o que é de esperar de um modelo ARMA 1,1. Finalmente, vamos tentar determinar os coeficientes e seus erros padrão usando a função arima. Podemos calcular os intervalos de confiança para cada parâmetro usando os erros padrão. Os intervalos de confiança Conter os verdadeiros valores dos parâmetros para ambos os casos, no entanto, devemos notar que os 95 intervalos de confiança são uma consequência muito grande dos erros padrão razoavelmente grandes. Vamos agora tentar um modelo ARMA 2,2 Ou seja, um modelo AR 2 combinado com Um modelo MA 2 Precisamos especificar quatro parâmetros para este modelo alfa1, alfa2, beta1 e beta2 Vamos tomar alpha1 0 5, alpha2 -025 beta1 0 5 e beta2 -0 3. A saída do nosso modelo ARMA 2,2 é Como segue. Realisation de um modelo ARMA 2,2, com alfa1 0 5, alfa2 -025, beta1 0 5 e beta2 - 0 3.E a autocorelação correspondente. Correlograma de um modelo ARMA 2,2, com alfa1 0 5, alpha2 -025, beta1 0 5 e beta2 -0 3. Agora podemos tentar ajustar um modelo ARMA 2,2 para os dados . Podemos também calcular os intervalos de confiança para cada parâmetro. Observe que os intervalos de confiança para os coeficientes para a componente média móvel beta1 e beta2 não contêm realmente o valor original do parâmetro. Isto delineia o perigo de tentar ajustar os modelos aos dados, mesmo quando Sabemos que os valores dos parâmetros verdadeiros. No entanto, para fins de negociação só precisamos ter um poder preditivo que excede o acaso e produz lucro suficiente acima dos custos de transação, a fim de ser rentável no longo prazo. Agora que temos visto alguns exemplos de simulados ARMA modelos que precisamos de mecanismo para escolher os valores de p e q ao se ajustar aos modelos de dados financeiros reais. Choosing o melhor ARMA p, q Model. In para determinar qual a ordem p, q do modelo ARMA é apropriado para uma série , Precisamos usar o AIC ou BIC através de um subconjunto de valores para p, q e, em seguida, aplicar o teste Ljung-Box para determinar se um bom ajuste foi alcançado, para valores particulares de p, q. Para mostrar este método vamos simular em primeiro lugar um Em particular ARMA p, processo q Vamos então loop sobre todos os pares valores de p em eq em e calcular o AIC Vamos selecionar o modelo com o menor AIC e, em seguida, executar um teste Ljung-Box sobre os resíduos para determinar se temos conseguido Um bom ajuste. Vamos começar simulando uma série ARMA 3,2. Vamos agora criar um final de objeto para armazenar o melhor ajuste de modelo eo menor valor de AIC Nós loop sobre as várias combinações p, q e usar o objeto atual para armazenar o Ajuste de um modelo ARMA i, j para as variáveis de loop i e j. Se o AIC atual for menor que qualquer AIC previamente calculado, nós definimos o AIC final para este valor atual e selecionamos essa ordem. Ao término do loop, temos a ordem Do modelo ARMA armazenado e o ARIMA p, d, q encaixa-se com o componente d integrado ajustado para 0 armazenado como. Let s saída AIC, ordem e ARIMA coeficientes. Podemos ver que a ordem original do modelo ARMA simulado foi recuperado, nomeadamente com p 3 e q 2 Podemos traçar o corelograma dos resíduos do modelo para ver Se eles parecem uma realização de discreto ruído branco DWN. Correlograma dos resíduos do melhor ajuste ARMA p, q Modelo, p 3 e q 2.O corelograma realmente parece uma realização de DWN Finalmente, realizamos a Ljung-Box Teste para 20 defasagens para confirmar isso. Observe que o valor de p é maior que 0 05, que afirma que os resíduos são independentes no nível 95 e, portanto, um ARMA 3,2 modelo fornece um ajuste bom modelo. Claramente, este deve ser o No entanto, este é precisamente o procedimento que vamos usar quando chegarmos a ajustar ARMA p, q modelos para o índice S P500 na seção seguinte. Financial Data. Now que nós já delineou o procedimento para a escolha O modelo de série de tempo ideal para uma série simulada, é rather strai Ghtforward para aplicá-lo aos dados financeiros Para este exemplo vamos escolher mais uma vez o S P500 US Equity Index. Vamos fazer o download dos preços de fechamento diários usando o quantmod e, em seguida, criar o log retorna stream. Let s executar o mesmo procedimento de montagem como para A série simétrica ARMA 3,2 acima no log retorna série do S P500 usando o modelo AIC. The melhor ajuste tem ordem ARMA 3,3.Let s traçar os resíduos do modelo ajustado para o S P500 log diário retorna fluxo. Correlograma dos resíduos do melhor ajuste ARMA p, q Modelo, p 3 e q 3, para o S P500 diário log retorna stream. Notice que existem alguns picos significativos, especialmente em maior atraso Isso é indicativo de um ajuste pobre Let s Execute um teste de Ljung-Box para ver se temos evidências estatísticas para isso. Como suspeitamos, o valor p é menor que 0 05 e, como tal, não podemos dizer que os resíduos são uma realização de ruído branco discreto. Portanto, há autocorrelação adicional Nos resíduos que não é explicado pelo Modelo ARMA 3,3 ajustado. Como vimos tudo ao longo desta série de artigos, vimos evidências de agrupamento de volatilidade de heterocedasticidade condicional na série S P500, especialmente nos períodos em torno de 2007-2008 Quando usamos um modelo GARCH mais tarde no artigo Nós veremos como eliminar essas autocorrelações. Na prática, os modelos ARMA nunca são geralmente bons ajustes para retornar log equities Nós precisamos levar em conta a heterocedasticidade condicional e usar uma combinação de ARIMA e GARCH O próximo artigo irá considerar ARIMA e mostrar como O componente integrado difere do modelo de ARMA que nós temos considerado neste artigo. Começando apenas com negociação quantitativa.
Comments
Post a Comment