Saturday 28 October 2017

Difference between moving average and autoregressive


A RIMA significa Autoregressive Integrated Moving Average modelos. Univariada (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia. Sua principal aplicação é na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos. Ele funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers. Às vezes chamado Box-Jenkins (após os autores originais), ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos ea correlação entre as observações passadas é estável. Se os dados forem curtos ou altamente voláteis, então algum método de alisamento pode funcionar melhor. Se você não tiver pelo menos 38 pontos de dados, você deve considerar algum outro método que ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionaridade. A estacionariedade implica que a série permanece a um nível razoavelmente constante ao longo do tempo. Se existe uma tendência, como na maioria das aplicações econômicas ou de negócios, os dados NÃO são estacionários. Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo. Isto é facilmente visto com uma série que é fortemente sazonal e crescendo a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem que estas condições de estacionaridade sejam satisfeitas, muitos dos cálculos associados ao processo não podem ser calculados. Se um gráfico gráfico dos dados indica nonstationarity, então você deve diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não-estacionária em uma estacionária. Isto é feito subtraindo a observação no período atual do anterior. Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados. Este processo elimina essencialmente a tendência se sua série está crescendo em uma taxa razoavelmente constante. Se ele está crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferença os dados novamente. Seus dados seriam então segundo diferenciados. Autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede quão fortemente os valores de dados em um número específico de períodos separados estão correlacionados entre si ao longo do tempo. O número de períodos separados é geralmente chamado de atraso. Por exemplo, uma autocorrelação no intervalo 1 mede como os valores 1 intervalo de tempo são correlacionados um ao outro ao longo da série. Uma autocorrelação no intervalo 2 mede como os dados dois períodos separados estão correlacionados ao longo da série. As autocorrelações podem variar de 1 a -1. Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo de -1 implica uma correlação negativa elevada. Essas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagram traça os valores de autocorrelação para uma dada série em diferentes defasagens. Isto é referido como a função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em séries temporais estacionárias como uma função do que são chamados parâmetros auto-regressivos e de média móvel. Estes são referidos como parâmetros AR (autoregessive) e parâmetros MA (média móvel). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) o parâmetro autorregressivo de ordem 1 X (t-1) (T) o termo de erro do modelo Isto simplesmente significa que qualquer valor dado X (t) pode ser explicado por alguma função de seu valor anterior, X (t-1), mais algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse .30, então o valor atual da série estaria relacionado a 30 de seu valor 1 período atrás. Naturalmente, a série poderia estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente anteriores, X (t-1) e X (t-2), mais algum erro aleatório E (t). Nosso modelo é agora um modelo autorregressivo de ordem 2. Modelos de média móvel: Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora estes modelos parecem muito semelhantes ao modelo AR, o conceito por trás deles é bastante diferente. Os parâmetros de média móvel relacionam o que acontece no período t apenas aos erros aleatórios que ocorreram em períodos de tempo passados, isto é, E (t-1), E (t-2), etc., em vez de X (t-1), X T-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo MA pode ser escrito da seguinte forma. O termo B (1) é chamado de MA de ordem 1. O sinal negativo na frente do parâmetro é usado apenas para convenção e normalmente é impresso Automaticamente pela maioria dos programas de computador. O modelo acima diz simplesmente que qualquer valor dado de X (t) está diretamente relacionado somente ao erro aleatório no período anterior, E (t-1) e ao termo de erro atual, E (t). Como no caso dos modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo diferentes combinações e comprimentos médios móveis. A metodologia ARIMA também permite a construção de modelos que incorporem parâmetros de média móvel e autorregressiva. Estes modelos são frequentemente referidos como modelos mistos. Embora isso torne uma ferramenta de previsão mais complicada, a estrutura pode de fato simular melhor a série e produzir uma previsão mais precisa. Modelos puros implicam que a estrutura consiste apenas de AR ou MA parâmetros - não ambos. Os modelos desenvolvidos por esta abordagem são geralmente chamados de modelos ARIMA porque eles usam uma combinação de auto-regressão (RA), integração (I) - referindo-se ao processo inverso de diferenciação para produzir as operações de previsão e de média móvel (MA). Um modelo ARIMA é geralmente indicado como ARIMA (p, d, q). Isso representa a ordem dos componentes autorregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo médio móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autorregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada uma vez para induzir a estacionaridade. Escolhendo a Especificação Direita: O principal problema no clássico Box-Jenkins está tentando decidir qual especificação ARIMA usar - i. e. Quantos parâmetros AR e / ou MA devem ser incluídos. Isto é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Ela dependia da avaliação gráfica e numérica das funções de autocorrelação da amostra e autocorrelação parcial. Bem, para os seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que parecem uma certa maneira. No entanto, quando você subir em complexidade, os padrões não são tão facilmente detectados. Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isto significa que os erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é uma arte e não uma ciência. A Ciência da Sociedade: Pesquisa, Ensino e Serviço no Interesse Público. UC San Diegos Divisão de Ciências Sociais é uma coleção diversificada de departamentos pendentes, programas e unidades de pesquisa que se concentram em algumas das questões mais urgentes e importantes do nosso tempo. A divisão faz o trabalho que importa, agora e para o futuro. Em um recente podcast de Voice of San Diego, 160Shana Cohen160 dos Estudos de Educação fala sobre como as crianças de origens diferentes às vezes recebem níveis variados De serviços para deficientes de desenvolvimento. Salvar a data 28 de outubro: Robotics Contextual Forum 2017 Com Andrea Chiba, Virgínia de Sa and160Ayse Saygin160of Cognitive Science. Ciências Sociais Dean160Carol Padden160 dará observações. Landmark National Study of Adolescent Brain agora em andamento O Adolescente Brain Cognitive Development estudo seguirá 10.000 crianças por 10 anos, no início da idade adulta. UC San Diego Interdisciplinary Initiative160Hiring160 A universidade está lançando uma iniciativa de todo o campus para contratar tenure-track ou faculdade titular de condução da investigação com o objetivo geral de compreender o conhecimento humano, aprendizagem e criatividade. Nações No. 1 Public University UC San Diego é classificada como a universidade pública número um no país para servir o interesse público, por Washington Monthly. Há uma série de abordagens para a modelagem de séries temporais. Descrevemos algumas das abordagens mais comuns abaixo. Tendência, Decomposições Sazonais, Residuais Uma abordagem consiste em decompor as séries temporais em uma componente tendencial, sazonal e residual. Triplo exponencial suavização é um exemplo desta abordagem. Outro exemplo, denominado loess sazonal, é baseado em mínimos quadrados ponderados localmente e é discutido por Cleveland (1993). Não discutimos o loess sazonal neste manual. Métodos baseados em freqüência Outra abordagem, comumente usada em aplicações científicas e de engenharia, é analisar as séries no domínio da freqüência. Um exemplo desta abordagem na modelagem de um conjunto de dados de tipo sinusoidal é mostrado no estudo de caso de deflexão de feixe. O gráfico espectral é a principal ferramenta para a análise de freqüência de séries temporais. Modelos Autoregressivos (AR) Uma abordagem comum para a modelagem de séries temporais univariadas é o modelo autorregressivo (AR): Xt delta phi1 X phi2 X cdots phip X Em, onde (Xt) é a série temporal, (At) é ruído branco e delta Esquerda (1 - soma p phii direita) mu. Com (mu) denotando a média do processo. Um modelo autorregressivo é simplesmente uma regressão linear do valor atual da série contra um ou mais valores prévios da série. O valor de (p) é chamado a ordem do modelo AR. Os modelos AR podem ser analisados ​​com um dos vários métodos, incluindo técnicas de mínimos quadrados lineares padrão. Eles também têm uma interpretação direta. Modelos de média móvel (MA) Outra abordagem comum para a modelagem de modelos de séries temporais univariadas é o modelo de média móvel (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, onde (Xt) é a série temporal ) É a média da série, (A) são termos de ruído branco, e (theta1,, ldots,, thetaq) são os parâmetros do modelo. O valor de (q) é chamado de ordem do modelo MA. Isto é, um modelo de média móvel é conceitualmente uma regressão linear do valor actual da série contra o ruído branco ou choques aleatórios de um ou mais valores anteriores da série. Os choques aleatórios em cada ponto são assumidos como provenientes da mesma distribuição, tipicamente uma distribuição normal, com localização em zero e escala constante. A distinção neste modelo é que estes choques aleatórios são propogated aos valores futuros das séries de tempo. Ajustar as estimativas MA é mais complicado do que com modelos AR porque os termos de erro não são observáveis. Isto significa que procedimentos de montagem não-linear iterativos precisam ser usados ​​em vez de mínimos quadrados lineares. Os modelos MA também têm uma interpretação menos óbvia do que os modelos AR. Às vezes, o ACF e PACF sugerem que um modelo de MA seria uma melhor escolha de modelo e às vezes tanto AR e MA termos devem ser utilizados no mesmo modelo (ver Secção 6.4.4.5). Observe, entretanto, que os termos de erro após o ajuste do modelo devem ser independentes e seguir as premissas padrão para um processo univariável. Box e Jenkins popularizaram uma abordagem que combina a média móvel e as abordagens autorregressivas no livro Análise de Séries Temporais: Previsão e Controle (Box, Jenkins e Reinsel, 1994). Embora as abordagens de média móvel e autorregressiva fossem já conhecidas (e originalmente investigadas por Yule), a contribuição de Box e Jenkins foi no desenvolvimento de uma metodologia sistemática para identificar e estimar modelos que poderiam incorporar ambas as abordagens. Isso torna Box-Jenkins modelos uma poderosa classe de modelos. As próximas seções discutirão esses modelos detalhadamente. Antes de 1970, econometristas e analistas de séries temporais usaram métodos muito diferentes para modelar uma série de tempo. As séries temporais modeladas por econometristas são uma regressão linear padrão com variáveis ​​explicativas sugeridas pela teoria / intuição econômica para explicar os movimentos em dados de séries temporais. Eles assumiram que as séries cronológicas não-estacionárias (aumento das horas extras) não tiveram efeito sobre sua análise empírica. Os analistas de séries temporais, por outro lado, ignoraram essa análise econométrica tradicional. Eles modelaram uma série de tempo como uma função de seus valores passados. Eles trabalharam em torno do problema da não-estacionariedade diferenciando os dados para torná-lo estacionário. Em seguida, Clive Granger e Paul Newbold aconteceu 1. Os econometristas foram forçados a prestar atenção aos métodos de analistas de séries temporais, o mais famoso dos quais foi a abordagem BoxJenkins desenvolvido por George P Box e Gwilym Jenkins e publicado em sua lendária monografia Time Series Analysis : Previsão e Controle 2. Box e Jenkins alegaram (com sucesso) que os dados não-estacionários podem ser feitos estacionários diferenciando a série. Esta série, mathY / math é a entrada na análise de Box-Jenkins. O modelo geral para mathY / math é escrito como, mathYphi1Y phi2Y. PhipY epsilonttheta1epsilon theta2epsilon. Thetaqepsilon / math onde mathphi / math e maththeta / math são parâmetros desconhecidos e matemática / matemática são termos de erro identicamente distribuídos independentes com média zero. Aqui, mathY / math é apenas expressa em termos de seus valores passados ​​e os valores atuais e passados ​​de termos de erro. Este modelo é denominado Média Movente Integrada Autorestrada ou mathARIMA (p, d, q) / modelo matemático de mathY. p / math é o número de valores defasados ​​de mathY / math que representa a natureza autorregressiva (AR) do modelo, mathq / math É o número de valores defasados ​​do termo de erro que representa a natureza da média móvel (MA) do modelo e mathd / math é o número de vezes que mathY / math tem que ser diferenças para produzir o mathY / math estacionário. O termo integrado implica que, a fim de obter uma previsão de mathY / math. Temos de resumir (ou integrar) os valores de mathY / math porque mathY / math são os valores diferenciados da série original mathY. / Math Se não houver diferenciação está envolvido, este modelo é chamado de média automarregível MathARMA (p, q) / math com mathp / math e mathq / math mantendo seu significado original e nenhum mathd. / Math O termo mathARIMA / math ou mathARMA / math é muito confuso porque ambos, os componentes mathAR / math e mathMA / math têm a mesma forma matemática. São ambas combinações lineares de valores presentes e passados ​​de variáveis ​​aleatórias. O componente mathAR / math é a combinação linear de valores observáveis ​​de mathY / math enquanto o componente mathMA / math é a combinação linear dos termos de perturbação de ruído branco não observáveis. Esta é apenas uma daquelas trivialidades que você se acostumaria com o tempo. Econometricians ignorou a abordagem Box-Jenkins no início, mas foram obrigados a prestar atenção a eles quando ele mathARIMA / previsões de matemática começou consistentemente superando as previsões baseadas em modelagem econométrica padrão. A falta de uma teoria econômica sólida por trás do mathARIMA / matemática era preocupante para econometricians para aceitar. Eles responderam desenvolvendo uma outra classe de modelos que incorporaram os componentes auroregressivos e móveis da abordagem Box-Jenkins com a abordagem das variáveis ​​explicativas da econometria padrão. O mais simples de tais modelos é o mathARIMAX / matemática que é apenas um mathARIMA / matemática com variáveis ​​explicativas adicionais fornecidas pela teoria econômica. Um mathARIMAX / matemática padrão seria escrito como, mathYbeta. X phi1Y phi2Y. PhipY epsilonttheta1epsilon theta2epsilon. Thetaqepsilon / math onde mathX / math pode ser qualquer variável econômica. 3k Vistas middot Ver Upvotes middot Não é para Reprodução Olhe para este link: 8 Modelos ARIMA OTexts Este é o capítulo dedicado aos modelos ARIMA a partir de um livre fantástico livre on-line sobre a previsão de séries temporais de Rob J Hyndman P ordem da parte autorregressiva . Esse é o número de termos desconhecidos que multiplicam seu sinal em tempos passados ​​(tantas vezes passadas como seu valor p) D grau de primeira diferença envolvida. Número de vezes que você tem que diferenciar sua série de tempo para ter uma ordem Q estacionária da parte da média móvel. Esse é o número de termos desconhecidos que multiplicam seus erros de previsão em tempos passados ​​(tantas vezes passadas quanto seu valor q) Existem boas técnicas para estimar todos esses parâmetros (com base nas funções de autocorrelação - ACF - e autocorrelação parcial - PACF): People. duke. edu/ E o processo pode ser complexo e demorado, ainda mais se você tiver muitas séries de tempo para lidar com. Em R há uma função chamada auto. arima no pacote de previsão que avalia automaticamente todos esses parâmetros, mesmo a parte de sazonalidade (valores adicionais para calcular caso haja sazonalidade em sua série de tempo). Os processos de erro médio de deslocamento automático (ARMA) e outros modelos envolvendo atrasos de termos de erro podem ser estimados usando declarações FIT e simulados ou previstos usando declarações SOLVE . Os modelos ARMA para o processo de erro são freqüentemente usados ​​para modelos com resíduos autocorrelacionados. A macro AR pode ser usada para especificar modelos com processos de erro autorregressivo. A macro MA pode ser usada para especificar modelos com processos de erro médio móvel. Erros Autoregressivos Um modelo com erros autoregressivos de primeira ordem, AR (1), tem a forma enquanto um processo de erro AR (2) tem a forma e assim por diante para processos de ordem superior. Observe que os s são independentes e identicamente distribuídos e têm um valor esperado de 0. Um exemplo de um modelo com um componente AR (2) é Você escreveria este modelo da seguinte forma: ou equivalentemente usando a macro AR como Moving Average Models 13 A Modelo com erros de média móvel de primeira ordem, MA (1), tem a forma em que é identicamente e independentemente distribuídos com zero médio. Um processo de erro MA (2) tem a forma e assim por diante para processos de ordem superior. Por exemplo, você pode escrever um modelo de regressão linear simples com MA (2) movendo erros médios como onde MA1 e MA2 são os parâmetros de média móvel. Observe que RESID. Y é automaticamente definido pelo PROC MODEL como Observe que RESID. Y é. A função ZLAG deve ser utilizada para que os modelos de MA trunquem a recursividade dos atrasos. Isso garante que os erros defasados ​​começam em zero na fase de latência e não propagam valores faltantes quando as variáveis ​​de período de atraso são perdidos e asseguram que os erros futuros sejam zero em vez de faltarem durante a simulação ou a previsão. Para obter detalhes sobre as funções de atraso, consulte a seção 34Lag Logic.34 Este modelo escrito usando a macro MA é Formulário Geral para Modelos ARMA O processo geral ARMA (p, q) tem a seguinte forma Um modelo ARMA (p, q) pode ser Especificado como segue, onde AR i e MA j representam os parâmetros de média autorregressiva e móvel para os vários desfasamentos. Você pode usar qualquer nome que desejar para essas variáveis, e há muitas maneiras equivalentes que a especificação poderia ser escrita. Os processos Vector ARMA também podem ser estimados com PROC MODEL. Por exemplo, um processo AR (1) de duas variáveis ​​para os erros das duas variáveis ​​endógenas Y1 e Y2 pode ser especificado da seguinte forma: Problemas de Convergência com Modelos ARMA Os modelos ARMA podem ser difíceis de estimar. Se as estimativas dos parâmetros não estiverem dentro do intervalo apropriado, os termos residuais dos modelos de média móvel crescerão exponencialmente. Os resíduos calculados para observações posteriores podem ser muito grandes ou podem transbordar. Isso pode acontecer porque os valores iniciais inadequados foram usados ​​ou porque as iterações se afastaram de valores razoáveis. Cuidado deve ser usado na escolha de valores iniciais para ARMA parâmetros. Os valores iniciais de .001 para parâmetros ARMA normalmente funcionam se o modelo se encaixa bem nos dados eo problema está bem condicionado. Note-se que um modelo MA pode muitas vezes ser aproximado por um modelo AR de alta ordem, e vice-versa. Isto pode resultar em alta colinearidade em modelos ARMA mistos, o que por sua vez pode causar grave mal-condicionamento nos cálculos e instabilidade das estimativas dos parâmetros. Se você tiver problemas de convergência ao estimar um modelo com processos de erro ARMA, tente estimar em etapas. Primeiro, use uma declaração FIT para estimar apenas os parâmetros estruturais com os parâmetros ARMA mantidos a zero (ou a estimativas anteriores razoáveis ​​se disponíveis). Em seguida, use outra instrução FIT para estimar os parâmetros ARMA somente, usando os valores de parâmetro estrutural da primeira execução. Uma vez que os valores dos parâmetros estruturais são susceptíveis de estar perto de suas estimativas finais, as estimativas de parâmetros ARMA podem agora convergir. Finalmente, use outra instrução FIT para produzir estimativas simultâneas de todos os parâmetros. Uma vez que os valores iniciais dos parâmetros são agora provavelmente muito próximos de suas estimativas conjuntas finais, as estimativas devem convergir rapidamente se o modelo for apropriado para os dados. AR Condições iniciais 13 13 13 13 13 13 13 13 13 13 Os retornos iniciais dos termos de erro dos modelos AR (p) podem ser modelados de diferentes maneiras. Os métodos de inicialização de erros autorregressivos suportados pelos procedimentos SAS / ETS são os seguintes: mínimos quadrados condicionais CLS (procedimentos ARIMA e MODEL) ULS mínimos quadrados incondicionais (procedimentos AUTOREG, ARIMA e MODEL) ML máxima verossimilhança (procedimentos AUTOREG, ARIMA e MODEL) YW Yule-Walker (procedimento AUTOREG somente) HL Hildreth-Lu, que exclui as primeiras p observações (somente procedimento MODEL) Consulte o Capítulo 8 para uma explicação e discussão dos méritos de vários métodos de inicialização AR (p). As inicializações de CLS, ULS, ML e HL podem ser realizadas pelo PROC MODEL. Para erros de AR (1), estas inicializações podem ser produzidas como mostrado na Tabela 14.2. Estes métodos são equivalentes em amostras grandes. Os retornos iniciais dos termos de erro dos modelos MA (q) também podem ser modelados de diferentes maneiras. Os seguintes paradigmas de inicialização de erros de média móvel são suportados pelos procedimentos ARIMA e MODELO: ULS incondicional mínimos quadrados CLS condicional mínimos quadrados ML máxima verossimilhança O método de mínimos quadrados condicionais de estimar termos de erro médio móvel não é ótimo porque ignora o problema de inicialização. Isso reduz a eficiência das estimativas, embora permaneçam imparciais. Os resíduos atrasados ​​iniciais, que se estendem antes do início dos dados, são assumidos como 0, o seu valor esperado incondicional. Isto introduz uma diferença entre estes resíduos e os resíduos de mínimos quadrados generalizados para a covariância média móvel, que, ao contrário do modelo autorregressivo, persiste através do conjunto de dados. Normalmente esta diferença converge rapidamente para 0, mas para processos de média móvel quase não-reversíveis a convergência é bastante lenta. Para minimizar este problema, você deve ter abundância de dados, e as estimativas de parâmetros de média móvel devem estar bem dentro do intervalo de inversão. Este problema pode ser corrigido à custa de escrever um programa mais complexo. As estimativas de mínimos quadrados incondicionais para o processo MA (1) podem ser produzidas especificando-se o modelo como segue: Erros de média móvel podem ser difíceis de estimar. Você deve considerar usar uma aproximação AR (p) para o processo de média móvel. Um processo de média móvel geralmente pode ser bem aproximado por um processo autorregressivo se os dados não tiverem sido suavizados ou diferenciados. A macro AR A macro SAS gera instruções de programação para MODELO PROC para modelos autorregressivos. A macro AR é parte do software SAS / ETS e nenhuma opção especial precisa ser definida para usar a macro. O processo autorregressivo pode ser aplicado aos erros de equações estruturais ou às próprias séries endógenas. A macro AR pode ser usada para autorregressão univariada, autorregressão vetorial irrestrita e autorregressão vetorial restrita. Para modelar o termo de erro de uma equação como um processo autorregressivo, use a seguinte instrução após a equação: Por exemplo, suponha que Y seja uma função linear de X1 e X2 e um erro de AR (2). Você escreveria este modelo da seguinte maneira: As chamadas para AR devem vir depois de todas as equações às quais o processo se aplica. A invocação macro de procedimento, AR (y, 2), produz as instruções mostradas na saída LIST na Figura 14.49. Figura 14.50: Saída da opção LIST para um modelo AR com Lags em 1, 12 e 13 Existem variações no método dos mínimos quadrados condicionais, dependendo se as observações no início da série são usadas para acelerar o processo AR. Por padrão, o método de mínimos quadrados condicionais AR usa todas as observações e assume zeros para os retornos iniciais de termos autorregressivos. Usando a opção M, você pode solicitar que AR use o método de mínimos quadrados incondicionais (ULS) ou de máxima verossimilhança (ML). Por exemplo: Discussões sobre esses métodos são fornecidas nas Condições 34AR Inicial 34 anteriormente nesta seção. Usando a opção MCLS n, você pode solicitar que as primeiras n observações sejam usadas para calcular estimativas dos atrasos autorregressivos iniciais. Neste caso, a análise começa com a observação n 1. Por exemplo: Você pode usar a macro AR para aplicar um modelo autorregressivo à variável endógena, em vez de ao termo de erro, usando a opção TYPEV. Por exemplo, se você quiser adicionar os cinco atrasos anteriores de Y à equação no exemplo anterior, você pode usar AR para gerar os parâmetros e os retornos usando as seguintes instruções: As instruções anteriores geram a saída mostrada na Figura 14.51. O MODELO Procedimento Listagem de Código de Programa Compilado como Parsed PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y) il2 ZLAG2 (y ) Il3 ZLAG3 (y) il4 ZLAG4 (y) il5 ZLAG5 (y) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y Figura 14.51: LIST Option Output para um modelo AR de Y Este modelo prediz Y Como uma combinação linear de X1, X2, um intercepto, e os valores de Y nos cinco períodos mais recentes. Para modelar os termos de erro de um conjunto de equações como um processo autorregressivo de vetor, use a seguinte forma da macro AR após as equações: O valor do nome do processo é qualquer nome que você fornece para que o AR use para fazer nomes para o Parâmetros auto-regressivos. Você pode usar a macro AR para modelar vários processos AR diferentes para diferentes conjuntos de equações usando diferentes nomes de processo para cada conjunto. O nome do processo garante que os nomes de variáveis ​​usados ​​são exclusivos. Use um valor processname curto para o processo se as estimativas de parâmetro forem gravadas em um conjunto de dados de saída. A macro AR tenta construir nomes de parâmetro com menos ou igual a oito caracteres, mas isso é limitado pelo comprimento do nome. Que é usado como um prefixo para os nomes de parâmetro AR. O valor da lista de variáveis ​​é a lista de variáveis ​​endógenas para as equações. Por exemplo, suponha que erros para as equações Y1, Y2 e Y3 sejam gerados por um processo autorregressivo de vetor de segunda ordem. Você pode usar as seguintes instruções: que gera o seguinte para Y1 e código semelhante para Y2 e Y3: Somente o método de mínimos quadrados condicionais (MCLS ou MCLS n) pode ser usado para processos vetoriais. Você também pode usar o mesmo formulário com restrições de que a matriz de coeficientes seja 0 em intervalos selecionados. Por exemplo, as declarações aplicam um processo vetorial de terceira ordem aos erros de equação com todos os coeficientes no intervalo 2 restrito a 0 e com os coeficientes nos retornos 1 e 3 sem restrições. Você pode modelar as três séries Y1-Y3 como um processo autorregressivo de vetor nas variáveis ​​em vez de nos erros usando a opção TYPEV. Se você deseja modelar Y1-Y3 como uma função de valores passados ​​de Y1-Y3 e algumas variáveis ​​exógenas ou constantes, você pode usar AR para gerar as declarações para os termos lag. Escreva uma equação para cada variável para a parte não autorregressiva do modelo e, em seguida, chame AR com a opção TYPEV. Por exemplo, a parte não autorregressiva do modelo pode ser uma função de variáveis ​​exógenas, ou pode ser parâmetros de interceptação. Se não houver componentes exógenos para o modelo de auto-regressão do vetor, incluindo sem interceptações, então atribua zero a cada uma das variáveis. Deve haver uma atribuição para cada uma das variáveis ​​antes de AR é chamado. Este exemplo modela o vetor Y (Y1 Y2 Y3) como uma função linear apenas do seu valor nos dois períodos anteriores e um vetor de erro de ruído branco. O modelo tem 18 (3 vezes 3 3 vezes 3) parâmetros. Sintaxe da Macro AR Existem dois casos da sintaxe da macro AR. O primeiro tem o nome do formulário geral especifica um prefixo para AR para usar na construção de nomes de variáveis ​​necessárias para definir o processo AR. Se o endolist não é especificado, a lista endógena padrão é nome. Que deve ser o nome da equação à qual o processo de erro AR deve ser aplicado. O valor do nome não pode exceder oito caracteres. Nlag é a ordem do processo AR. Endolist especifica a lista de equações às quais o processo AR deve ser aplicado. Se for dado mais de um nome, é criado um processo vetorial sem restrições com os resíduos estruturais de todas as equações incluídas como regressores em cada uma das equações. Se não for especificado, o endolist predefinirá o nome. Laglist especifica a lista de atrasos em que os termos AR devem ser adicionados. Os coeficientes dos termos em intervalos não listados são definidos como 0. Todos os atrasos listados devem ser menores ou iguais a nlag. E não deve haver duplicatas. Se não for especificado, o laglist padrão para todos os atrasos 1 através de nag. M método especifica o método de estimativa a implementar. Os valores válidos de M são CLS (estimativas de mínimos quadrados condicionais), ULS (estimativas de mínimos quadrados incondicionais) e ML (estimativas de máxima verossimilhança). MCLS é o padrão. Somente o MCLS é permitido quando mais de uma equação é especificada. Os métodos ULS e ML não são suportados para modelos AR de AR por AR. TYPEV especifica que o processo AR deve ser aplicado às próprias variáveis ​​endógenas em vez de aos resíduos estruturais das equações. Você pode controlar quais parâmetros são incluídos no processo, restringindo os parâmetros que você não inclui a 0. Primeiro, use AR com a opção DEFER para declarar a lista de variáveis ​​e definir a dimensão do processo. Em seguida, use chamadas AR adicionais para gerar termos para equações selecionadas com variáveis ​​selecionadas em intervalos selecionados. Por exemplo, as equações de erro produzidas são: Este modelo indica que os erros para Y1 dependem dos erros de Y1 e Y2 (mas não Y3) nos dois intervalos 1 e 2 e que os erros para Y2 e Y3 dependem dos erros anteriores Para todas as três variáveis, mas somente com atraso 1. AR Macro Sintaxe para AR Restrito AR Um uso alternativo de AR é permitido para impor restrições em um processo AR vetorial chamando AR várias vezes para especificar diferentes termos AR e lags para diferentes equações. A primeira chamada tem o nome do formulário geral especifica um prefixo para AR a ser usado na construção de nomes de variáveis ​​necessárias para definir o processo AR do vetor. Nlag especifica a ordem do processo AR. Endolist especifica a lista de equações às quais o processo AR deve ser aplicado. DEFER especifica que AR não é para gerar o processo AR, mas é esperar por mais informações especificadas em chamadas AR posterior para o mesmo valor de nome. As chamadas subsequentes têm o nome de formulário geral é o mesmo que na primeira chamada. Eqlist especifica a lista de equações às quais as especificações nesta chamada AR devem ser aplicadas. Somente os nomes especificados no valor endolist da primeira chamada para o valor de nome podem aparecer na lista de equações na lista de eqlist. Varlist especifica a lista de equações cujos resíduos estruturais retardados devem ser incluídos como regressores nas equações em eqlist. Somente nomes no endolist da primeira chamada para o valor de nome podem aparecer em varlist. Se não for especificado, varlist padrão para endolist. Laglist especifica a lista de atrasos em que os termos AR devem ser adicionados. Os coeficientes dos termos em intervalos não listados são definidos como 0. Todos os atrasos listados devem ser menores ou iguais ao valor de nlag. E não deve haver duplicatas. Se não for especificado, o laglist irá usar todos os intervalos 1 a nlag. O MA Macro 13 O SAS macro MA gera instruções de programação para PROC MODEL para mover modelos médios. A macro MA faz parte do software SAS / ETS e não são necessárias opções especiais para utilizar a macro. O processo de erro de média móvel pode ser aplicado aos erros da equação estrutural. A sintaxe da macro MA é o mesmo que a macro AR, exceto que não há argumento TYPE. 13 Quando você estiver usando as macros MA e AR combinadas, a macro MA deve seguir a macro AR. As seguintes instruções SAS / IML produzem um processo de erro ARMA (1, (1 3)) e salvam-no no conjunto de dados MADAT2. As seguintes instruções PROC MODEL são usadas para estimar os parâmetros deste modelo usando a estrutura de erro de máxima verossimilhança: As estimativas dos parâmetros produzidos por esta execução são mostradas na Figura 14.52. Máxima Verossimilhança ARMA (1, (1 3)) Figura 14.52: Estimativas de uma ARMA (1, (1 3)) Sintaxe de Processo da Macro MA Existem dois casos da sintaxe para a macro MA. O primeiro tem o nome do formulário geral especifica um prefixo para MA para usar na construção de nomes de variáveis ​​necessárias para definir o processo MA e é o endolist padrão. Nlag é a ordem do processo MA. Endolist especifica as equações às quais o processo MA deve ser aplicado. Se for dado mais de um nome, a estimativa de CLS é usada para o processo de vetor. Laglist especifica os atrasos em que os termos MA são para ser adicionado. Todos os atrasos listados devem ser menores ou iguais a nlag. E não deve haver duplicatas. Se não for especificado, o laglist padrão para todos os atrasos 1 através de nag. M método especifica o método de estimativa a implementar. Os valores válidos de M são CLS (estimativas de mínimos quadrados condicionais), ULS (estimativas de mínimos quadrados incondicionais) e ML (estimativas de máxima verossimilhança). MCLS é o padrão. Somente o MCLS é permitido quando mais de uma equação é especificada no endolist. Um uso alternativo de MA é permitido para impor restrições em um processo de MA de vetor, chamando MA várias vezes para especificar diferentes termos MA e defasagens para diferentes equações. A primeira chamada tem o nome do formulário geral especifica um prefixo para MA para usar na construção de nomes de variáveis ​​necessárias para definir o processo MA vetor. Nlag especifica a ordem do processo MA. Endolist especifica a lista de equações às quais o processo MA deve ser aplicado. DEFER especifica que MA não é para gerar o processo de MA, mas é aguardar informações adicionais especificadas em chamadas de MA posterior para o mesmo valor de nome. As chamadas subsequentes têm o nome de formulário geral é o mesmo que na primeira chamada. Eqlist especifica a lista de equações às quais as especificações nesta chamada MA devem ser aplicadas. Varlist especifica a lista de equações cujos resíduos estruturais retardados devem ser incluídos como regressores nas equações em eqlist. Laglist especifica a lista de defasagens em que os termos MA devem ser adicionados.

No comments:

Post a Comment