Moving Average Random Walk


Modelo de caminhada aleatória Quando confrontado com uma série de tempo que mostra crescimento irregular, como X2 analisado anteriormente, a melhor estratégia pode não ser tentar prever diretamente o nível da série em cada período (ou seja, a quantidade Y t). Em vez disso, pode ser melhor tentar prever a alteração que ocorre de um período para o próximo (ou seja, a quantidade Y t - Y t-1). Ou seja, pode ser melhor olhar para a primeira diferença da série, para ver se um padrão previsível pode ser encontrado lá. Para fins de previsão de um período antecipado, é tão bom prever a próxima mudança quanto a prever o próximo nível da série, uma vez que a mudança prevista pode ser adicionada ao nível atual para render um nível previsto. O caso mais simples desse modelo é aquele que sempre prediz que a próxima mudança será zero, como se a série fosse igualmente provável de subir ou descer no próximo período, independentemente do que fez no passado. Heres uma imagem que ilustra um processo aleatório para o qual este modelo é apropriado: Em cada período de tempo, indo da esquerda para a direita, o valor da variável toma um passo aleatório independente para cima ou para baixo, um chamado passeio aleatório. Se os movimentos para cima e para baixo forem igualmente prováveis ​​em cada interseção, então todos os possíveis caminhos da esquerda para a direita através da grade são igualmente prováveis ​​a priori. Veja este link para uma boa simulação. Uma analogia comumente usada é a de um bêbado que cambaleia aleatoriamente para a esquerda ou para a direita quando ele tenta avançar: o caminho que ele traça será uma caminhada aleatória. Para um exemplo do mundo real, considere a taxa de câmbio diária do dólar americano para o euro. Uma trama de toda a sua história de 1 de janeiro de 1999 a 5 de dezembro de 2014 (4006 observações) se parece com isto: O padrão histórico parece bastante interessante, com muitos picos e vales. (QuotChartists muitas vezes tentam extrapolar esses padrões, ajustando as linhas de tendência local ou curvas, que eu não recomendo. Em média, 49 deles corretamente adivinhar a direção em que o mercado se moverá entre hoje e alguma data futura dada). Agora, Heres um gráfico das mudanças diárias (primeira diferença): A volatilidade (variação) não tem sido constante ao longo do tempo, mas as mudanças diárias são quase completamente aleatórias, como mostrado por um gráfico de suas autocorrelações. A autocorrelação a lag k é a correlação entre a variável e ela mesma retardada por k períodos. Se os valores na série são completamente aleatórios no sentido de serem estatisticamente independentes, os valores verdadeiros das autocorrelações são zero, e os valores estimados não devem ser significativamente diferentes de zero. As linhas vermelhas neste gráfico são bandas de significância para testar se as autocorrelações das mudanças diárias são diferentes de zero no nível de significância de 0,05 e, em geral, não são. Em particular, são completamente insignificantes nos primeiros intervalos e não há um padrão sistemático. (Para grandes amostras, as autocorrelações são significativamente diferentes de zero no nível de 0,05 se sua magnitude exceder mais ou menos dois dividido pela raiz quadrada do tamanho da amostra. Aqui o tamanho da amostra é 4006 e 2 / SQRT (4006) é O modelo de previsão sugerido por essas parcelas é aquele que simplesmente não prevê nenhuma mudança de um período para o outro, porque os dados passados ​​não fornecem nenhuma informação sobre a direção do futuro Movimentos: Este é o chamado modelo aleatório-andar-sem-deriva. Ele assume que, em cada ponto no tempo, a série apenas tira um passo aleatório da sua última posição gravada, com passos cujo valor médio é zero. Se o tamanho médio do passo é algum valor diferente de zero 945. o processo é dito ser um random-walk - com - drift. Cuja equação de previsão é 374 t Y t-1 945. O bêbado na imagem acima está faltando um sapato, então ele estava provavelmente à deriva. Em geral, as etapas podem ser variáveis ​​aleatórias discretas ou contínuas e a escala de tempo também pode ser discreta ou contínua. Padrões aleatórios de caminhada são comumente vistos em históricos de preços de ativos financeiros para os quais existem mercados especulativos, como ações e moedas. Isso não significa que os movimentos desses preços sejam aleatórios no sentido de serem sem propósito. Quando eles vão para cima e para baixo, é sempre por uma razão Mas a direção do próximo movimento não pode ser predita ex ante: só pode ser explicada ex post, porque se a direção ea magnitude do próximo movimento de preços poderia ter sido prevista em Então, os especuladores já teriam feito uma oferta para cima ou para baixo por esse montante. Padrões aleatórios de caminhada também são amplamente encontrados em outros lugares da natureza, por exemplo, no fenômeno do movimento browniano que foi explicado pela primeira vez por Einstein. É difícil dizer se o tamanho de passo médio em uma caminhada aleatória é realmente zero, e muito menos estimar seu valor exato, simplesmente observando a amostra de dados históricos. Se você simular um processo de caminhada aleatória (por exemplo, ao criar um modelo de planilha que usa a função RAND () na fórmula para gerar os valores de etapa), você normalmente verificará que iterações diferentes do mesmo modelo produzirão imagens dramaticamente diferentes, Muitos dos quais terão tendências de aparência significativa, como mostrado no link de simulação mencionado acima. Na verdade, o mesmo modelo normalmente gerará tendências tanto para cima como para baixo em iterações repetidas, bem como curvas de aparência interessante que parecem exigir algum tipo de modelo complexo. Esta é apenas uma ilusão estatística, como a chamada mão quotum em basquetebol e outros exemplos de quotstreakinessquot em esportes. Seu cérebro tenta difícil encontrar padrões, mesmo quando eles não estão lá. Veja o Hot Hand no site Sports para mais informações sobre este assunto. Em aplicações, é melhor recorrer a outras fontes de informação e a considerações teóricas para decidir se deve incluir um termo de deriva no modelo e, em caso afirmativo, como estimar o seu valor. No caso das taxas de câmbio, não há razão para assumir uma tendência de longo prazo em um sentido ou outro, pelo menos, não uma tendência que se destacaria contra o ruído. A média da variação diária é 0,000012 para esta amostra de dados de taxa de câmbio e o erro padrão da média é 0,00012, portanto a média da amostra é diferente de zero em apenas 1/10 de um erro padrão, que não é significativo por qualquer medida . Mais uma vez, no entanto, o valor médio das etapas em uma amostra finita de dados aleatórios geralmente não fornece uma boa estimativa da taxa atual de deriva, se houver. Em geral, então, parece que um modelo aleatório-andar-sem-deriva é apropriado para esta série de tempo. Se o modelo é ajustado a toda a história dos dados diários, voltando a 1999, as previsões e os 50 limites de confiança produzidos pelo modelo se parecem com os seguintes: (Este gráfico foi produzido pela Statgraphics. Torná-los se encaixam melhor na imagem. Não há nada de especial sobre 95 de qualquer maneira, para além da convenção.) Aqui está uma visão de close-up dos pontos de dados reais e previsões no final da série: As principais propriedades do modelo que São ilustrados por este gráfico são os seguintes: a. As previsões de um passo adiante dentro da amostra seguem exatamente o mesmo caminho que os dados. Exceto que ficam atrás por um período. (Você deve olhar com cuidado para ver isso: à primeira vista pode parecer que o modelo se encaixa perfeitamente os dados, mas na verdade está fazendo erros em cada período, e esses erros são variáveis ​​aleatórias independentes.) B. As previsões a longo prazo fora da amostra seguem uma linha horizontal horizontal ancorada no último valor observado. Porque não é assumida qualquer deriva ascendente ou descendente ou qualquer outro padrão de tempo sistemático. (Se uma deriva não nula foi assumida, esta linha pode declinar para cima ou para baixo.) C. As faixas de confiança para as previsões de longo prazo crescem de uma forma que parece uma parábola lateral. Pelas razões explicadas abaixo. (Return to top of page.) No modelo randômico-sem-deriva, o erro padrão da previsão de 1 passo à frente é o valor quadrático-médio das alterações período-período na amostra de dados , Ou seja, é a raiz quadrada da média dos valores quadrados da primeira diferença da série. Para um passeio randômico-randonneiro, o erro padrão de previsão é o desvio-padrão da amostra das mudanças período-período. (A diferença entre o valor de RMS e o desvio padrão das mudanças é geralmente negligenciável a menos que a volatilidade seja muito pequena em comparação com a deriva). O erro que o modelo faz em uma previsão k-step-ahead é a soma de k independentemente E variáveis ​​aleatórias identicamente distribuídas, porque o modelo continua a fazer a mesma predição enquanto a variável toma k passos aleatórios. Como a variância de uma soma de variáveis ​​aleatórias independentes é a soma das variâncias, segue-se que a variância do erro de previsão k-step-ahead é maior do que a previsão de um período-adiante por um fator de k. E como o desvio padrão do erro de previsão é a raiz quadrada de sua variância, segue-se que o erro padrão de uma previsão k-step-ahead é maior do que a previsão de um passo adiante por um fator de raiz quadrada - of-k. Esta é a chamada raiz quotsquare da regra timequot para os erros das previsões randômicas, e explica a forma parabólica lateral das faixas de confiança para as previsões de longo prazo: essa é a forma do gráfico de YSQRT (X). Para essa amostra de dados muito grande, o valor médio-quadrado da raiz e o desvio padrão da amostra das mudanças diárias são ambos iguais a 0,00778 a 3 dígitos significativos, portanto o erro padrão de um erro de previsão k-step ahead é 0,00778SQRT (k ), E os limites de confiança são calculados a partir dele da maneira usual. Um intervalo de 95 é (aproximadamente) a previsão de pontos mais ou menos 2 erros padrão, e um intervalo de confiança de 50 é a previsão de pontos mais ou menos dois terços de um erro padrão. No caso dos dados de taxa de câmbio, não é realmente apropriado usar toda a amostra para estimar o desvio padrão das mudanças diárias, porque claramente não tem sido constante ao longo do tempo. Um histórico de dados mais curto poderia ser usado para resolver esse problema, e outros tipos de informações, como preços de opções de câmbio também poderiam ser considerados. O modelo de caminhada aleatória pode parecer trivial se você nunca o viu antes: o que poderia ser mais simples de mente do que sempre prever que amanhã será o mesmo que hoje Isto não requer mesmo qualquer conhecimento de estatística Por esse motivo, às vezes é chamado de No entanto, não é de todo trivial. O padrão de praça-raiz do tempo em suas faixas de confiança para as previsões de longo prazo é de profunda importância nas finanças (é a base da teoria de preços de opções), eo modelo de caminhada aleatória muitas vezes fornece um bom ponto de referência contra o qual Julgar o desempenho de modelos mais complicados. O modelo de caminhada aleatória também pode ser visto como um caso especial importante de um modelo ARIMA (quotautoregressive média móvel integrada). Especificamente, é um modelo quotARIMA (0,1,0) quot. Modelos ARIMA mais gerais são capazes de lidar com padrões de tempo mais interessantes que envolvem etapas correlacionadas, como reversão média, oscilação, médias variáveis ​​no tempo e sazonalidade. Esses tópicos são discutidos em detalhes nas páginas ARIMA destas notas. Para uma discussão muito mais completa do modelo de caminhada aleatória, ilustrada por uma amostra mais curta dos dados de taxa de câmbio, consulte as Notas quot no folheto de modelo de passeio randômico. A equivalência é válida somente para certos modelos, p. O ruído de passeio aleatório EWMA ou tendência linear local holt-invernos EWMA. Modelos de espaço de estado são muito mais gerais do que lisos personalizados. Também a inicialização tem bases teóricas mais sólidas. Se você quiser ficar com o ruído de caminhada aleatória, e você não está familiarizado com o filtro Kalman, então você pode ser melhor com EWMAs. A equivalência de filtro de Kalman com EWMA é apenas para o caso de uma caminhada aleatória mais ruído e é coberto no livro, Forecast Structural Time Series Model e Kalman Filter por Andrew Harvey . A equivalência de EWMA com filtro de Kalman para caminhada aleatória com ruído é abordada na página 175 do texto. Lá, o autor também menciona que a equivalência dos dois foi mostrada pela primeira vez em 1960 e dá a referência a ela. Aqui está o link para essa página do texto: books. google/booksidKc6tnRHBwLcCamppgPA175amplpgPA175ampdqewmaandkalmanforrandomwalkwithnoiseampsourceblampotsI3VOQsYZOCampsigRdUCwgFE1s7zrPFylF3e3HxIUNYamphlenampsaXampved0ahUKEwiK5t2J84HMAhWINSYKHcmyAXkQ6AEINDADvonepageampqewma20and20kalman20for20random20walk20with20noiseampffalse Agora aqui é a referência que cobre uma ALETERNATIVE ao Kalman e filtros de Kalman estendido - foram obtidos resultados que correspondem ao filtro de Kalman, mas os resultados são obtidos muito mais rapidamente É Double suavização exponencial: uma alternativa ao rastreamento preditivo baseado em filtro de Kalman. Em Abstract of the paper (ver abaixo) os autores afirmam. Resultados empíricos que confirmam a validade de nossas alegações de que esses preditores são mais rápidos, mais fáceis de implementar e funcionam de forma equivalente aos preditores de filtragem de Kalman e de Kalman estendidos. Este é o seu Resumo Apresentamos novos algoritmos para o rastreamento preditivo da posição do usuário e orientação com base no duplo exponencial suavização. Esses algoritmos, quando comparados com Kalman e preditores extensivos com base em filtros de Kalman com modelos de medição sem derivada, são executados aproximadamente 135 vezes mais rápido com desempenho de predição equivalente e implementações mais simples. Este artigo descreve esses algoritmos detalhadamente juntamente com os preditores Kalman e filtro estendido de Kalman testados contra. Além disso, descrevemos os detalhes de uma experiência preditora e apresentamos resultados empíricos que confirmam a validade de nossas alegações de que esses preditores são mais rápidos, mais fáceis de implementar e funcionam de forma equivalente aos preditores de filtragem de Kalman e extensão de Kalman. Eu acho que isso realmente responde à pergunta sobre por que o filtro de Kalman e MA dão resultados semelhantes, mas está tangencialmente relacionado. Você poderia adicionar uma reverência completa para o papel que você citar, ao invés de um hiperlink nua Isso seria à prova de futuro a sua resposta no caso de o link externo muda. Ndash Silverfish Apr 8 at 5:46 Não era suposto ser. Como a introdução diz, it39s significou ser uma alternativa a Kalaman mas muito mais rapidamente. Se ele ou outro método foi citando exatamente o mesmo que Kalman, com base no tópico do artigo, o autor teria mencionado. A esse respeito, a questão é respondida. Ndash jimmeh Apr 9 at 12:15 A equivalência de filtro de Kalman para caminhada aleatória com EWMA é abordada no livro Forecast Structural Time Series Model e Kalman Filter por Andrew Harvey. A equivalência de EWMA com filtro de Kalman para caminhada aleatória é abordada na página 175 do texto. Lá ele menciona que foi exibido pela primeira vez em 1960 e dá a referência. Ndash jimmeh Apr 9 at 12: 54Movendo modelos de suavização média e exponencial Como um primeiro passo para ultrapassar os modelos de média, modelos de caminhada aleatória e modelos de tendência linear, padrões e tendências não sazonais podem ser extrapolados usando um modelo de média móvel ou suavização. A suposição básica por trás dos modelos de média e suavização é que a série temporal é localmente estacionária com uma média lentamente variável. Assim, tomamos uma média móvel (local) para estimar o valor atual da média e então usamos isso como a previsão para o futuro próximo. Isto pode ser considerado como um compromisso entre o modelo médio e o modelo aleatório-andar-sem-deriva. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel é muitas vezes chamado de uma versão quotsmoothedquot da série original, porque a média de curto prazo tem o efeito de suavizar os solavancos na série original. Ajustando o grau de suavização (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ótimo entre o desempenho dos modelos de caminhada média e aleatória. O tipo mais simples de modelo de média é o. Média Móvel Simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para ficar Para uma previsão da série temporal Y feita o mais cedo possível antes de um determinado modelo). Esta média é centrada no período t (m1) / 2, o que implica que a estimativa da média local tenderá a ficar para trás Valor real da média local em cerca de (m1) / 2 períodos. Dessa forma, dizemos que a idade média dos dados na média móvel simples é (m1) / 2 relativa ao período para o qual a previsão é calculada: é a quantidade de tempo em que as previsões tendem a ficar atrás dos pontos de inflexão na dados. Por exemplo, se você estiver calculando a média dos últimos 5 valores, as previsões serão cerca de 3 períodos atrasados ​​em responder a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m é muito grande (comparável ao comprimento do período de estimação), o modelo SMA é equivalente ao modelo médio. Como com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfitquot aos dados, isto é, os erros de previsão mais pequenos em média. Aqui está um exemplo de uma série que parece apresentar flutuações aleatórias em torno de uma média de variação lenta. Primeiro, vamos tentar ajustá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de um termo: O modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo ele escolhe grande parte do quotnoise no Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentarmos uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais suaves: A média móvel simples de 5 períodos produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nessa previsão é de 3 ((51) / 2), de modo que ela tende a ficar atrás de pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não virar até vários períodos mais tarde.) Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se alargam à medida que o horizonte de previsão aumenta. Isto obviamente não é correto Infelizmente, não há nenhuma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para este modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões de longo prazo. Por exemplo, você poderia configurar uma planilha na qual o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc. dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de longo prazo adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obtemos previsões ainda mais suaves e mais de um efeito retardado: A idade média é agora de 5 períodos ((91) / 2). Se tomarmos uma média móvel de 19 períodos, a idade média aumenta para 10: Observe que, na verdade, as previsões estão agora atrasadas por pontos de inflexão em cerca de 10 períodos. Qual a quantidade de suavização é melhor para esta série Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3-termo: Modelo C, a média móvel de 5-termo, rende o menor valor de RMSE por uma pequena margem sobre o 3 E médias de 9-termo, e suas outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erro muito semelhantes, podemos escolher se preferiríamos um pouco mais de resposta ou um pouco mais de suavidade nas previsões. O modelo de média móvel simples descrito acima tem a propriedade indesejável de tratar as últimas k observações igualmente e completamente ignora todas as observações anteriores. (Voltar ao início da página.) Marrons Simples Exponencial Suavização (exponencialmente ponderada média móvel) Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que a segunda mais recente, ea segunda mais recente deve ter um pouco mais de peso que a 3ª mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Vamos 945 denotar uma constante quotsmoothingquot (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série, conforme estimado a partir dos dados até o presente. O valor de L no tempo t é calculado recursivamente a partir de seu próprio valor anterior como este: Assim, o valor suavizado atual é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: Na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior por uma fração 945. é o erro feito em Tempo t. Na terceira versão, a previsão é uma média móvel exponencialmente ponderada (ou seja, descontada) com o fator de desconto 1- 945: A versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: Célula única e contém referências de células que apontam para a previsão anterior, a observação anterior ea célula onde o valor de 945 é armazenado. Observe que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, assumindo que o primeiro valor suavizado é definido igual à média. A idade média dos dados na previsão de suavização exponencial simples é de 1/945 em relação ao período para o qual a previsão é calculada. (Isso não é suposto ser óbvio, mas pode ser facilmente demonstrado através da avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a ficar para trás de pontos de viragem em cerca de 1/945 períodos. Por exemplo, quando 945 0,5 o atraso é 2 períodos quando 945 0,2 o atraso é de 5 períodos quando 945 0,1 o atraso é de 10 períodos, e assim por diante. Para uma determinada idade média (isto é, a quantidade de atraso), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão de média móvel simples (SMA) porque coloca relativamente mais peso na observação mais recente - ie. É ligeiramente mais quotresponsivequot às mudanças que ocorrem no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 têm uma idade média de 5 para os dados nas suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no modelo SMA. Outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, de modo que pode ser facilmente otimizado Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor óptimo de 945 no modelo SES para esta série revela-se 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é de 1 / 0.2961 3.4 períodos, que é semelhante ao de um 6-termo simples de movimento média. As previsões a longo prazo do modelo SES são uma linha reta horizontal. Como no modelo SMA eo modelo de caminhada aleatória sem crescimento. No entanto, note que os intervalos de confiança calculados por Statgraphics agora divergem de uma forma razoavelmente aparente, e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um tanto mais previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. De modo que a teoria estatística dos modelos ARIMA fornece uma base sólida para o cálculo de intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como um modelo quimétrico ARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1-945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante à série aqui analisada, o coeficiente MA estimado (1) resulta ser 0,7029, que é quase exatamente um menos 0,2961. É possível adicionar a hipótese de uma tendência linear constante não-zero para um modelo SES. Para isso, basta especificar um modelo ARIMA com uma diferença não sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão então uma tendência que é igual à tendência média observada ao longo de todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desativadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial de longo prazo constante a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa adequada de inflação (crescimento percentual) por período pode ser estimada como o coeficiente de declive num modelo de tendência linear ajustado aos dados em conjunção com uma transformação de logaritmo natural, ou pode basear-se noutras informações independentes relativas às perspectivas de crescimento a longo prazo . (Retornar ao início da página.) Browns Linear (ie double) Suavização exponencial Os modelos SMA e SES assumem que não há nenhuma tendência de qualquer tipo nos dados (que geralmente é OK ou pelo menos não muito ruim para 1- Antecipadamente quando os dados são relativamente ruidosos) e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. O que acontece com as tendências a curto prazo Se uma série exibe uma taxa variável de crescimento ou um padrão cíclico que se destaque claramente contra o ruído, e se houver uma necessidade de prever mais de um período à frente, a estimativa de uma tendência local também pode ser um problema. O modelo de suavização exponencial simples pode ser generalizado para obter um modelo de suavização exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência de variação de tempo mais simples é o modelo de alisamento exponencial linear de Browns, que usa duas séries suavizadas diferentes que são centradas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo). A forma algébrica do modelo de suavização exponencial linear de Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em um número de formas diferentes mas equivalentes. A forma quotstandard deste modelo é usualmente expressa da seguinte maneira: Seja S a série de suavização simples obtida pela aplicação de suavização exponencial simples à série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples Exponencial, esta seria a previsão para Y no período t1.) Então deixe Squot denotar a série duplamente-alisada obtida aplicando a suavização exponencial simples (usando o mesmo 945) à série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dada por: Isto produz e 1 0 (isto é, enganar um pouco e deixar a primeira previsão igual à primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isto produz os mesmos valores ajustados que a fórmula baseada em S e S se estes últimos foram iniciados utilizando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Smoothing Brown8217s O modelo LES calcula estimativas locais de nível e tendência ao suavizar os dados recentes, mas o fato de que ele faz isso com um único parâmetro de suavização coloca uma restrição nos padrões de dados que é capaz de ajustar: o nível ea tendência Não são permitidos variar em taxas independentes. Holt8217s modelo LES aborda esta questão, incluindo duas constantes de alisamento, um para o nível e um para a tendência. Em qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui eles são calculados recursivamente a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam alisamento exponencial para eles separadamente. Se o nível estimado ea tendência no tempo t-1 são L t82091 e T t-1. Respectivamente, então a previsão para Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é computada recursivamente pela interpolação entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1-945. A mudança no nível estimado, Nomeadamente L t 8209 L t82091. Pode ser interpretado como uma medida ruidosa da tendência no tempo t. A estimativa actualizada da tendência é então calculada recursivamente pela interpolação entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: A interpretação da constante de alisamento de tendência 946 é análoga à da constante de alisamento de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda apenas muito lentamente ao longo do tempo, enquanto modelos com Maior 946 supor que está mudando mais rapidamente. Um modelo com um 946 grande acredita que o futuro distante é muito incerto, porque os erros na tendência-estimativa tornam-se completamente importantes ao prever mais de um período adiante. As constantes de suavização 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas se tornam 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume muito pouca mudança na tendência de um período para o outro, então basicamente este modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados que é usada na estimativa do nível local da série, a idade média dos dados que é usada na estimativa da tendência local é proporcional a 1/946, embora não exatamente igual a isto. Neste caso, isto é 1 / 0.006 125. Este número é muito preciso, na medida em que a precisão da estimativa de 946 é realmente de 3 casas decimais, mas é da mesma ordem geral de magnitude que o tamanho da amostra de 100 , Assim que este modelo está calculando a média sobre bastante muita história em estimar a tendência. O gráfico de previsão abaixo mostra que o modelo LES estima uma tendência local ligeiramente maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pelo ajuste do modelo SES com ou sem tendência, de modo que este é quase o mesmo modelo. Agora, eles parecem previsões razoáveis ​​para um modelo que é suposto estar estimando uma tendência local Se você 8220eyeball8221 esse enredo, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foram calculados minimizando o erro quadrático das previsões de um passo à frente, e não as previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está olhando são 1-passo-frente erros, você não está vendo a imagem maior de tendências sobre (digamos) 10 ou 20 períodos. A fim de obter este modelo mais em sintonia com a nossa extrapolação do globo ocular dos dados, podemos ajustar manualmente a tendência de suavização constante para que ele usa uma linha de base mais curto para a estimativa de tendência. Por exemplo, se escolhemos definir 946 0,1, então a idade média dos dados usados ​​na estimativa da tendência local é de 10 períodos, o que significa que estamos fazendo uma média da tendência ao longo dos últimos 20 períodos aproximadamente. Here8217s o que o lote de previsão parece se ajustarmos 946 0.1 mantendo 945 0.3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso para extrapolar esta tendência mais de 10 períodos no futuro. E sobre as estatísticas de erro Aqui está uma comparação de modelos para os dois modelos mostrados acima, bem como três modelos SES. O valor ótimo de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com ligeiramente mais ou menos responsividade, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alfa 0,3048 e beta 0,008 (B) Holts linear exp. Alisamento com alfa 0,3 e beta 0,1 (C) Alisamento exponencial simples com alfa 0,5 (D) Alisamento exponencial simples com alfa 0,3 (E) Alisamento exponencial simples com alfa 0,2 Suas estatísticas são quase idênticas, então realmente não podemos fazer a escolha com base De erros de previsão de 1 passo à frente dentro da amostra de dados. Temos de recorrer a outras considerações. Se acreditarmos firmemente que faz sentido basear a estimativa de tendência atual sobre o que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnósticos quanto à existência de uma tendência local, então um dos modelos SES pode ser mais fácil de explicar e também fornecerá mais previsões de médio-caminho para os próximos 5 ou 10 períodos. Evidências empíricas sugerem que, se os dados já tiverem sido ajustados (se necessário) para a inflação, então pode ser imprudente extrapolar os resultados lineares de curto prazo Muito para o futuro. As tendências evidentes hoje podem afrouxar no futuro devido às causas variadas tais como a obsolescência do produto, a competição aumentada, e os abrandamentos cíclicos ou as ascensões em uma indústria. Por esta razão, a suavização exponencial simples geralmente desempenha melhor fora da amostra do que poderia ser esperado, apesar da sua extrapolação de tendência horizontal quotnaivequot. Modificações de tendência amortecida do modelo de suavização exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES com tendência a amortecimento pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de suavização (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos que você está prevendo. Em geral, os intervalos se espalham mais rapidamente à medida que o 945 se torna maior no modelo SES e eles se espalham muito mais rápido quando se usa linear ao invés de alisamento simples. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Voltar ao topo da página.)

Comments

Popular Posts