Moving Average In R Time Series


8.4 Modelos de média móvel Em vez de usar valores passados ​​da variável de previsão em uma regressão, um modelo de média móvel usa erros de previsão passados ​​em um modelo de regressão. Y e teta teta e dots theta e, onde et é ruído branco. Referimo-nos a isto como um modelo MA (q). É claro que não observamos os valores de et, então não é realmente regressão no sentido usual. Observe que cada valor de yt pode ser considerado como uma média móvel ponderada dos últimos erros de previsão. No entanto, os modelos de média móvel não devem ser confundidos com o alisamento médio móvel discutido no Capítulo 6. Um modelo de média móvel é usado para prever valores futuros, enquanto o alisamento médio móvel é usado para estimar o ciclo tendencial de valores passados. Figura 8.6: Dois exemplos de dados de modelos de média móvel com diferentes parâmetros. Esquerda: MA (1) com y t 20e t 0,8e t-1. Direita: MA (2) com y t e t - e t-1 0,8e t-2. Em ambos os casos, e t é normalmente distribuído ruído branco com média zero e variância um. A Figura 8.6 mostra alguns dados de um modelo MA (1) e um modelo MA (2). Alterando os parâmetros theta1, dots, thetaq resulta em diferentes padrões de séries temporais. Tal como acontece com modelos autorregressivos, a variância do termo de erro e só mudará a escala da série, não os padrões. É possível escrever qualquer modelo AR (p) estacionário como um modelo MA (infty). Por exemplo, usando a substituição repetida, podemos demonstrar isso para um modelo AR (1): begin yt amp phi1y et amp phi1 (phi1y e) amp phi12y phi1 e amp phi13y phi12e phi1 e amptext final Fornecido -1 lt phi1 lt 1, o valor de phi1k será menor à medida que k for maior. Assim, eventualmente, obtemos yt et phi1 e phi12 e phi13 e cdots, um processo MA (infty). O resultado inverso é válido se impomos algumas restrições nos parâmetros MA. Em seguida, o modelo MA é chamado invertible. Ou seja, que podemos escrever qualquer processo de MA (q) invertível como um processo AR (infty). Modelos Invertiveis não são simplesmente para nos permitir converter de modelos MA para modelos AR. Eles também têm algumas propriedades matemáticas que torná-los mais fáceis de usar na prática. As restrições de invertibilidade são semelhantes às restrições de estacionaridade. Para um modelo MA (1): -1lttheta1lt1. Para um modelo MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Condições mais complicadas mantêm-se para qge3. Mais uma vez, R irá cuidar dessas restrições ao estimar os modelos. O menu Top Time Series e Forecasting R tem amplas facilidades para analisar dados de séries temporais. Esta seção descreve a criação de uma série de tempo, decomposição sazonal, modelagem com modelos exponenciais e ARIMA e previsão com o pacote de previsão. Criando uma série de tempo A função ts () converterá um vetor numérico em um objeto de série de tempo R. O formato é ts (vetor, início, fim, freqüência) onde início e fim são os tempos da primeira e última observação e freqüência é o número de observações por unidade de tempo (1annual, 4quartly, 12monthly, etc). Salve um vetor numérico contendo 72 observações mensais de janeiro de 2009 a dezembro de 2014 como uma série temporal myts lt ts (myvector, startc (2009, 1), endc (2014, 12), frequency12) subconjunto da série cronológica (junho de 2014 a Decomposição sazonal Uma série de tempo com tendência aditiva, componentes sazonais e irregulares pode ser decomposta usando o stl (myts) (). Note-se que uma série com efeitos multiplicativos pode muitas vezes ser transformada em séries com efeitos aditivos através de uma transformação de log (isto é, newts lt-log (myts)). Modelos Exponenciais Tanto a função HoltWinters () na instalação base, como a função ets (), a função ets (), a função ets (), a função de decomposição sazonal lt - stl (myts, s. windowperiod) No pacote de previsão, pode ser usado para ajustar modelos exponenciais. (Myts, betaFALSE, gammaFALSE) duplo exponencial - nível de modelos e tendência de ajuste lt - HoltWinters (myts, gammaFALSE) triplo exponencial - nível de modelos, tendência e componentes sazonais fit lt - HoltWinters (myts) (Previsão) previsão (ajuste, 3) traçado (previsão (ajuste, 3)) ARIMA Modelos A função arima () pode ser usada para ajustar uma movimentação integrada autorregressiva Modelo de médias. Outras funções úteis incluem: versão retardada de séries temporais, k deslocadas k observações5.2 Suavização de Séries de Tempo A suavização é geralmente feita para nos ajudar a ver melhor padrões, tendências, por exemplo, em séries temporais. Geralmente suavizar a irregularidade irregular para ver um sinal mais claro. Para os dados sazonais, podemos suavizar a sazonalidade para que possamos identificar a tendência. Suavização não nos fornece um modelo, mas pode ser um bom primeiro passo para descrever vários componentes da série. O termo filtro às vezes é usado para descrever um procedimento de suavização. Por exemplo, se o valor suavizado de um determinado tempo é calculado como uma combinação linear de observações para tempos circundantes, pode-se dizer que weve aplicado um filtro linear para os dados (não o mesmo que dizer o resultado é uma linha reta, por o caminho). O uso tradicional do termo média móvel é que em cada ponto no tempo determinamos médias (possivelmente ponderadas) dos valores observados que circundam um determinado tempo. Por exemplo, no instante t. Uma média móvel centrada do comprimento 3 com pesos iguais seria a média dos valores às vezes t -1. T. E t1. Para tirar a sazonalidade de uma série, para que possamos ver melhor a tendência, usaríamos uma média móvel com um período sazonal span. Assim, na série suavizada, cada valor alisado foi calculado em média em todas as estações. Isso pode ser feito olhando para uma média móvel unilateral em que você média todos os valores para os anos anteriores de dados ou uma média móvel centrada na qual você usa valores antes e depois da hora atual. Para dados trimestrais, por exemplo, poderíamos definir um valor suavizado para o tempo t como (x t x t-1 x t-2 x t-3) / 4, a média deste tempo e os 3 trimestres anteriores. No código R, este será um filtro unilateral. Uma média móvel centrada cria um pouco de uma dificuldade quando temos um número par de períodos de tempo no período sazonal (como costumamos fazer). Para suavizar a sazonalidade nos dados trimestrais. A fim de identificar a tendência, a convenção usual é usar a média móvel alisada no tempo t é Para suavizar a sazonalidade em dados mensais. Para identificar a tendência, a convenção usual é usar a média móvel alisada no instante t. Isto é, aplicamos o peso 1/24 aos valores às vezes t6 e t6 e peso 1/12 a todos os valores em todos os momentos entre t5 e T5. No comando R filtro, bem especificar um filtro de dois lados quando queremos usar valores que vêm antes e depois do tempo para o qual foram suavização. Observe que na página 71 de nosso livro, os autores aplicam pesos iguais em uma média móvel sazonal centrada. Thats ok também. Por exemplo, um trimestral mais suave pode ser suavizado no momento t é fraccionado x frac x frac x frac x frac x Um mensal mais suave pode aplicar um peso de 1/13 a todos os valores de tempos t-6 a t6. O código que os autores usam na página 72 tira vantagem de um comando rep que repete um valor um certo número de vezes. Eles não usam o parâmetro filter dentro do comando filter. Exemplo 1 Produção Trimestral de Cerveja na Austrália Tanto na Lição 1 quanto na Lição 4, analisamos uma série de produção trimestral de cerveja na Austrália. O código R seguinte cria uma série suavizada que nos permite ver o padrão de tendência e traça esse padrão de tendência no mesmo gráfico da série de tempo. O segundo comando cria e armazena a série suavizada no objeto chamado trendpattern. Note que dentro do comando filter, o parâmetro named filter dá os coeficientes para o nosso alisamento e sides 2 faz com que um centrado suave seja calculado. Beerprod (beerprod. dat) filtro de tendência (beerprod, filtro c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) parcela (beerprod, tipo b, ) Linhas (trendpattern) Heres o resultado: Podemos subtrair o padrão de tendência dos valores de dados para ter uma melhor visão da sazonalidade. O resultado segue: Outra possibilidade para a série de alisamento para ver a tendência é o filtro one-sided do filtro trendpattern2 (beerprod, filtro c (1/4, 1/4, 1/4, 1/4), sides1) Com isso, o valor suavizado é a média do ano passado. Exemplo 2. Desemprego mensal nos Estados Unidos Na lição de casa da semana 4 você analisou uma série mensal de desemprego nos Estados Unidos para 1948-1978. Heres um alisamento feito para olhar para a tendência. Trendunemployfilter (unemploy, filterc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, (Trendunemploy, mainTrend no desemprego nos Estados Unidos, 1948-1978, ano xlab) Apenas a tendência alisada é plotada. O segundo comando identifica as características de tempo do calendário da série. Isso faz com que a trama tenha um eixo mais significativo. A trama segue. Para séries não-sazonais, você arent obrigado a alisar sobre qualquer extensão particular. Para alisar você deve experimentar com médias móveis de diferentes extensões. Esses períodos de tempo podem ser relativamente curtos. O objetivo é derrubar as bordas ásperas para ver qual tendência ou padrão pode estar lá. Outros Métodos de Suavização (Seção 2.4) A Seção 2.4 descreve várias alternativas sofisticadas e úteis para o alisamento médio móvel. Os detalhes podem parecer esboçado, mas isso é bom porque não queremos ficar atolados em muitos detalhes para esses métodos. Dos métodos alternativos descritos na Seção 2.4, o lowess (regressão localmente ponderada) pode ser o mais utilizado. Exemplo 2 Continua O gráfico seguinte é uma linha de tendência suavizada para a série de Desemprego dos EUA, encontrada utilizando um lowess mais suave, no qual uma quantidade substancial (2/3) contribuiu para cada estimativa suavizada. Note que isso suavizou a série mais agressivamente do que a média móvel. Os comandos utilizados foram os desempregados (desemprego, início c (1948,1), freq12) parcela (lowess (desempregado, f 2/3), suavização Lowess da tendência de desemprego nos EUA) Suavização Exponencial Única A equação básica de previsão para suavização exponencial única (1-alfa) hat t text Nós prognosticamos que o valor de x no tempo t1 seja uma combinação ponderada do valor observado no tempo t eo valor previsto no instante t. Embora o método seja chamado um método de suavização, seu usado principalmente para previsão de curto prazo. O valor de é chamado de constante de suavização. Por qualquer razão, 0.2 é uma popular escolha padrão de programas. Isso coloca um peso de 0,2 na observação mais recente e um peso de 1,2,8 na previsão mais recente. Com um valor relativamente pequeno de, o alisamento será relativamente mais extenso. Com um valor relativamente grande de, o alisamento é relativamente menos extenso à medida que mais peso será colocado no valor observado. Este é um método simples de previsão de um passo à frente que, à primeira vista, parece não exigir um modelo para os dados. De fato, este método é equivalente ao uso de um modelo ARIMA (0,1,1) sem constante. O procedimento ideal é ajustar um modelo ARIMA (0,1,1) ao conjunto de dados observado e usar os resultados para determinar o valor de. Isso é ótimo no sentido de criar o melhor para os dados já observados. Embora o objetivo seja suavizar e um passo à frente previsões, a equivalência ao modelo ARIMA (0,1,1) traz um bom ponto. Não devemos cegamente aplicar alisamento exponencial porque o processo subjacente pode não ser bem modelado por um ARIMA (0,1,1). Considere um ARIMA (0,1,1) com média 0 para as primeiras diferenças, xt - x t-1: begin hat amp amp xt theta1 wt amp amp xt theta1 (xt - que t) amp amp (1 theta1) xt - theta1hat tendem. Se deixarmos (1 1) e assim - (1) 1, vemos a equivalência à equação (1) acima. Por que o Método é Chamado Suavização Exponencial Isso produz o seguinte: começo chapéu amplificador amp alfa xt (1-alfa) alfa x (1-alfa) chapéu amp amp alfa xt alfa (1-alfa) x (1-alfa) 2hat fim Continuar Desta forma substituindo sucessivamente o valor previsto no lado direito da equação. Isto leva a: hat alfa xt alfa (1-alfa) x alfa (1-alfa) 2 x dots alfa (1-alfa) jx pontos alfa (1-alfa) x1 texto A equação 2 mostra que o valor previsto é uma média ponderada De todos os valores passados ​​da série, com pesos exponencialmente variáveis ​​à medida que nos movemos de volta na série. Optimal Exponential Smoothing in R Basicamente, basta ajustar um ARIMA (0,1,1) aos dados e determinar o coeficiente. Podemos examinar o ajuste do bom, comparando os valores previstos com a série real. A suavização exponencial tende a ser usada mais como uma ferramenta de previsão do que uma verdadeira suavidade, por isso procuramos ver se temos um bom ajuste. Exemplo 3. N 100 observações mensais do logaritmo de um índice de preços do petróleo nos Estados Unidos. A série de dados é: Um ajuste ARIMA (0,1,1) em R deu um coeficiente MA (1) 0,3877. Assim, (1 1) 1,3877 e 1- -0,3877. A equação exponencial de suavização de previsão é 1.3877xt - 0.3877hat t No tempo 100, o valor observado da série é x 100 0,86601. O valor previsto para a série nesse momento é Assim, a previsão para o tempo 101 é o chapéu 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A seguir é o quão bem o mais suave se encaixa a série. É um bom ajuste. Isso é um bom sinal para a previsão, o principal objectivo para este mais suave. Aqui estão os comandos usados ​​para gerar a saída para este exemplo: oilindex scan (oildata. dat) gráfico (oilindex, tipo b, registro principal de índice de óleo série) expsmoothfit arima (oilindex, ordem c (0,1,1)) expsmoothfit Para ver o arima resultados preditos oilindex - expsmoothfitresiduals previu valores gráfico (oilindex, typeb, principal Exponential Suavização de Log of Oil Index) linhas (preditos) 1.3877oilindex100-0.3877predicteds100 previsão de tempo 101 Double suavização exponencial Double exponencial suavização pode ser usado quando theres Tendência (longo ou curto prazo), mas sem sazonalidade. Essencialmente, o método cria uma previsão combinando estimativas exponencialmente suavizadas da tendência (inclinação de uma linha reta) eo nível (basicamente, a intercepção de uma linha reta). Dois pesos diferentes, ou parâmetros de suavização, são usados ​​para atualizar esses dois componentes a cada vez. O nível alisado é mais ou menos equivalente a uma suavização exponencial simples dos valores de dados ea tendência suavizada é mais ou menos equivalente a uma suavização exponencial simples das primeiras diferenças. O procedimento é equivalente à montagem de um modelo ARIMA (0,2,2), sem constante, pode ser realizado com um ajuste ARIMA (0,2,2). (1-B) 2 xt (1teta1B theta2B2) p. O NavigationBase R é fornecido com muitas funcionalidades úteis para séries temporais, em particular no pacote de estatísticas. Isto é complementado por muitos pacotes no CRAN, que são brevemente resumidos abaixo. Há também uma considerável sobreposição entre as ferramentas para séries temporais e aquelas nas vistas de tarefas de Econometria e Finanças. Os pacotes nesta visualização podem ser estruturados grosso modo nos seguintes tópicos. Se você acha que algum pacote está faltando na lista, entre em contato conosco. A infraestrutura . Base R contém infra-estrutura substancial para representar e analisar dados de séries temporais. A classe fundamental é quottsquot que pode representar séries temporais regularmente espaçadas (usando carimbos de tempo numéricos). Assim, é particularmente adequado para dados anuais, mensais, trimestrais, etc. As médias móveis são computadas por ma da previsão. E rollmean do zoológico. Este último também proporciona uma função geral rollapply. Juntamente com outras funções de estatísticas de rolamento específicas. Roll fornece funções paralelas para computar estatísticas de rolagem. Gráficos . As parcelas de séries temporais são obtidas com plot () aplicado aos objetos ts. (Parciais) funções de autocorrelação são implementadas em acf () e pacf (). Versões alternativas são fornecidas por Acf () e Pacf () na previsão. Juntamente com uma exibição de combinação usando tsdisplay (). SDD fornece diagramas mais gerais de dependência serial, enquanto dCovTS calcula e traça as funções de covariância e correlação de distância de séries temporais. Exibições sazonais são obtidas usando monthplot () nas estatísticas e seasonplot na previsão. Wats implementa wrap-around gráficos de série de tempo. Ggseas fornece gráficos ggplot2 para séries ajustadas sazonalmente e estatísticas de rolamento. Dygraphs fornece uma interface para o Dygraphs interativo série de tempo gráfico de biblioteca. ZRA traça objetos de previsão do pacote de previsão usando dígrafos. As parcelas dos ventiladores básicos das distribuições de previsão são fornecidas por previsão e vars. As parcelas de ventiladores mais flexíveis de quaisquer distribuições seqüenciais são implementadas em fanplot. Class quottsquot só pode lidar com carimbos de tempo numéricos, mas muitas mais classes estão disponíveis para armazenar informações de data / hora e computação com ele. Para uma visão geral, consulte R Help Desk: Classes de data e hora em R de Gabor Grothendieck e Thomas Petzoldt em R News 4 (1). 29-32. Classes quotyearmonquot e quotyearqtrquot do zoológico permitem computação mais conveniente com observações mensais e trimestrais, respectivamente. Classe quotDatequot do pacote base é a classe básica para lidar com datas em dados diários. As datas são internamente armazenadas como o número de dias desde 1970-01-01. O pacote cron fornece classes para datas (). Horas () e data / hora (intra-dia) em cron (). Não há suporte para fusos horários e horário de verão. Internamente, os objetos quotchronquot são dias (fracionários) desde 1970-01-01. Classes quotPOSIXctquot e quotPOSIXltquot implementam o padrão POSIX para informações de data / hora (intra-dia) e também suportam fusos horários e horário de verão. No entanto, os cálculos de fuso horário exigem algum cuidado e podem depender do sistema. Internamente, quotPOSIXctquot objetos são o número de segundos desde 1970-01-01 00:00:00 GMT. O pacote lubridate fornece funções que facilitam determinados cálculos baseados em POSIX. A classe quottimeDatequot é fornecida no pacote timeDate (anteriormente: fCalendar). Destina-se a informações de data / hora financeira e trata de fusos horários e horários de verão através de um novo conceito de centros financeiros. Internamente, ele armazena todas as informações em quotPOSIXctquot e faz todos os cálculos em GMT apenas. Funcionalidade do calendário, p. Incluindo informações sobre fins de semana e feriados para várias bolsas de valores, também está incluído. O pacote tis fornece a classe quottiquot para informações de hora / data. A classe quotmondatequot do pacote mondate facilita a computação com datas em termos de meses. O pacote tempdisagg inclui métodos para desagregação temporal e interpolação de uma série temporal de baixa freqüência para uma série de freqüências mais altas. TimeProjection extrai componentes de tempo útil de um objeto de data, como dia da semana, fim de semana, feriado, dia do mês, etc, e colocá-lo em um quadro de dados. Como mencionado acima, quotts ​​é a classe básica para séries temporais regularmente espaçadas usando carimbos de tempo numéricos. O pacote do zoológico fornece infra-estrutura para séries temporais regular e irregularmente espaçadas usando classes arbitrárias para os carimbos de tempo (ou seja, permitindo que todas as classes da seção anterior). Ele é projetado para ser o mais consistente possível com quottsquot. Coerção de e para quotzooquot está disponível para todas as outras classes mencionadas nesta seção. O pacote xts baseia-se no zoológico e fornece tratamento uniforme de Rs diferentes classes de dados baseadas no tempo. Vários pacotes implementam séries temporais irregulares baseadas em quotPOSIXctquot selos de tempo, destinados especialmente para aplicações financeiras. Estes incluem quotits de sua. Citações de tseries. E quotftsquot de fts. A classe quottimeSeriesquot em timeSeries (anteriormente: fSeries) implementa séries de tempo com selos de tempo quottimeDatequot. A classe quottisquot in tis implementa séries de tempo com selos de tempo quottiquot. O pacote tframe contém infra-estrutura para definir intervalos de tempo em diferentes formatos. Previsão e Modelagem Univariada O pacote de previsão fornece uma classe e métodos para previsões de séries de tempo univariadas e fornece muitas funções implementando diferentes modelos de previsão incluindo todos aqueles no pacote de estatísticas. Suavização exponencial. HoltWinters () em estatísticas fornece alguns modelos básicos com otimização parcial, ets () do pacote de previsão fornece um conjunto maior de modelos e instalações com otimização completa. O pacote MAPA combina modelos exponenciais de suavização em diferentes níveis de agregação temporal para melhorar a precisão das previsões. O método theta é implementado na função thetaf do pacote de previsão. Uma implementação alternativa e estendida é fornecida no forectheta. Modelos auto-regressivos. Ar () nas estatísticas (com seleção do modelo) e FitAR para os modelos do subconjunto AR. Modelos ARIMA. Arima () em stats é a função básica dos modelos ARIMA, SARIMA, ARIMAX e subconjunto ARIMA. Ele é aprimorado no pacote de previsão através da função Arima () juntamente com auto. arima () para a seleção de ordem automática. Arma () no pacote tseries fornece algoritmos diferentes para modelos ARMA e subconjunto ARMA. O FitARMA implementa um algoritmo MLE rápido para modelos ARMA. O pacote gsarima contém funcionalidade para a simulação da série de tempo SARIMA generalizada. O pacote mar1s processa AR multiplicativo (1) com processos sazonais. TSTutorial fornece um tutorial interativo para Box-Jenkins modelagem. Os intervalos de previsão melhorados para ARIMA e modelos de séries temporais estruturais são fornecidos pelo tsPI. Modelos ARMA periódicos. Pear e partsm para modelos periódicos de séries temporais autorregressivas e perARMA para modelagem periódica ARMA e outros procedimentos para análise periódica de séries temporais. Modelos ARFIMA. Algumas instalações para modelos ARFIMA fraccionados diferenciados são fornecidas no pacote fracdiff. O pacote arfima possui recursos mais avançados e gerais para modelos ARFIMA e ARIMA, incluindo modelos de regressão dinâmica (função de transferência). ArmaFit () do pacote fArma é uma interface para modelos ARIMA e ARFIMA. Ruído gaussiano fracionário e modelos simples para séries de tempo de decaimento hiperbólico são tratados no pacote FGN. Os modelos de função de transferência são fornecidos pela função arimax no pacote TSA ea função arfima no pacote arfima. Outlier detecção após a Chen-Liu abordagem é fornecida por tsoutliers. Modelos estruturais são implementados em StructTS () em stats, e em stsm e stsm. class. KFKSDS fornece uma implementação ingênua do filtro de Kalman e alisadores para modelos de espaço de estados univariados. Os modelos de séries temporais estruturais bayesianas são implementados em séries temporais não gaussianas podem ser manipuladas com modelos de espaço de estado GLARMA via glarma. E usando modelos Generalized Autoregressive Score no pacote GAS. Modelos condicionais de Auto-Regressão utilizando métodos Monte Carlo Likelihood são implementados em mclcar. Modelos GARCH. Garch () do tseries se encaixa modelos GARCH básicos. Muitas variações em modelos de GARCH são fornecidas pelo rugarch. Outros pacotes GARCH univariados incluem fGarch que implementa modelos ARIMA com uma ampla classe de inovações GARCH. Existem muitos outros pacotes GARCH descritos na vista de tarefas Financeiro. Modelos de volatilidade estocástica são manipulados por stochvol em uma estrutura bayesiana. Modelos de série de tempo de contagem são manipulados nos pacotes tscount e acp. O ZIM fornece modelos Zero-Inflated para séries de tempo de contagem. Tsintermittent implementa vários modelos para analisar e prever séries de tempo de demanda intermitente. As séries temporais censuradas podem ser modeladas usando centavos e carx. Testes Portmanteau são fornecidos através de Box. test () no pacote stats. Testes adicionais são dados por portes e WeightedPortTest. A detecção de ponto de mudança é fornecida no strucchange (usando modelos de regressão linear), na tendência (usando testes não paramétricos) e em wbsts (usando segmentação binária selvagem). O pacote de ponto de mudança fornece muitos métodos de ponto de troca populares, e ecp faz detecção de ponto de mudança não paramétrico para séries univariadas e multivariadas. A detecção de ponto de mudança online para séries temporais univariadas e multivariadas é fornecida pelo onlineCPD. A imputação de séries temporais é fornecida pelo pacote imputeTS. Alguns recursos mais limitados estão disponíveis usando na. interp () do pacote de previsão. As previsões podem ser combinadas usando ForecastCombinations que suporta os métodos mais usados ​​para combinar previsões. ForecastHybrid fornece funções para previsões de conjuntos, combinando abordagens do pacote de previsão. Opera tem facilidades para previsões on-line com base em combinações de previsões fornecidas pelo usuário. A avaliação da previsão é fornecida na função accuracy () da previsão. A avaliação de previsão distribucional usando regras de pontuação está disponível no scoringRules Miscellaneous. Ltsa contém métodos para análise de séries temporais lineares, timsac para análise e controle de séries temporais e tsbugs para modelos BUGS de séries temporais. A estimativa da densidade espectral é fornecida pelo espectro () no pacote stats, incluindo o periodograma, o periodograma suavizado e as estimativas de AR. A inferência espectral bayesiana é fornecida por bspec. O quantspec inclui métodos para calcular e traçar periodogramas de Laplace para séries temporais univariadas. O periodograma Lomb-Scargle para séries temporais amostradas de forma desigual é calculado por lomb. Psd produz estimativas de densidade espectral adaptativas, seno-multitaper. Kza fornece Kolmogorov-Zurbenko Adaptive Filters incluindo detecção de quebra, análise espectral, wavelets e KZ Fourier transformações. Multitaper também fornece algumas ferramentas de análise espectral multitaper. Métodos Wavelet. O pacote de wavelets inclui computar filtros wavelet, transformadas wavelet e análises multiresolução. Os métodos wavelet para a análise de séries temporais baseados em Percival e Walden (2000) são dados em wmtsa. Biwavelet pode ser usado para plotar e calcular os espectros wavelet, espectros de wavelet cruzado e coerência wavelet de séries temporais não-estacionárias. Ele também inclui funções para agrupar séries temporais baseadas nas (des) similaridades em seu espectro. Testes de ruído branco usando wavelets são fornecidos por hwwntest. Métodos Wavelet adicionais podem ser encontrados no brainwaver pacotes. Rwt. Waveslim Wavethresh e mvcwt. A regressão harmônica usando termos de Fourier é implementada em HarmonicRegression. O pacote de previsão também fornece algumas facilidades simples de regressão harmônica através da função fourier. Decomposição e filtragem Filtros e suavização. O filtro () em stats fornece filtragem linear média auto-regressiva e móvel de séries temporais univariadas múltiplas. O pacote robfilter fornece vários filtros robustos de séries temporais, enquanto o mFilter inclui diversos filtros de séries temporais úteis para suavizar e extrair componentes tendenciais e cíclicos. Smooth () do pacote de estatísticas computa Tukeys executando mediana smoothers, 3RS3R, 3RSS, 3R, etc sleekts calcula o 4253H duas vezes método de suavização. Decomposição. A decomposição sazonal é discutida abaixo. A decomposição baseada em auto-regressão é fornecida pelo ArDec. O rmaf usa um filtro refinado de média móvel para decomposição. Análise de Espectro Singular é implementada em Rssa e métodos espectrais. A decomposição do modo empírico (EMD) ea análise espectral de Hilbert são fornecidas por EMD. Ferramentas adicionais, incluindo EMD conjunto, estão disponíveis em hht. Uma implementação alternativa do conjunto EMD e sua variante completa estão disponíveis em Rlibeemd. Decomposição sazonal. O pacote stats fornece decomposição clássica em decompose (). E decomposição STL em stl (). A decomposição STL melhorada está disponível em stlplus. StR fornece a decomposição Seasonal-Trend baseada na regressão. X12 fornece um wrapper para os binários X12 que devem ser instalados primeiro. X12GUI fornece uma interface gráfica do usuário para x12. Os binários X-13-ARIMA-SEATS são fornecidos no pacote x13binary, com o fornecimento sazonal de uma interface R. Análise da sazonalidade. O pacote bfast fornece métodos para detectar e caracterizar mudanças abruptas dentro da tendência e componentes sazonais obtidos a partir de uma decomposição. Npst fornece uma generalização do teste de sazonalidade Hewitts. estação. Análise sazonal de dados de saúde, incluindo modelos de regressão, crossover caso-estratificado tempo, funções de traçado e verificações residuais. Mares Análise sazonal e gráficos, especialmente para climatologia. Dessazonalizar Otimização da dessazonalização para séries geofísicas usando o encaixe AR. Estacionaridade, Unidade de Raízes e Cointegração Estacionaridade e raízes unitárias. Tseries fornece vários testes de estacionaridade e raiz unitária, incluindo Dickey-Fuller aumentado, Phillips-Perron e KPSS. Implementações alternativas dos testes ADF e KPSS estão no pacote urca, que também inclui métodos adicionais como testes Elliott-Rothenberg-Stock, Schmidt-Phillips e Zivot-Andrews. O pacote fUnitRoots também fornece o teste MacKinnon, enquanto o uroot fornece testes de raiz unitária sazonais. O CADFtest fornece implementações tanto do ADF padrão como de um teste de ADF (CADF) com covariável. Estacionaridade local. Localiza um teste de estacionaridade local e calcula a autocovariância localizada. A determinação da determinação da costeração de séries temporais é fornecida por costat. LSTS tem funções para análise de séries temporais localmente estacionárias. Modelos de wavelet estacionariamente estacionários para séries temporais não-estacionárias são implementados em wavethresh (incluindo estimativa, plotagem e simulação para espectros que variam no tempo). Cointegração. O método Engle-Granger de dois passos com o teste de cointegração Phillips-Ouliaris é implementado em tseries e urca. Este último contém adicionalmente funcionalidade para os testes Johansen trace e lambda-max. TsDyn fornece Johansens teste e AIC / BIC seleção simultânea rank-lag. O CommonTrend fornece ferramentas para extrair e traçar tendências comuns de um sistema de cointegração. A estimação e inferência de parâmetros em uma regressão de cointegração são implementadas em cointReg. Análise não linear de séries temporais Auto-regressão não-linear. Várias formas de auto-regressão não linear estão disponíveis em tsDyn incluindo AR aditivo, redes neurais, modelos SETAR e LSTAR, limiar VAR e VECM. A auto-regressão da rede neural também é fornecida no GMDH. O bentcableAR implementa a autorregressão Bent-Cable. BAYSTAR fornece a análise bayesiana de modelos autorregressivos de limiar. TseriesChaos fornece uma implementação R dos algoritmos do projeto TISEAN. Autoregression Os modelos de comutação Markov são fornecidos em MSwM. Enquanto que as misturas dependentes de modelos de Markov latentes são dadas em depmix e depmixS4 para séries temporais categóricas e contínuas. Testes. Vários testes de não-linearidade são fornecidos em fNonlinear. TseriesEntropy testes de dependência serial não linear com base em métricas de entropia. Funções adicionais para séries temporais não-lineares estão disponíveis em nlts e nonlinearTseries. A modelagem da série de tempo do Fractal e a análise são fornecidas pelo fractal. Fractalrock gera séries de tempo de fractal com distribuições de retornos não-normais. Modelos dinâmicos de regressão Modelos dinâmicos lineares. Uma interface conveniente para ajustar modelos de regressão dinâmica via OLS está disponível no dynlm uma abordagem avançada que também funciona com outras funções de regressão e mais séries de séries temporais é implementada em dyn. Equações mais avançadas do sistema dinâmico podem ser montadas usando dse. Os modelos de espaço de estados lineares gaussianos podem ser montados usando dlm (via máxima verossimilhança, filtragem / alisamento de Kalman e métodos bayesianos), ou usando bsts que usa MCMC. As funções para a modelação não-linear de atraso distribuído são fornecidas em dlnm. Modelos de parâmetros variáveis ​​no tempo podem ser ajustados usando o pacote tpr. OrderedLasso ajusta um modelo linear esparso com uma restrição de ordem sobre os coeficientes, a fim de lidar com regressores defasados ​​onde os coeficientes decadência como o lag aumenta. Modelos dinâmicos de vários tipos estão disponíveis em dynr incluindo tempo discreto e contínuo, modelos lineares e não-lineares e diferentes tipos de variáveis ​​latentes. Modelos de séries temporais multivariadas Modelos VAR (Vector Autoregressive) são fornecidos via ar () no pacote stats básico incluindo a seleção de pedidos via AIC. Estes modelos são restritos para ser estacionário. O MTS é um conjunto de ferramentas para análise de séries temporais multivariadas, incluindo VAR, VARMA, VARMA sazonal, modelos VAR com variáveis ​​exógenas, regressão multivariada com erros de séries temporais e muito mais. Possivelmente modelos VAR não estacionários são montados no pacote mAr, o que também permite modelos VAR no espaço do componente principal. Sparsevar permite a estimação de modelos VAR esparsos e VECM, enquanto BigVAR estima modelos VAR e VARX com penalidades laço estruturado. Os modelos e redes VAR automatizados estão disponíveis no autovarCore. Modelos mais elaborados são fornecidos em pacotes vars. TsDyn. EstVARXls () em dse. E uma abordagem bayesiana está disponível em MSBVAR. Outra implementação com intervalos de previsão bootstrap é dada em VAR. etp. MlVAR fornece auto-regressão vectorial multi-nível. VARsignR fornece rotinas para identificar choques estruturais em modelos VAR usando restrições de sinal. Os modelos VARIMA e modelos de espaço de estado são fornecidos no pacote dse. EvalEst facilita experiências de Monte Carlo para avaliar os métodos de estimação associados. Modelos de correção de erros vetoriais estão disponíveis através da urca. Vars e pacotes tsDyn, incluindo versões com restrições estruturais e thresholding. Análise de componentes de séries temporais. A análise fatorial de séries temporais é fornecida em tsfa. O ForeCA implementa uma análise de componentes que pode ser pesquisada procurando as melhores transformações lineares que tornam uma série de tempo multivariada o mais previsível possível. PCA4TS encontra uma transformação linear de uma série de tempo multivariada dando subseries de menor dimensão que não estão correlacionadas entre si. Modelos de espaço de estados multivariados são implementados no pacote FKF (Fast Kalman Filter). Isso fornece modelos de espaço de estados relativamente flexíveis através da função fkf (): os parâmetros de espaço de estado podem variar em função do tempo e as interceptações são incluídas em ambas as equações. Uma implementação alternativa é fornecida pelo pacote KFAS que fornece um filtro de Kalman multivariado rápido, mais suave, simulação mais suave e previsão. Ainda outra implementação é dada no pacote dlm que também contém ferramentas para converter outros modelos multivariados em forma de espaço de estado. Dlmodeler fornece uma interface unificada para dlm. KFAS e FKF. O MARSS se ajusta a modelos de estados-espaço autoregressivos multivariados restritos e não restringidos usando um algoritmo EM. Todos esses pacotes assumem que os termos de erro observacional e de estado não estão correlacionados. Os processos de Markov parcialmente observados são uma generalização dos modelos de espaço de estados multivariados lineares usuais, permitindo modelos não-Gaussianos e não-lineares. Estes são implementados no pacote pompa. Modelos de volatilidade estocástica multivariada (usando fatores latentes) são fornecidos por fatores tochvol. Análise de grandes grupos de séries temporais O agrupamento em séries temporais é implementado em TSclust. Dtwclust. BNPTSclust e pdc. TSdist fornece medidas de distância para dados de séries temporais. O jmotif implementa ferramentas baseadas na discretização simbólica de séries temporais para encontrar motivos em séries temporais e facilita a classificação de séries temporais interpretáveis. Métodos para traçar e prever coleções de séries temporais hierárquicas e agrupadas são fornecidos por hts. Uma abordagem alternativa para conciliar previsões de séries temporais hierárquicas é fornecida por gtop. Modelos de tempo contínuo A modelagem autoregressiva de tempo contínuo é fornecida em cts. Sim. DiffProc simula e modela equações diferenciais estocásticas. Simulação e inferência para equações diferenciais estocásticas é fornecida por sde e yuima. Bootstrapping. O pacote de inicialização fornece a função tsboot () para bootstrapping de série de tempo, incluindo bootstrap de bloco com várias variantes. Tsbootstrap () do tseries fornece bootstrapping rápido estacionário e de bloco. O bootstrap entropy máximo para a série de tempo está disponível no meboot. Timesboot calcula o CI de bootstrap para o ACF e o periodograma da amostra. O BootPR calcula os intervalos de previsão corrigidos por bias e boostrap para séries temporais autorregressivas. Dados de Makridakis, Wheelwright e Hyndman (1998) Previsão: métodos e aplicações são fornecidos no pacote fma. Dados de Hyndman, Koehler, Ord e Snyder (2008) As previsões com suavização exponencial estão no pacote expsmooth. Dados de Hyndman e Athanasopoulos (2013) Previsão: princípios e práticas estão no pacote fpp. Os dados da competição M e competição M3 são fornecidos no pacote Mcomp. Os dados da competição M4 são dados em M4comp. Pdfetch fornece facilidades para baixar séries econômicas e financeiras de fontes públicas. Dados do portal on-line do Quandl para conjuntos de dados financeiros, econômicos e sociais podem ser consultados interativamente usando o pacote Quandl. Os dados do portal on-line do Datamarket podem ser obtidos usando o pacote rdatamarket. Os dados de Cryer e Chan (2010) estão no pacote TSA. Os dados de Shumway e Stoffer (2011) estão no pacote astsa. Dados de Tsay (2005) A análise de séries de tempo financeiras está no pacote FinTS, juntamente com algumas funções e arquivos de script necessários para trabalhar alguns dos exemplos. TSdbi fornece uma interface comum para bancos de dados de séries temporais. Fama fornece uma interface para bases de dados de séries de tempo FAME AER e Ecdat ambos contêm muitos conjuntos de dados (incluindo dados de séries temporais) de muitos livros de econometria dtw. Algoritmos dinâmicos do warping do tempo para computar e traçar alinhamentos pairwise entre séries de tempo. EnsembleBMA. Modelo Bayesiano Averaging para criar previsões probabilísticas a partir de previsões de conjunto e observações meteorológicas. Earlywarnings. Avisos iniciais sinalizam caixa de ferramentas para detectar transições críticas em eventos de séries temporais. Transforma dados de eventos extraídos por máquina em séries de tempo multivariadas agregadas regulares. FeedbackTS. Análise da direcionalidade temporal fragmentada para investigar feedback em séries temporais. LPStimeSeries pretende encontrar similaridade de padrão quotlearned para séries de tempo. MAR1 fornece ferramentas para preparar dados de séries temporais de comunidades ecológicas para modelagem de AR multivariada. Redes Rotinas para a estimativa de redes de correlação parciais esparsas de longo prazo para dados de séries temporais. PaleoTS. Modelagem da evolução em séries temporais paleontológicas. Pastecs. Regulação, decomposição e análise de séries espaço-temporais. Ptw. Comprimento de tempo paramétrico. RGENERATE fornece ferramentas para gerar séries de vetores. RMAWGEN é um conjunto de funções S3 e S4 para a geração estocástica espacial multi-site de séries de tempo diárias de temperatura e precipitação, fazendo uso de modelos VAR. O pacote pode ser utilizado em climatologia e hidrologia estatística. RSEIS. Ferramentas sísmicas de análise de séries temporais. Rts. Análise de séries temporais de rasterização (por exemplo, séries temporais de imagens de satélite). Sae2. Modelos de séries temporais para estimativa de área pequena. SpTimer. Modelagem bayesiana espacial-temporal. vigilância. Modelação temporal e espaço-temporal e monitoramento de fenômenos epidêmicos. TED. Turbulência de séries temporais Detecção e classificação de eventos. Marés Funções para calcular características de séries temporais quase periódicas, e. Níveis de água nos estuários. tigre. Grupos temporariamente resolvidos de diferenças típicas (erros) entre duas séries temporais são determinados e visualizados. TSMining. Motivos Univariados e Multivariados em Dados de Série de Tempo. TsModel. Modelagem de séries temporais para poluição do ar e saúde. Pacotes CRAN: Links relacionados: 6.2 Médias móveis ma 40 elecsales, ordem 5 41 Na segunda coluna desta tabela, é mostrada uma média móvel de ordem 5, fornecendo uma estimativa do ciclo tendencial. O primeiro valor nesta coluna é a média das cinco primeiras observações (1989-1993) o segundo valor na coluna 5-MA é a média dos valores 1990-1994 e assim por diante. Cada valor na coluna 5-MA é a média das observações no período de cinco anos centrado no ano correspondente. Não há valores para os dois primeiros anos ou últimos dois anos porque não temos duas observações de cada lado. Na fórmula acima, a coluna 5-MA contém os valores de hat com k2. Para ver como é a estimativa do ciclo tendencial, traçamos o gráfico juntamente com os dados originais da Figura 6.7. Lote 40 elecsales, principal quotResidential vendas de eletricidade, ylab quotGWhquot. Observe como a tendência (em vermelho) é mais suave do que os dados originais e captura o movimento principal da série de tempo sem todas as pequenas flutuações. O método da média móvel não permite estimativas de T em que t está próximo das extremidades da série, portanto, a linha vermelha não se estende para os bordos do gráfico em qualquer lado. Mais tarde usaremos métodos mais sofisticados de estimativa de tendência-ciclo que permitem estimativas próximas aos pontos finais. A ordem da média móvel determina a suavidade da estimativa de tendência-ciclo. Em geral, uma ordem maior significa uma curva mais suave. O gráfico a seguir mostra o efeito da alteração da ordem da média móvel para os dados de vendas de eletricidade residencial. As médias móveis simples como estas são normalmente de ordem ímpar (por exemplo, 3, 5, 7, etc.). Isto é assim que são simétricas: numa média móvel de ordem m2k1, há k observações anteriores, k observações posteriores e a observação do meio Que são médias. Mas se m fosse uniforme, não seria mais simétrico. Médias móveis de médias móveis É possível aplicar uma média móvel a uma média móvel. Uma razão para fazer isso é fazer uma média móvel de ordem uniforme simétrica. Por exemplo, podemos pegar uma média móvel de ordem 4 e, em seguida, aplicar outra média móvel de ordem 2 aos resultados. Na Tabela 6.2, isto foi feito para os primeiros anos dos dados da produção de cerveja trimestral australiana. Beer2 lt - window 40 ausbeer, início 1992 41 ma4 ltm 40 beer2, ordem 4. center FALSE 41 ma2x4 ltm 40 beer2, ordem 4. center TRUE 41 A notação 2times4-MA na última coluna significa um 4-MA Seguido por um 2-MA. Os valores na última coluna são obtidos tomando uma média móvel de ordem 2 dos valores na coluna anterior. Por exemplo, os dois primeiros valores na coluna 4-MA são 451,2 (443410420532) / 4 e 448,8 (410420532433) / 4. O primeiro valor na coluna 2times4-MA é a média destes dois: 450,0 (451.2448.8) / 2. Quando um 2-MA segue uma média móvel de ordem par (como 4), é chamado de média móvel centrada de ordem 4. Isto é porque os resultados são agora simétricos. Para ver que este é o caso, podemos escrever o 2times4-MA da seguinte forma: begin hat amp frac Bigfrac (y y y y) frac (y y y y) Big frac fray frac14y frac14y frac14y frac18y. Fim É agora uma média ponderada das observações, mas é simétrica. Outras combinações de médias móveis também são possíveis. Por exemplo, um 3 x 3 MA é frequentemente utilizado e consiste numa média móvel de ordem 3 seguida por outra média móvel de ordem 3. Em geral, uma ordem par MA deve ser seguida por uma ordem par MA para torná-lo simétrico. Similarmente, uma ordem ímpar MA deve ser seguida por uma ordem ímpar MA. Estimativa do ciclo de tendência com dados sazonais O uso mais comum de médias móveis centradas é estimar o ciclo de tendência a partir de dados sazonais. Considere o 2x4-MA: fracasso do chapéu frac14y frac14y frac14y frac18y. Quando aplicado a dados trimestrais, cada trimestre do ano recebe igual peso, uma vez que o primeiro eo último termo se aplicam ao mesmo trimestre em anos consecutivos. Conseqüentemente, a variação sazonal será média e os valores resultantes de hat t terão pouca ou nenhuma variação sazonal restante. Obter-se-ia um efeito semelhante utilizando uma mistura de 2 x 8-MA ou 2 x 12-MA. Em geral, uma m-MA 2x é equivalente a uma média móvel ponderada de ordem m1 com todas as observações tomando peso 1 / m, exceto para o primeiro e último termos que tomam pesos 1 / (2m). Portanto, se o período sazonal é par e de ordem m, use um m-MA de 2x para estimar o ciclo tendencial. Se o período sazonal é ímpar e de ordem m, use um m-MA para estimar o ciclo de tendência. Em particular, um 2 x 12-MA pode ser usado para estimar o ciclo de tendência de dados mensais e um 7-MA pode ser usado para estimar o ciclo tendência de dados diários. Outras escolhas para a ordem do MA normalmente resultarão em estimativas de ciclo de tendência sendo contaminadas pela sazonalidade nos dados. Exemplo 6.2 Fabricação de equipamento elétrico A Figura 6.9 mostra uma 2 x 12-MA aplicada ao índice de ordens de equipamentos elétricos. Observe que a linha lisa não mostra sazonalidade é quase o mesmo que o ciclo de tendência mostrado na Figura 6.2 que foi estimado usando um método muito mais sofisticado do que as médias móveis. Qualquer outra escolha para a ordem da média móvel (exceto 24, 36, etc.) teria resultado em uma linha suave que mostra algumas flutuações sazonais. Plot 40 elecequip, ylab quotNovas ordens indicequot. Col quotgrayquot, main quotred 41 Química média ponderada As médias combinadas das médias móveis resultam em médias móveis ponderadas. Por exemplo, o 2x4-MA discutido acima é equivalente a um 5-MA ponderado com pesos dados por frac, frac, frac, frac, frac. Em geral, uma m-MA ponderada pode ser escrita como hat t sum k aj y, onde k (m-1) / 2 e os pesos são dados por a, dots, ak. É importante que todos os pesos somem a um e que sejam simétricos para que aj a. O m-MA simples é um caso especial onde todos os pesos são iguais a 1 / m. Uma grande vantagem das médias móveis ponderadas é que elas produzem uma estimativa mais suave do ciclo tendencial. Em vez das observações que entram e que deixam o cálculo no peso cheio, seus pesos são aumentados lentamente e então lentamente diminuídos resultando em uma curva mais lisa. Alguns conjuntos específicos de pesos são amplamente utilizados. Alguns deles são apresentados na Tabela 6.3.

Comments

Popular Posts