Esta estrutura de dados é bastante imprópria para fins. Assumindo um ID identificador você precisa remodelar. por exemplo. Então, uma média móvel é fácil. Use tssmooth ou apenas gere. por exemplo. Mais informações sobre por que sua estrutura de dados é bastante imprópria: não só o cálculo de uma média móvel precisa de um loop (não envolvendo necessariamente o egen), mas você criaria várias novas variáveis extras. Usando aqueles em qualquer análise subsequente seria em algum lugar incomum e impossível. EDITAR Eu dou um loop de amostra, embora não me desvie da minha posição de que é uma técnica fraca. Eu não vejo uma razão por trás de sua convenção de nomeação, pelo que P1947 é um meio para 1943-1945. Eu suponho que isso é apenas um erro de digitação. Suponhamos que tenhamos dados para 1913-2012. Por meio de 3 anos, perdemos um ano em cada final. Isso poderia ser escrito de forma mais concisa, à custa de uma enxurrada de macros dentro das macros. Usar pesos desiguais é fácil, como acima. O único motivo para usar egen é que ele não desiste se houver faltas, o que acima fará. Por uma questão de integridade, note que é fácil lidar com falhas sem recorrer a Egen. E o denominador Se todos os valores estiverem faltando, isso se reduz a 00 ou falta. Caso contrário, se algum valor estiver faltando, adicionamos 0 ao numerador e 0 ao denominador, o que é o mesmo que ignorá-lo. Naturalmente, o código é tolerável como acima para as médias de 3 anos, mas para esse caso ou para uma média de mais de anos, substituímos as linhas acima por um loop, o que Egen faz. Tenho uma série de tempo que eu quero usar Como resposta em um modelo de regressão. O problema é que eu suspeito que as mudanças nessa variável podem ser devidas a erros de amostragem. Como resultado, criei uma média móvel dessa série de tempo para alisar os choques. Agora estou considerando usar isso como resposta no meu modelo de regressão e não na série original. Nota: Não estou construindo um modelo de tipo ARMA. Meus preditores também são séries temporais, como gasto de mídia e pontuação de confiança do consumidor. Pediu 8 de dezembro 14 às 14:07 Você deve identificar a forma dos polinômios (numerador e denominador) para o processo de erro, pois pode ser um AR strucore ou uma estrutura MA ou alguma combinação desses dois. Uma maneira (não necessariamente otimizada) é realizar uma função de transferência com um erro de ruído branco (ou seja, não ARIMA) e, em seguida, identificar uma possível estrutura ARIMA a partir dos resíduos. Ndash IrishStat 8 de dezembro 14 às 15: 09 Tenho um painel mensal de dados não balanceados de dados do balanço de 70 bancos (em média, 170 observações por banco) ao longo de 20 anos. Eu tenho autocorrelação e heterocedasticidade dentro dos painéis. Estou tentando testar as hipóteses de que existe uma relação entre depósitos transacionais e compromisso de crédito (limite de linha de crédito). Gostaria de dizer que todos são iguais, em média, um banco com mais depósitos transacionais ofereceria mais compromissos de crédito aos seus clientes. Ou seja, o argumento é que, para produzir compromissos de crédito, um banco precisa de depósitos transaccionais. Em outro passo da pesquisa, o objetivo final é construir algum tipo de função de produção para compromissos de crédito. Minha variável dependente é a proporção dos compromissos de crédito para o total de empréstimos (comitRatio). Minha variável independente (regressor) é a proporção de depósitos transacionais para depósitos totais (depRatio). Estou usando logaritmos naturais dessa variável porque eu gostaria de interpretar coeficientes estimados como elasticidades. Então eu tenho ln (comitRatio) e ln (depRatio). Ln (comitRatio) b0 b1 ln (depRatio) b2 X e onde X são variáveis de controle, a maioria delas invariante no tempo. Eu escolhi usar média móvel de 3, 6 e 12 meses para variável independente ln (depRatio). Isso ocorre porque a hipótese afirma que, no ponto t em tempo, a oferta de compromissos (comitRatio) é decidida com base na depravação de períodos anteriores. Além disso, uma vez que o regressor depracional para alguns bancos (especialmente os mais pequenos) varia muito de um mês para o outro, suponho que uma média móvel me mostre uma imagem melhor. Minha principal preocupação é o efeito ceteris paribus da variável independente sobre o dependente. Estou trabalhando com um modelo de efeito fixo com autocorrelação (modelo AR (1) e erro padrão robusto (comando xtpcse no Stata). O modelo funciona melhor (R2 mais elevado, estimativas de coeficientes mais altas, estatísticas z mais elevadas) quando uso média móvel do que quando uso os valores originais (mesmo quando uso valores atrasados, como L. depRatio). Minha pergunta é, dada esta configuração, posso usar a média móvel apenas na variável independente? Eu sinto uma variável independente, bem como dependente, ou não seria aconselhável suavizar a variável dependente. O objetivo da sua modelagem poderia ser, por ex. (1) descritivo, (2) explicativo ou (3) preditivo. Se (1), o alisamento poderia ser útil. Você pode obter a tendência de mudança lenta e usar isso para visualizações de dados. Você veria as relações entre os componentes da tendência do movimento lento das diferentes séries mais claramente do que usar a série original. Claro, você teria que reconhecer que o alisamento ocorreu e que as relações que você provocou apenas ocupam por componentes suavizados, enquanto as variáveis reais são mais erráticas. Se (2), usando diretamente variáveis alisadas, as estimativas do ponto de confusão e seus erros padrão em seus modelos. Portanto, você não pôde testar hipóteses de forma direta. A decomposição de séries temporais (veja abaixo) provavelmente pode ser útil aqui. Se (3), em vez de suavizar, você poderia tentar decompor as séries temporais na tendência de movimento lento, componentes sazonais e restantes. Então, você poderia tentar modelar e prever cada um deles separadamente e, em seguida, juntar essas previsões para obter uma previsão da variável original. Por outro lado, o alisamento puro pode fazer você perder informações valiosas. Seu caso parece ser explicativo. Se você estiver interessado na relação de longo prazo entre variáveis, você provavelmente deve usar a decomposição de séries temporais e interpretar suas conclusões de acordo. Ou seja, você não deve reivindicar um relacionamento entre as variáveis originais, mas apenas entre componentes específicos. Você também deve pensar se isso tem uma interpretação sensível da matéria. Editar (após uma edição da pergunta): remover o ruído da variável independente por suavização dá um R2 mais alto (como você observa), mas é um artefato de alisamento, portanto deve ser tomado com um grão de sal. Depois de ter alisado a variável independente, você não deve fazer a inferência direta w. r.t. A variável original. Isso é algo para ter cuidado - veja o meu ponto (2) acima. Contudo . No seu caso, parece que o alisamento pode ter sentido, já que a variável dependente no tempo t não depende do regressor como de um ponto de tempo preciso no passado, mas sim de um intervalo de tempo. Assim, você explicitamente definirá seu regressor como uma versão suave da variável original e você faria inferência em relação a este regressor suavizado. Isso poderia funcionar. Se você suavizar a variável dependente, também aumentará ainda mais o R2, mas você vai se afastar ainda mais da interpretação direta, porque novamente a mudança em R2 será um artefato de suavização. Como alternativa, você provavelmente poderia experimentar seus dados menos freqüentemente. Então você deve ver mais sinal em relação ao ruído (como o sinal se acumularia entre os pontos de amostra pouco frequentes enquanto o ruído não seria), mas você ainda poderia interpretar os resultados diretamente (ao contrário do caso de suavização). No entanto, essa abordagem poderia ser imediatamente criticada por descartar dados. Provavelmente haveria melhores alternativas. Se o regressor suavizado tiver sentido por conta própria, você não precisa fazer isso. Respondeu Jul 30 16 às 17:07 Eu alarguei a minha pergunta original. Meu principal objetivo nesta fase é testar que existe uma relação estável entre as variáveis. Não estou disposto a prever. Quando você menciona a decomposição da série quottime, você está se referindo a modelos de regressão específicos ou, por exemplo, usar variáveis simuladas mês e ano em um modelo de efeito fixo é uma decomposição da série quottime. Emiliano A. Carlevaro 1 de agosto 16 às 12:07 Brevemente, você poderia Olhe a decomposição da série temporal em livros didáticos de econometria, por exemplo QuotForecasting: Princípios e Prática por Hyndman amp Athanasopoulos (disponível gratuitamente online), Seção 6.1. Não tenho em mente uma maneira muito específica de decompor a série. Ndash Richard Hardy 1 de agosto 16 às 18:07
No comments:
Post a Comment