Sunday 13 August 2017

Média Móvel Ponderada Exponencial Java


Eu essencialmente tenho uma série de valores como este: a matriz acima é simplificada, estou coletando 1 valor por milissegundo no meu código real e preciso processar a saída em um algoritmo que escrevi para encontrar o pico mais próximo antes de um ponto no tempo. Minha lógica falha porque no meu exemplo acima, 0.36 é o pico real, mas meu algoritmo olhava para trás e veria o último número 0.25 como o pico, pois há uma diminuição para 0.24 antes dele. O objetivo é levar esses valores e aplicar um algoritmo para eles, que os suavizará um pouco para que eu tenha mais valores lineares. (Ie: Id como os meus resultados para serem curvy, não jaggedy) Eu fui dito para aplicar um filtro exponencial de média móvel aos meus valores. Como posso fazer isso. É muito difícil para mim ler equações matemáticas, eu lido muito melhor com o código. Como faço para processar valores na minha matriz, aplicando um cálculo exponencial da média móvel para os fazer sair, solicitado 8 de fevereiro às 20:27 Para calcular uma média móvel exponencial. Você precisa manter algum estado ao redor e você precisa de um parâmetro de ajuste. Isso exige uma pequena classe (supondo que você esteja usando o Java 5 ou posterior): instanciar com o parâmetro de decaimento desejado (pode ser necessário que a sintonização esteja entre 0 e 1) e depois use a média () para filtrar. Ao ler uma página sobre uma recorrência matemática, tudo o que você realmente precisa saber ao transformá-lo em código é que os matemáticos gostam de escrever índices em arrays e seqüências com subscritos. (Eles também têm algumas outras notações, o que não ajuda.) No entanto, o EMA é bastante simples, pois você só precisa se lembrar de um valor antigo, não é necessário nenhum arrays de estados complicados. Respondeu 8 de fevereiro às 20:42 TKKocheran: praticamente. Não é bom quando as coisas podem ser simples (Se começar com uma nova seqüência, obtenha uma nova média). Observe que os primeiros termos da seqüência média saltarão em torno de um bit devido a efeitos de limites, mas você obtém aqueles com outras médias móveis também. No entanto, uma boa vantagem é que você pode envolver a lógica média móvel na média e experimentar sem incomodar demais o seu programa. Ndash Donal Fellows 9 de fevereiro às 0:06 Estou tendo dificuldade em entender suas perguntas, mas vou tentar responder de qualquer maneira. 1) Se o seu algoritmo encontrou 0,25 em vez de 0,36, então é errado. É errado porque assume um aumento ou diminuição monotônico (que sempre está subindo ou sempre está indo para baixo). A menos que você tenha média de todos os seus dados, seus pontos de dados --- como você os apresenta --- são não-lineares. Se você realmente quer encontrar o valor máximo entre dois pontos no tempo, então corte sua matriz de tmin para tmax e encontre o máximo desse subarray. 2) Agora, o conceito de médias móveis é muito simples: imagine que eu tenho a seguinte lista: 1.4, 1.5, 1.4, 1.5, 1.5. Eu posso suavizar, levando a média de dois números: 1.45, 1.45, 1.45, 1.5. Observe que o primeiro número é a média de 1,5 e 1,4 (segundo e primeiro número), a segunda (nova lista) é a média de 1,4 e 1,5 (terceira e segunda lista antiga) a terceira (nova lista) a média de 1,5 e 1,4 (Quarto e terceiro), e assim por diante. Eu poderia ter feito período três ou quatro, ou n. Observe como os dados são muito mais suaves. Uma boa maneira de ver as médias móveis no trabalho é ir para o Google Finance, selecionar um estoque (tente Tesla Motors bastante volátil (TSLA)) e clique em técnicas na parte inferior do gráfico. Selecione a média móvel com um período determinado e a média móvel exponencial para comparar suas diferenças. A média móvel exponencial é apenas uma outra elaboração deste, mas considera os dados mais antigos inferiores aos novos dados, esta é uma maneira de polarizar o alisamento para trás. Leia a entrada da Wikipedia. Então, isso é mais um comentário do que uma resposta, mas a pequena caixa de comentários foi apenas pequena. Boa sorte. Se você estiver tendo problemas com a matemática, você poderia ir com uma média móvel simples em vez de exponencial. Então, a saída que você obtém seria os últimos x termos divididos por x. Pseudocódigo não testado: note que você precisará lidar com as partes de início e término dos dados, pois claramente você não pode significar os últimos 5 termos quando estiver no seu segundo ponto de dados. Além disso, existem maneiras mais eficientes de calcular essa média móvel (soma sumária - a mais nova), mas é para obter o conceito de o que está acontecendo. Respondeu 8 de fevereiro às 20:41 Sua resposta 2017 Stack Exchange, Inc. Preciso acompanhar os últimos 7 dias de horas de trabalho em um loop de leitura de arquivos planos. Está sendo usado para medir a fatigabilidade das listas de trabalho. Agora eu tenho algo que funciona, mas parece bastante detalhado e não tenho certeza se há um padrão que é mais sucinto. Atualmente, eu tenho uma classe Java com uma matriz estática para armazenar os últimos dados de x dias, então, ao ler o arquivo, retiro o primeiro elemento e mova os outros 6 (por um total de uma semana) de volta por um. O processamento desta matriz estática é feito em seu próprio método, ou seja. A minha pergunta: esta é uma abordagem de design razoável, ou há algo cegamente óbvio e simples para fazer esta tarefa. Obrigado, eles pediram 30 de agosto 11 às 14:33. Obrigado, pessoal: eu recebi a mensagem: use um objeto de nível superior e explore o Métodos relevantes ou um buffer circular. Excelentes respostas, todas elas. Quando você pensa sobre isso, você sempre precisa ter acesso a toda a matriz para que você possa se livrar daquela primeira entrada - da qual eu não tinha certeza por minha conta. Eu aliviei que eu não tivesse perdido algum liner e estava basicamente em uma faixa razoável, se não eficiente e fácil. Isto é o que eu adoro neste site: respostas de alta qualidade e relevantes de pessoas que conhecem o seu sht. Ndash Pete855217 30 de agosto 11 às 15:05 Por que você inicializa o runningTotal para null O que é seu tipo Onde é declarado Isso faria bem se você colocar alguns exemplos de código que se assemelham ao código Java real. Continuando, minha crítica seria a seguinte: sua função faz demais. Uma função ou método deve ser coeso. Mais apropriadamente, eles devem fazer uma coisa e uma coisa apenas. Pior ainda, o que acontece no seu loop for quando x 5 Você copia runningTotal6 em runningTotal5. Mas então você tem duas cópias do mesmo valor na posição 5 e 6. No seu projeto, sua função movesshuffles os itens em sua matriz calcula o material total de impressões para o erro padrão retorna o total. Faz demais. Minha primeira sugestão não é mover coisas na matriz. Em vez disso, implemente um buffer circular e use-o em vez da matriz. Isso simplificará seu design. A minha segunda sugestão é dividir as coisas em funções que são coesas: tenha uma estrutura de dados (um buffer circular) que lhe permita adicionar a ela (e isso diminui a entrada mais antiga sempre que ela atinja sua capacidade). Interator tem uma função que calcula o total no iterador (você não se importa se você estiver calculando o total de uma matriz, lista ou bufer circular). Não o chame total. Chame isso de soma, que é o que você está informando. Isso é o que eu faço :) Essa é a ótima informação de luis, no entanto, lembre-se de que esta função é uma pequena parte da funcionalidade da classe, e seria um excesso para adicionar muito código para torná-la perfeita. Você é tecnicamente correto, e eu entendo que meu código faz 39 muito muito39, mas, ao mesmo tempo, às vezes é melhor errar ao lado de um código menor e mais claro do que ir para a perfeição. Dadas as minhas habilidades em Java, mesmo fazer o pseudocódigo que você descreve a compilação me faria soprar meu orçamento neste (), mas obrigado pela descrição clara. Ndash Pete855217 31 de agosto 11 às 2:23 Hmmm, não é sobre a perfeição, mas sobre práticas industriais estabelecidas que conhecemos há 3 décadas. O código limpo é sempre um que é particionado. Temos décadas de evidências que indicam que este é o caminho a seguir no caso geral (em termos de custo-eficiência, redução de defeitos, compreensão, etc.). A menos que seja um código descartável por um tipo de coisa única. Nunca é dispendioso fazer isso quando se inicia qualquer análise de problema dessa maneira. Codificação 101, quebra o problema e o código segue, nem excesso nem dificuldade) ndash luis. espinal 31 de agosto 11 às 15:55 Sua tarefa é muito simples e o enfoque que você adotou é certamente bom para o trabalho. No entanto, se você quiser usar um design melhor, você deve se livrar de todo esse movimento numérico, você usa uma fila FIFO e faz bom uso de métodos push e pop, de modo que o código não reflete qualquer movimento de dados, apenas as duas ações de lógica De novos dados e remova dados com mais de 7 dias. Respondeu 30 de agosto 11 às 14: 49Explorando a volatilidade média móvel média ponderada exponencialmente é a medida de risco mais comum, mas vem em vários sabores. Em um artigo anterior, mostramos como calcular a volatilidade histórica simples. (Para ler este artigo, consulte Usando a volatilidade para avaliar o risco futuro.) Usamos os dados atuais do preço das ações da Googles para calcular a volatilidade diária com base em 30 dias de estoque de dados. Neste artigo, melhoraremos a volatilidade simples e discutiremos a média móvel ponderada exponencialmente (EWMA). Vs históricos. Volatilidade implícita Primeiro, colocamos essa métrica em um pouco de perspectiva. Existem duas abordagens amplas: volatilidade histórica e implícita (ou implícita). A abordagem histórica pressupõe que o passado é o prólogo que medimos a história na esperança de que seja preditivo. A volatilidade implícita, por outro lado, ignora o histórico que resolve para a volatilidade implícita nos preços de mercado. Espera que o mercado conheça melhor e que o preço de mercado contenha, mesmo que de forma implícita, uma estimativa consensual da volatilidade. (Para leitura relacionada, veja Os Usos e Limites da Volatilidade.) Se nos concentrarmos apenas nas três abordagens históricas (à esquerda acima), eles têm dois passos em comum: Calcule a série de retornos periódicos Aplicar um esquema de ponderação Primeiro, nós Calcule o retorno periódico. Isso geralmente é uma série de retornos diários, em que cada retorno é expresso em termos compostos continuamente. Para cada dia, tomamos o log natural da proporção dos preços das ações (ou seja, preço hoje dividido por preço ontem e assim por diante). Isso produz uma série de retornos diários, de u i to u i-m. Dependendo de quantos dias (m dias) estamos medindo. Isso nos leva ao segundo passo: é aqui que as três abordagens diferem. No artigo anterior (Usando o Volatility To Gauge Future Risk), mostramos que sob um par de simplificações aceitáveis, a variância simples é a média dos retornos quadrados: Observe que isso resume cada um dos retornos periódicos, então divide esse total pelo Número de dias ou observações (m). Então, é realmente apenas uma média dos retornos periódicos quadrados. Dito de outra forma, cada retorno quadrado recebe um peso igual. Então, se o alfa (a) é um fator de ponderação (especificamente, um 1m), então uma variância simples parece algo assim: O EWMA melhora a diferença simples. A fraqueza dessa abordagem é que todos os retornos ganham o mesmo peso. O retorno de Yesterdays (muito recente) não tem mais influência na variação do que o retorno dos últimos meses. Esse problema é corrigido usando a média móvel ponderada exponencialmente (EWMA), na qual os retornos mais recentes têm maior peso na variância. A média móvel ponderada exponencialmente (EWMA) apresenta lambda. Que é chamado de parâmetro de suavização. Lambda deve ser inferior a um. Sob essa condição, em vez de pesos iguais, cada retorno quadrado é ponderado por um multiplicador da seguinte forma: por exemplo, RiskMetrics TM, uma empresa de gerenciamento de risco financeiro, tende a usar uma lambda de 0,94 ou 94. Neste caso, o primeiro ( Mais recente) o retorno periódico ao quadrado é ponderado por (1-0,94) (94) 0 6. O próximo retorno ao quadrado é simplesmente um múltiplo lambda do peso anterior neste caso 6 multiplicado por 94 5,64. E o peso do terceiro dia anterior é igual (1-0,94) (0,94) 2 5,30. Esse é o significado de exponencial em EWMA: cada peso é um multiplicador constante (isto é, lambda, que deve ser inferior a um) do peso dos dias anteriores. Isso garante uma variação ponderada ou tendenciosa em relação a dados mais recentes. (Para saber mais, confira a Planilha do Excel para a Volatilidade dos Googles.) A diferença entre a simples volatilidade e o EWMA para o Google é mostrada abaixo. A volatilidade simples efetivamente pesa cada retorno periódico em 0.196 como mostrado na Coluna O (tivemos dois anos de dados diários sobre o preço das ações. Isso é 509 devoluções diárias e 1509 0.196). Mas observe que a coluna P atribui um peso de 6, então 5.64, depois 5.3 e assim por diante. Essa é a única diferença entre variância simples e EWMA. Lembre-se: depois de somar toda a série (na coluna Q), temos a variância, que é o quadrado do desvio padrão. Se queremos volatilidade, precisamos lembrar de tomar a raiz quadrada dessa variância. Qual é a diferença na volatilidade diária entre a variância e EWMA no caso do Googles. É significativo: a variância simples nos deu uma volatilidade diária de 2,4, mas a EWMA deu uma volatilidade diária de apenas 1,4 (veja a planilha para obter detalhes). Aparentemente, a volatilidade de Googles estabeleceu-se mais recentemente, portanto, uma variação simples pode ser artificialmente alta. A diferença de hoje é uma função da diferença de dias de Pior. Você notará que precisamos calcular uma série longa de pesos exponencialmente decrescentes. Nós não vamos fazer a matemática aqui, mas uma das melhores características do EWMA é que toda a série se reduz convenientemente a uma fórmula recursiva: Recursiva significa que as referências de variância de hoje (ou seja, são uma função da variância dos dias anteriores). Você também pode encontrar esta fórmula na planilha e produz exatamente o mesmo resultado que o cálculo de longo prazo. A variação de hoje (sob EWMA) é igual a variância de ontem (ponderada por lambda) mais retorno quadrado de ontem (pesado por menos a lambda). Observe como estamos apenas adicionando dois termos em conjunto: variância ponderada de ontem e atraso de ontem, retorno quadrado. Mesmo assim, lambda é o nosso parâmetro de suavização. Um lambda mais alto (por exemplo, como RiskMetrics 94) indica decadência mais lenta na série - em termos relativos, teremos mais pontos de dados na série e eles vão cair mais devagar. Por outro lado, se reduzirmos a lambda, indicamos maior deterioração: os pesos caem mais rapidamente e, como resultado direto da rápida deterioração, são usados ​​menos pontos de dados. (Na planilha, lambda é uma entrada, para que você possa experimentar sua sensibilidade). Resumo A volatilidade é o desvio padrão instantâneo de um estoque e a métrica de risco mais comum. É também a raiz quadrada da variância. Podemos medir a variação historicamente ou implicitamente (volatilidade implícita). Ao medir historicamente, o método mais fácil é a variância simples. Mas a fraqueza com variância simples é que todos os retornos recebem o mesmo peso. Então, enfrentamos um trade-off clássico: sempre queremos mais dados, mas quanto mais dados temos, mais nosso cálculo será diluído por dados distantes (menos relevantes). A média móvel ponderada exponencialmente (EWMA) melhora a variação simples ao atribuir pesos aos retornos periódicos. Ao fazer isso, podemos usar um grande tamanho de amostra, mas também dar maior peso aos retornos mais recentes. (Para ver um tutorial de filme sobre este tópico, visite a Tartaruga Bionica.)

No comments:

Post a Comment