Máxima Verossimilhança Almir R. Pepato O velho problema... Máxima Verossimilhança O conceito de verossimilhança refere-se a situações em que a partir de um conjunto de dados D, uma decisão deve ser tomada a respeito de explicações alternativas a seu respeito. No caso das inferências filogenéticas temos um modelo composto pela topologia, comprimento de ramos e parâmetros do modelo de substituição. Assinalando valores a esses elementos do modelo podemos computar a probabilidade dos dados sob cada um desses valores e escolher os valores mais plausíveis. REPARE QUE EM NENHUM MOMENTO A VALIDADE DO MODELO É QUESTIONADA. Ronald Fisher A história começa com o Teorema de Bayes... Isso incomodava Fisher! A história começa com o Teorema de Bayes... Como funciona: Há dois sapos de origami, Joe e Herman. Por experiências anteriores sabe-se que Joe cai 60% das vezes em pé, enquanto Herman cai apenas 20% das vezes. O nome dos sapos foi apagado. Como podemos inferir qual é Joe apenas fazendoos saltar? Primeiro lançamento, caiu em pé: A história começa com o Teorema de Bayes... Segundo lançamento, caiu em pé: Terceiro lançamento, caiu de costas: A história começa com o Teorema de Bayes... Isso incomodava Fisher! Para eliminar esse incômodo: Se os dados forem robustos isso... É muito maior que isso! Máxima Verossimilhança Exemplo simples: N=100; Caras=21 ; Coroas= 79. O modelo estabelece apenas que com alguma probabilidade , caras aparecem quando a moeda é lançada e que cada resultado é independente dos demais. A probabilidade de obtermos exatamente H =h caras a partir de n lançamentos é de: Isso pode ser lido de duas maneiras: A- Se é conhecido, então podemos computar a probabilidade de que h= 0, 1, 2, ...n. B- Caso contrário a PROBABILIDADE em questão pode ser tratada como uma função de n e h! Máxima Verossimilhança Obviamente o valor é 21/100. Mas podemos calcular isso analiticamente! Só Só para lembrar : para mostrar que sabemos cálculo! Para facilitar vamos transformar tudo em logaritmos, assim ao invés multiplicações teremos somas. Como sabemos, temos que calcular a derivada da função acima: Máxima Verossimilhança Mas o que nos interessa mesmo é poder comparar duas hipóteses. Por exemplo: segundo a nossa função, a verossimilhança de que a moeda seja nãoviciada é de: X Comparado à nosso valor máximo (0,21) temos que é 6 x 107 mais verossímil que a probabilidade que produziu os dados seja θ= 0,21 que θ= 0,5. Recordando: Modelos de substituição Para os JC69, temos: Máxima Verossimilhança 1- Cada posição no alinhamento evolui de maneira independente: 2- Cada ramo de uma filogenia evolui de maneira independente dos demais: Máxima Verossimilhança Muita conta! 22n-2 cenários Máxima Verossimilhança Se o modelo é reversível podemos enraizar em qualquer lugar. Máxima Verossimilhança Essa expressão terá 256 termos (22(5)-2 ) O que pode ser rearranjado como: HÁ! ISSO É O MESMO QUE SEGUIR A ÁRVORE DAS FOLHAS PARA A RAIZ! Máxima Verossimilhança Verossimilhança da árvore: Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0 1 0 0 Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0 1 0 0 Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0.0218338 0 1 0 0 Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0.0218338 0.0000259 0 1 0 0 Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0.0218338 0.0000259 0.0000026 0 1 0 0 Resolução do exemplo numérico 0 1 0 0 0 0 1 0 0 1 0 0 0.00097 0.02828 0.02828 0.00097 0.0000026 0.0218338 0.0000259 0.0000026 0 1 0 0 Os dados são informativos? “Likelihood-mapping Analysis” Sinal em forma de árvore: 1,2,3 Sinal em forma de rede (parcialmente resolvido): 4,5,6. Sinal em estrela: 7 Os dados são informativos? No estudo citado, a maior parte dos pontos está próximo ao centro dos triângulos, mostrando que os dados são incapazes de resolver o problema.