Máxima Verossimilhança
Almir R. Pepato
O velho problema...
Máxima Verossimilhança
O conceito de verossimilhança refere-se a
situações em que a partir de um conjunto de
dados D, uma decisão deve ser tomada a
respeito de explicações alternativas a seu
respeito.
No caso das inferências filogenéticas temos um
modelo composto pela topologia, comprimento
de ramos e parâmetros do modelo de
substituição.
Assinalando valores a esses elementos do
modelo podemos computar a probabilidade dos
dados sob cada um desses valores e escolher os
valores mais plausíveis.
REPARE QUE EM NENHUM MOMENTO A
VALIDADE DO MODELO É QUESTIONADA.
Ronald Fisher
A história começa com o Teorema de
Bayes...
Isso incomodava Fisher!
A história começa com o Teorema de
Bayes...
Como funciona:
Há dois sapos de origami, Joe e Herman. Por
experiências anteriores sabe-se que Joe cai 60%
das vezes em pé, enquanto Herman cai apenas
20% das vezes. O nome dos sapos foi apagado.
Como podemos inferir qual é Joe apenas fazendoos saltar?
Primeiro lançamento, caiu em pé:
A história começa com o Teorema de
Bayes...
Segundo lançamento, caiu em pé:
Terceiro lançamento, caiu de costas:
A história começa com o Teorema de
Bayes...
Isso incomodava Fisher!
Para eliminar esse incômodo:
Se os dados forem robustos
isso...
É muito maior que isso!
Máxima Verossimilhança
Exemplo simples:
N=100; Caras=21 ; Coroas= 79.
O modelo estabelece apenas que com alguma probabilidade
, caras
aparecem quando a moeda é lançada e que cada resultado é independente dos
demais.
A probabilidade de obtermos exatamente H =h caras a partir de n lançamentos é de:
Isso pode ser lido de duas maneiras:
A- Se é conhecido, então podemos computar a probabilidade de que h= 0, 1, 2,
...n.
B- Caso contrário a PROBABILIDADE em questão pode ser tratada como uma função
de n e h!
Máxima Verossimilhança
Obviamente o valor é 21/100. Mas
podemos calcular isso analiticamente! Só
Só para
lembrar
:
para mostrar
que
sabemos
cálculo!
Para facilitar vamos transformar tudo em
logaritmos, assim ao invés multiplicações
teremos somas.
Como sabemos, temos que calcular a derivada da função acima:
Máxima Verossimilhança
Mas o que nos interessa mesmo é poder
comparar duas hipóteses.
Por exemplo: segundo a nossa função, a
verossimilhança de que a moeda seja nãoviciada é de:
X
Comparado à nosso valor
máximo (0,21) temos que é 6 x
107 mais verossímil que a
probabilidade que produziu os
dados seja θ= 0,21 que θ= 0,5.
Recordando: Modelos de substituição
Para os JC69, temos:
Máxima Verossimilhança
1- Cada posição no alinhamento
evolui de maneira independente:
2- Cada ramo de uma filogenia
evolui de maneira independente
dos demais:
Máxima Verossimilhança
Muita conta!
22n-2 cenários
Máxima Verossimilhança
Se o modelo é
reversível
podemos
enraizar em
qualquer lugar.
Máxima Verossimilhança
Essa expressão terá 256
termos (22(5)-2 )
O que pode ser rearranjado como:
HÁ! ISSO É O MESMO QUE
SEGUIR A ÁRVORE DAS
FOLHAS PARA A RAIZ!
Máxima Verossimilhança
Verossimilhança da árvore:
Resolução do exemplo numérico
0
1
0
0
0
0
1
0
0
1
0
0
0
1
0
0
Resolução do exemplo numérico
0
1
0
0
0
0
1
0
0
1
0
0
0.00097
0.02828
0.02828
0.00097
0
1
0
0
Resolução do exemplo numérico
0
1
0
0
0
0
1
0
0
1
0
0
0.00097
0.02828
0.02828
0.00097
0.0000026
0
1
0
0
Resolução do exemplo numérico
0
1
0
0
0
0
1
0
0
1
0
0
0.00097
0.02828
0.02828
0.00097
0.0000026
0.0218338
0
1
0
0
Resolução do exemplo numérico
0
1
0
0
0
0
1
0
0
1
0
0
0.00097
0.02828
0.02828
0.00097
0.0000026
0.0218338
0.0000259
0
1
0
0
Resolução do exemplo numérico
0
1
0
0
0
0
1
0
0
1
0
0
0.00097
0.02828
0.02828
0.00097
0.0000026
0.0218338
0.0000259
0.0000026
0
1
0
0
Resolução do exemplo numérico
0
1
0
0
0
0
1
0
0
1
0
0
0.00097
0.02828
0.02828
0.00097
0.0000026
0.0218338
0.0000259
0.0000026
0
1
0
0
Os dados são informativos?
“Likelihood-mapping Analysis”
Sinal em
forma de
árvore:
1,2,3
Sinal em forma de rede
(parcialmente resolvido): 4,5,6.
Sinal em estrela: 7
Os dados são informativos?
No estudo citado, a
maior parte dos pontos
está próximo ao centro
dos triângulos,
mostrando que os
dados são incapazes de
resolver o problema.
Download

Aula expositiva. Exemplo numérico do algoritmo de “poda”