Verossimilhança
• Construção de modelos:
• 1 estimativa dos parâmetros que melhor
ajustam os modelos aos dados,
• 2 selecionar aqueles modelos que tem o
melhor ajuste
• Métrica usada para avaliar o ajuste
Verossimilhança: probabilidade de ocorrência
dos dados dado um modelo.
Modelo
• Parte determinística: Expectativa da média da
distribuição de erros.
• Y= Normal(ax+b, σ)
• Y=Poisson(ax+b)
As distribuições de erros pertencem à famílias de
funções exponenciais e podem ser descritas por:
Onde θi e φ são parâmetros de localização e escala,
respectivamente.
Ex. Poisson:
• Binomial
• Normal
Estimativas de parâmetros: uma única
distribuição
• Conjunto de dados independentes vindos
todos da mesma distribuição.
• Ex: Predação de frutos em experimento de
remoção – binomial; Densidade de árvores
com distribuição aleatória em parcelas –
Poisson.
• Estimo os parâmetros da distribuição.
Máxima verossimilhança
• Maximizar a verossimilhança entre os dados e
o modelo
• Estimativa dos parâmetros de conjunto
independente de dados: verossimilhança
conjunta é o produto das estimativas
individuais a partir de cada dado.
• Se a distribuição é única (dados vindos da
mesma distribuição) temos o produto de
termos similares
• Por convenção, usa-se: - log do valor de
verossimilhança e procuramos minimizar o
soma das mesmas.
Exemplo: uma única observação: k sucessos em N
possibilidades, dado uma probabilidade individual p de
sucessos
• Em n tentativas, cada uma com N possibilidades, e o
numero de sucessos da iésima tentativa é ki
Melhor valor para p
• Analiticamente: derivada do L em relação a p.
Máximo – derivada é zero.
Numero de sucessos
Numero de tentativas
• Para Poisson, o melhor estimador de lambda é
a média.
• Para a normal o melhor estimador da média e
desvio são estes parâmetros calculados à
partir dos dados.
• Para algumas distribuições, entretanto, não há
solução analítica: solução numérica
Solução numérica no R.
• P1=rbinom(20, size =6, p=0.7)
• #Crio a função de densidade acumulada
(verossimilhança bionomial) para um dado p e
conjunto de dados x:
• binomL=function(p,k,N){-sum(dbinom(k, prob=p,
size=N, log=TRUE))}
• #usando a função optimize. Otimiza o parêmtro
escolhido, a partir de uma estimativa inicial, usando
alguns métodos
• O1=optim(fn=binomL,par=c(p=0.5),N=6,k=P1,
method= “BFGS”)
library(bbmle)
• Função mle() já usa o negativo da
verossimilhança.
• M1=mle2(minuslog=binomL,start=list(p=0.5),d
ata=list(N=6, k=P1))
Modelos mais complexos
• Ex. p=f(x)
• Y ~ binomial(p,N).
• Ajuste de uma reta ou uma curva logística
usando 3 parametros: y= a/exp((b-x)/c)
• my=c(5,6,11,20,27,33,57,43,47,31)
• co=c(5,15,20,25,30,35,40,45,55,60)
Reta com desvios normais
• #primeiro crio a função de densidade acumulada que
combina a parte determinística e a estocástica
• ren=function(p,mean,sd,x){
a=p[1]
b=p[2]
myp=a*co+b
sd1=((sum((my-myp)^2))/(length(my)-1)^0.5
-sum(dnorm(x,mean=myp,sd=sd1, log=TRUE))
}
• Agora uso a função de otimização:
• O2=optim(fn=ren,x=my,p=c(0.5,5),
method=“BFGS”).
• Como faria se quisesse comparar isto com
uma curva construída com distribuição de
posson?
• rpo=function(p,lambda,x){
a=p[1]
b=p[2]
myp=a*cob+b
-sum(dpois(x,lambda=myp, log=TRUE))
}
Agora tente fazer um ajuste a função logística:
y= a/exp((b-x)/c). Com desvios normais e depois com Poisson
• logip=function(p,lambda,x){
•
a=p[1]
•
b=p[2]
•
c=p[3]
•
myp = a/(1+exp((b-co)/c))
•
-sum(dpois(x,lambda=myp, log=TRUE))
•
}
• login=function(p,mean,sd,x){
•
a=p[1]
•
b=p[2]
•
c=p[3]
•
myp = a/(1+exp((b-co)/c))
•
sd1=(sum((my-myp)^2))^0.5
•
-sum(dnorm(x,mean=myp,sd=sd1,
log=TRUE))
•
}
Download

aula_Verossimilhanca