EE-240/2009
Estimação Não-Paramétrica
Estimação Não-Paramétrica
EE-240/2009
Estimação Não-Paramétrica
Estimação Paramétrica
•
Assumir uma certa distribuição (normal, exponencial, Weibull, etc.)
•
Estimar os parâmetros da distribuição a partir das observações
•
Utilizar a distribuição com os parâmetros estimados.
EE-240/2009
Estimação Não-Paramétrica
Densidade Normal
EE-240/2009
Estimação Não-Paramétrica
30 observações
EE-240/2009
Estimação Não-Paramétrica
OK
Função densidade de probabilidade estimada
(assumindo distribuição normal)
EE-240/2009
Estimação Não-Paramétrica
Uma Densidade Bimodal
EE-240/2009
Estimação Não-Paramétrica
30 observações
EE-240/2009
Estimação Não-Paramétrica
No Good!
Função densidade de probabilidade estimada
(assumindo distribuição normal)
EE-240/2009
Estimação Não-Paramétrica
Métodos não-paramétricos
•
Nãoassumir um tipo específico de distribuição a priori
•
Estimar a densidade de probabilidade a partir das observações
•
Utilizar a densidade de probabilidade estimada.
EE-240/2009
Estimação Não-Paramétrica
Exemplo: Histograma (1)
EE-240/2009
Estimação Não-Paramétrica
30 observações
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 10 trechos
EE-240/2009
Estimação Não-Paramétrica
Normalizar
EE-240/2009
Estimação Não-Paramétrica
Ajustar
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 5 trechos
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 20 trechos
EE-240/2009
Estimação Não-Paramétrica
60 observações
EE-240/2009
Estimação Não-Paramétrica
120 observações
EE-240/2009
Estimação Não-Paramétrica
240 observações
EE-240/2009
Estimação Não-Paramétrica
480 observações
EE-240/2009
Estimação Não-Paramétrica
960 observações
EE-240/2009
Estimação Não-Paramétrica
1920 observações
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 10 trechos
30 observações
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 20 trechos
EE-240/2009
Estimação Não-Paramétrica
3840 observações
EE-240/2009
Estimação Não-Paramétrica
• “Kernel density estimation”:
K(x) = Função kernel de “área unitária”
h = Parâmetro de alargamento (suavização)
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=2
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
[F,XI]=KSDENSITY(X) computes a probability density
estimate of the sample in the vector X. KSDENSITY
evaluates the density estimate at 100 points
covering the range of the data. F is the vector of
density values and XI is the set of 100 points. The
estimate is based on a normal kernel function, using
a window parameter (bandwidth) that is a function of
thenumber of points in X.
F=KSDENSITY(X,XI) specifies the vector XI of
values where the density estimate is to be
evaluated.
(Matlab Statistics Toolbox)
EE-240/2009
Estimação Não-Paramétrica
Vantagens
Métodos paramétricos:
Métodos não-paramétricos:
•
•
Propriedades teóricas bemestabelecidas.
Dispensam a escolha a priori
de um tipo de distribuição.
•
Aplicabilidade mais ampla.
•
Simplicidade de uso.
EE-240/2009
Estimação Não-Paramétrica
Desvantagens
Métodos paramétricos:
Métodos não-paramétricos:
•
•
Requerem um número maior de
amostras para atingir a mesma
“qualidade” de ajuste.
•
Maior dificuldade para o
estabelecimento de propriedades
teóricas.
Podem levar a resultados
inadequados se a população
não seguir a distribuição
assumida na análise.
EE-240/2009
Estimação Não-Paramétrica
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
•
Motivação: Em muitos casos, pode não ser trivial obter o intervalo
de confiança para uma dada estimativa.
•
Exemplo (prognóstico baseado em análise de tendência):
Previsão da Remaining Useful Life com base na série histórica de
um índice de degradação.
EE-240/2009
Estimação Não-Paramétrica
EE-240/2009
Estimação Não-Paramétrica
•
Pode não ser possível obter o intervalo de confiança de forma analítica se
os dados não se conformarem às hipóteses usuais (ruído gaussiano,
homoscedástico, etc.)
EE-240/2009
Estimação Não-Paramétrica
•
Bootstrap: Técnica de reamostragem (com reposição) que pode
ser empregada para obter informações sobre a incerteza
associada a uma estimativa.
EE-240/2009
Estimação Não-Paramétrica
Amostragem com reposição
Reamostragem
Conjunto
original
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
Reamostragem
Conjunto
original
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
Reamostragem
Conjunto
original
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
Reamostragem
Conjunto
original
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
Reamostragem
Conjunto
original
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
Reamostragem
Conjunto
original
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
Reamostragem
Conjunto
original
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
Bootstrap 1
Conjunto
original
Bootstrap 2
Reamostragens
Bootstrap 3
EE-240/2009
Estimação Não-Paramétrica
Uso de Bootstrap em estimação
•
Considere que uma variável y tenha sido estimada a partir de n
observações de uma variável x:
•
Sejam X1, X2, ..., XN bootstraps gerados a partir de X. Seja ainda:
•
Pode-se então levantar estatísticas com base nas N estimativas
resultantes.
EE-240/2009
Estimação Não-Paramétrica
• Exemplo 1: Estimativa da Mediana
Amostra de 10 observações gerada a partir de uma distribuição
uniforme no intervalo [0, 10] (números inteiros):
X = { 10, 2, 6, 5, 9, 8, 5, 0, 8 }.
Cálculo da mediana:
Xordenado = { 0, 2, 5, 5, 6, 8, 8, 9, 10 }
EE-240/2009
Estimação Não-Paramétrica
• Estimativas obtidas (em ordem crescente):
•
Intervalo de confiança para a estimativa (70% de confiança 5-6):
EE-240/2009
Estimação Não-Paramétrica
•
Exemplo 2 Estimativa de Mediana
Amostra de 30 observações gerada a partir de uma distribuição uniforme no
intervalo [0, 10]:
EE-240/2009
Estimação Não-Paramétrica
•
Exemplo 2 Estimativa de Mediana
Amostra de 30 observações gerada a partir de uma distribuição uniforme no
intervalo [0, 10]:
•Em 69 dos 100
bootstraps, a
mediana obtida
estava no intervalo
[4, 6].
•Intervalo [4, 6] 
69% de confiança.
EE-240/2009
Estimação Não-Paramétrica
Densidade de probabilidade
para o resultado obtido por Bootstrap
•
Pode-se aplicar o método das janelas de Parzen aos resultados
obtidos a partir dos bootstraps.
•
Neste caso, o resultado de cada bootstrap é considerado uma
“observação” da grandeza a ser estimada.
EE-240/2009
Estimação Não-Paramétrica
Exemplo anterior com kernel gaussiano
EE-240/2009
Estimação Não-Paramétrica
Bootstrap e análise de tendência
EE-240/2009
Estimação Não-Paramétrica
d
d
t
d
t
d
t
t
EE-240/2009
Estimação Não-Paramétrica
BOOTSTRP Bootstrap statistics.
BOOTSTRP(NBOOT,BOOTFUN,...) draws NBOOT bootstrap
data samples and analyzes them using the function,
BOOTFUN. NBOOT must be a positive integer. The
third and later arguments are the data; BOOTSTRP
passes bootstrap samples of the data to BOOTFUN.
(Matlab Statistics Toolbox)
EE-240/2009
Estimação Não-Paramétrica
Muito Obrigado!
EE-240/2009
Download

Estimação Não