Teste de aderência
Aula 07
Prof. Christopher Freire Souza
Centro de Tecnologia
Universidade Federal de Alagoas
www.ctec.ufal.br/professor/cfs
2
Christopher Souza: Teste
de aderência
Objetivos
• Desenvolver habilidades para inferir se uma
população apresenta comportamento típico de
uma distribuição definida
• Desenvolver habilidades para inferir se o
comportamento de duas populações sugere
homogeneidade
• Desenvolver habilidades para inferir se duas
variáveis de uma mesma população são
independentes
3
Christopher Souza: Teste
de aderência
Relevância do conteúdo
• Aderência de funções de distribuição aos dados
amostrais confere menor incerteza em estimativas de
magnitude e freqüência
• Independência estatística entre variáveis interfere
decisivamente no planejamento de experimentos
4
Christopher Souza: Teste
de aderência
Conteúdo
•
•
•
•
•
•
•
Papéis de probabilidade
c²
Tabela de contingência
Kolmogorov-Smirnov
Anderson-Darling
Filiben
Comentários gerais
5
Christopher Souza:
Estimação de parâmetros
Papel de probabilidade
• Grau de linearidade dos dados
dispostos no gráfico servem à
avaliação do ajuste ao modelo
de distribuição para o qual foi
elaborado o papel de
probabilidade (ajuste de eixo)
• Quantidade de dados pode
levar as posições de plotagem
de probabilidades a valores
que mais aproxime dados à
reta.
6
Christopher Souza: Teste
de aderência
Teste c²
• Procedimento:
▫ Amostra de tamanho n é
arranjada em histogramas de
r intervalos de classe
▫ Estima-se a freqüência
esperada no i-ésimo intervalo
de classe a partir da fdp do
modelo de distribuição em
teste
▫ Define-se o número esperado
(Ei) de observações a partir
das freqüencias e tamanho de
amostra
▫ Mescla-se intervalos para que
tenham ao menos 5 valores
esperados
▫ A partir dos valores
observados para cada classe
(Oi), estima-se c² por
meio da
𝑟
𝑂𝑖 − 𝐸𝑖 2
fórmula
χ² =
𝑖=1
𝐸𝑖
▫ Sugere-se a rejeição da
hipótese de que o modelo (k
coeficientes) proposto tem
bom ajuste se
χ² > χ2𝛼,𝑟−𝑘−1
• MATLAB: chi2gof
7
Christopher Souza: Teste
de aderência
Tabelas de contingência
• Aplicações
▫ Teste de Independência de
duas variáveis oriundas de
uma mesma população
▫ Teste de Homogeneidade de
informações de duas
populações
Oi
Preto
Branco
Amarelo
/ Laranja
Total
Controle
491
377
31
899
Casos
213
112
8
333
Total
704
489
39
1232
Ei
Preto
Branco
Amarelo
/ Laranja
Total
• Cálculo de Ei:
• Estatística de teste:
𝑟
χ² =
𝑖=1
𝑂𝑖 − 𝐸𝑖
𝐸𝑖
2
Controle
899
Casos
333
Total
• Correção de Yates para
𝑟
𝑂𝑖 − 𝐸𝑖 − 0,5
continuidade
χ² =
𝐸𝑖
• MATLAB: crosstab
𝑖=1
704
2
489
39
χ² > χ2𝛼,(𝑟−1)∙(𝑐−1)
1232
8
Christopher Souza: Teste
de aderência
Teste de Kolmogorov-Smirnov
• Requisito:
▫ Dados contínuos
▫ Parâmetros da fap definidos
sem usar informação da
amostra
• Procedimento:
▫ Ordenar os dados de forma
crescente
▫ Estimar freqüências
empíricas a partir de
• Valor crítico:
▫ Para n<40, obtenha da tabela
7.5 do Naghettini e Pinto (pg
277)
▫ Para n>40
 Se a=0,05
 Se a=0,01
 Onde m é a posição na série
ordenada
▫ Estatística de teste:
• MATLAB: kstest
9
Christopher Souza: Teste
de aderência
Teste de Anderson-Darling
• Mesmo princípio do teste de
Kolmogorov-Smirnov
• Peso maior na análise de
aderência para as caudas
• MATLAB: adtest
• Procedimento:
▫ Ordenar os dados de forma
crescente
▫ Estatística de teste
(fc=fator de correção):
• Fator de correção:
• Fator de correção:
10
Christopher Souza: Teste
de aderência
Teste de Filliben
• H0: dados seguem modelo de
distribuição específico
• Estatística de teste:
▫ Correlação entre dados
ordenados (xi) e dados
estimados (wi) pela função
inversa do modelo
específico para
probabilidade empírica (qi)
• Procedimento:
▫ Ordenar os dados de forma
crescente
▫ Calcular wi:
𝑤𝑖 = 𝐹𝑥−1 1 − 𝑃𝑒
11
Christopher Souza: Teste
de aderência
Teste de Filliben
• Procedimento (continuação):
▫ Hipótese nula rejeitada se
estatística de teste for
inferior ao valor crítico
 Para distribuição normal e
log-normal, utilize tabela
7.10 do Naghettini e Pinto
(pg 282)
 Para distribuição Gumbel e
Weibull com 2 coeficientes,
utilize tabela 7.11 do
Naghettini e Pinto (pg 283)
 Para distribuição GEV,
utilize tabela 7.12 do
Naghettini e Pinto (pg 284)
 Para distribuição LogPearson III, com a=0,05 e
g≤|5|, utilize a equação
12
Christopher Souza: Teste
de aderência
Comentários gerais
• Naghettini e Pinto sugerem que testes de aderência não
são comparáveis e que por esta razão não se deve
considerar rigor na seleção da técnica a ser aplicada
• Por outro lado, observa-se razoabilidade na concepção
das técnicas, parecendo interessante aplicar o conjunto
de métodos a valores obtidos a partir de funções
geradoras de números aleatórios que sigam as diferentes
distribuições
Download

Slide 1 - Universidade Federal de Alagoas