Teste de aderência Aula 07 Prof. Christopher Freire Souza Centro de Tecnologia Universidade Federal de Alagoas www.ctec.ufal.br/professor/cfs 2 Christopher Souza: Teste de aderência Objetivos • Desenvolver habilidades para inferir se uma população apresenta comportamento típico de uma distribuição definida • Desenvolver habilidades para inferir se o comportamento de duas populações sugere homogeneidade • Desenvolver habilidades para inferir se duas variáveis de uma mesma população são independentes 3 Christopher Souza: Teste de aderência Relevância do conteúdo • Aderência de funções de distribuição aos dados amostrais confere menor incerteza em estimativas de magnitude e freqüência • Independência estatística entre variáveis interfere decisivamente no planejamento de experimentos 4 Christopher Souza: Teste de aderência Conteúdo • • • • • • • Papéis de probabilidade c² Tabela de contingência Kolmogorov-Smirnov Anderson-Darling Filiben Comentários gerais 5 Christopher Souza: Estimação de parâmetros Papel de probabilidade • Grau de linearidade dos dados dispostos no gráfico servem à avaliação do ajuste ao modelo de distribuição para o qual foi elaborado o papel de probabilidade (ajuste de eixo) • Quantidade de dados pode levar as posições de plotagem de probabilidades a valores que mais aproxime dados à reta. 6 Christopher Souza: Teste de aderência Teste c² • Procedimento: ▫ Amostra de tamanho n é arranjada em histogramas de r intervalos de classe ▫ Estima-se a freqüência esperada no i-ésimo intervalo de classe a partir da fdp do modelo de distribuição em teste ▫ Define-se o número esperado (Ei) de observações a partir das freqüencias e tamanho de amostra ▫ Mescla-se intervalos para que tenham ao menos 5 valores esperados ▫ A partir dos valores observados para cada classe (Oi), estima-se c² por meio da 𝑟 𝑂𝑖 − 𝐸𝑖 2 fórmula χ² = 𝑖=1 𝐸𝑖 ▫ Sugere-se a rejeição da hipótese de que o modelo (k coeficientes) proposto tem bom ajuste se χ² > χ2𝛼,𝑟−𝑘−1 • MATLAB: chi2gof 7 Christopher Souza: Teste de aderência Tabelas de contingência • Aplicações ▫ Teste de Independência de duas variáveis oriundas de uma mesma população ▫ Teste de Homogeneidade de informações de duas populações Oi Preto Branco Amarelo / Laranja Total Controle 491 377 31 899 Casos 213 112 8 333 Total 704 489 39 1232 Ei Preto Branco Amarelo / Laranja Total • Cálculo de Ei: • Estatística de teste: 𝑟 χ² = 𝑖=1 𝑂𝑖 − 𝐸𝑖 𝐸𝑖 2 Controle 899 Casos 333 Total • Correção de Yates para 𝑟 𝑂𝑖 − 𝐸𝑖 − 0,5 continuidade χ² = 𝐸𝑖 • MATLAB: crosstab 𝑖=1 704 2 489 39 χ² > χ2𝛼,(𝑟−1)∙(𝑐−1) 1232 8 Christopher Souza: Teste de aderência Teste de Kolmogorov-Smirnov • Requisito: ▫ Dados contínuos ▫ Parâmetros da fap definidos sem usar informação da amostra • Procedimento: ▫ Ordenar os dados de forma crescente ▫ Estimar freqüências empíricas a partir de • Valor crítico: ▫ Para n<40, obtenha da tabela 7.5 do Naghettini e Pinto (pg 277) ▫ Para n>40 Se a=0,05 Se a=0,01 Onde m é a posição na série ordenada ▫ Estatística de teste: • MATLAB: kstest 9 Christopher Souza: Teste de aderência Teste de Anderson-Darling • Mesmo princípio do teste de Kolmogorov-Smirnov • Peso maior na análise de aderência para as caudas • MATLAB: adtest • Procedimento: ▫ Ordenar os dados de forma crescente ▫ Estatística de teste (fc=fator de correção): • Fator de correção: • Fator de correção: 10 Christopher Souza: Teste de aderência Teste de Filliben • H0: dados seguem modelo de distribuição específico • Estatística de teste: ▫ Correlação entre dados ordenados (xi) e dados estimados (wi) pela função inversa do modelo específico para probabilidade empírica (qi) • Procedimento: ▫ Ordenar os dados de forma crescente ▫ Calcular wi: 𝑤𝑖 = 𝐹𝑥−1 1 − 𝑃𝑒 11 Christopher Souza: Teste de aderência Teste de Filliben • Procedimento (continuação): ▫ Hipótese nula rejeitada se estatística de teste for inferior ao valor crítico Para distribuição normal e log-normal, utilize tabela 7.10 do Naghettini e Pinto (pg 282) Para distribuição Gumbel e Weibull com 2 coeficientes, utilize tabela 7.11 do Naghettini e Pinto (pg 283) Para distribuição GEV, utilize tabela 7.12 do Naghettini e Pinto (pg 284) Para distribuição LogPearson III, com a=0,05 e g≤|5|, utilize a equação 12 Christopher Souza: Teste de aderência Comentários gerais • Naghettini e Pinto sugerem que testes de aderência não são comparáveis e que por esta razão não se deve considerar rigor na seleção da técnica a ser aplicada • Por outro lado, observa-se razoabilidade na concepção das técnicas, parecendo interessante aplicar o conjunto de métodos a valores obtidos a partir de funções geradoras de números aleatórios que sigam as diferentes distribuições