Testes Não Paramétricos Inferência e Decisão I Catarina Soares Tânia Silva Janeiro 2004 Instituto Superior Técnico Universidade Técnica de Lisboa 1 Sumário Testes Paramétricos vs Testes Não Paramétricos Testes Não Paramétricos para uma População Teste de Wilcoxon dos Postos Sinalizados Testes Não Paramétricos para várias Populações Teste do Sinal Teste da Mediana Conclusão 2 Testes Paramétricos vs Testes Não Paramétricos Testes Paramétricos Distribuição População é Conhecida Inferências Relativas um/vários Parâmetros Testes Não Paramétricos Distribuição População Normalmente Desconhecida Inferências Sujeitas a menos Restrições Não Envolvem, geralmente, Parâmetros 3 Testes Não Paramétricos Vantagens Poucos Pressupostos Relativos à População Facilidade de implementação Maior Perceptibilidade Aplicável em Situações Não Abrangidas Pela Normal Mais Eficientes quando as Populações não têm Dist. Normal Desvantagens Não têm Parâmetros, Dificultando Julgamentos Quantitativos entre Populações Escasso Aproveitamento de Informação da amostra 4 Teste de Wilcoxon 2 Observações de cada População total 2n observações Pressupostos Seja Zi Yi X i o Modelo é dado por Zi ei , i 1, , n Variáveis Aleatórias es são mutuamente independentes Cada variável aleatória e provém de uma população contínua e simétrica em relação à origem Teste de H0: 0 Ordenar Observações Zi ordem Crescente do valor Absoluto Determinar Ranks Ri Definir Variável 1 se Z i 0 0 se Z i 0 i , i = 1, ..., n 5 Hipóteses: B - Teste Unilateral H0 : 0 H1 : 0 A - Teste Bilateral H0: 0 H1: 0 Estatística de Teste: C - Teste Unilateral H0 : 0 H1: 0 n T Rii i 1 Estatística T corresponde à Soma dos Postos Sinalizados Positivos Regra de Decisão: A - Teste Bilateral Rejeitar H0 T t 2 , n ou T Não Rejeitar H0 n n 1 t 1 , n 2 n n 1 t 1 , n T t 2 , n 2 B - Teste Unilateral C - Teste Unilateral T t , n T n n 1 t , n 2 c.c. onde 1 2 e t , n constante c.c. 6 Amostra grande Estatística de Teste: T* T E0 T var0 T 1/ 2 T n n 1 / 4 n n 1 2n 1 / 24 1/ 2 Apresenta, quando n , distribuição assintoticamente N(0,1) Regra de Decisão: Se T * z Rejeitar H0 c.c. Não Rejeitar H0 7 Exemplo: Dados de nove pacientes que receberam um tranquilizante T. A medida utilizada consistiu no factor de escala depressivo IV de Hamilton (factor de suicídio). X – 1ª visita ao paciente, após o início da terapia Y – 2ª visita ao paciente Os pacientes diagnosticados revelaram uma mistura de ansiedade e depressão. i Zi 1 2 3 4 5 6 7 8 9 -0.952 0.147 -1.022 -0.430 -0.620 -0.590 -0.490 0.080 -0.010 Zi 0.952 0.147 1.022 0.430 0.620 0.590 0.490 0.080 0.010 i Ri 8 3 9 4 7 6 5 2 1 Rii 0 1 0 0 0 0 0 1 0 0 3 0 0 0 0 0 2 0 8 Teste do Sinal Amostra Aleatória Bivariada X1, Y1 , X 2 , Y2 , ..., X n' , Yn' Ordenação da Amostra Comparação de cada par X i , Yi Classificação de cada par Se X i Yi “+” Se X i Yi “-” Se X i Yi “0” Pressupostos A amostra aleatória bivariada , X i , Yi , é mutuamente independente A escala de medida é ordinal para cada par Os pares X i , Yi são consistentes internamente 9 Hipóteses: A - Teste Bilateral B - Teste Unilateral H0 : P P H1 : P P H0 : P P H1 : P P C - Teste Unilateral H0 : P P H1 : P P Teste nem centrado nem consistente H0 : E X i E Yi H0 : E X i E Yi H0 : E X i E Yi H1 : E X i E Yi H1 : E X i E Yi H1 : E X i E Yi Estatística de Teste: T = número total de +’s 10 Regra de Decisão: n = número total de +’s e –’s Usar as regras de decisão A, B ou C, em função das hipóteses A – Teste Bilateral n 20 Se T t ou T n t Rejeitar H0 c.c. Não Rejeitar H0 n 20 t 1 n w / 2 n 2 B – Teste Unilateral n 20 Se T n t Rejeitar H0 c.c. Não Rejeitar H0 11 n 20 t 1 n w n 2 C – Teste Unilateral n 20 Se T t c.c. Rejeitar H0 Não Rejeitar H0 n 20 t 1 n w n 2 12 Exemplo: Artigos A e B tem a mesma função mas são fabricados por processos diferentes. Os produtores desejam determinar quando é que B é preferido a A pelo consumidor. Para isso, seleccionam uma amostra aleatória de 10 consumidores, dão a cada um deles um artigo A e um artigo B e pedem-lhes que usem ambos os produtos por um período de tempo. No final desse período de tempo, oito consumidores preferiram o artigo B, um preferiu o artigo A e o último disse “não tenho preferência”. 13 Teste da Mediana Construção de uma amostra aleatória para c populações Determinar a mediana da amostra combinada 1 2 ... c Mediana O11 O12 ... O1c a Mediana O21 O22 ... O2c b Total n1 n2 ... Amostra nc Total N Pressupostos Cada amostra é uma amostra aleatória Existe independência entre amostras A escala de medida é ordinal Se todas as populações têm a mesma mediana então, apresentam a mesma probabilidade p de uma observação exceder a mediana 14 Hipóteses: H0: As c populações têm a mesma mediana H1: Pelo menos duas das populações têm medianas diferentes Estatística de Teste: T 2 N ab c i 1 O 1i ni a N 2 ni Regra de Decisão: Se T excede x1 c.c. Rejeitar H0 Não Rejeitar H0 15 Exemplo: Considere-se quatro métodos diferentes de crescimento de cereais atribuídos aleatoriamente a diferentes lotes de terreno, sendo cada lote computorizado a fim de se obter um lucro por hectare. Determinar se o lucro obtido difere entre lotes como consequência do método utilizado. Método 1 83 91 94 89 89 96 91 92 90 2 91 90 81 83 84 83 88 91 89 84 3 101 100 91 93 96 95 94 4 78 82 81 77 79 81 80 81 16 Conclusão Teste de Wilcoxon – Testa se Mediana de uma população simétrica é Zero • Teste do Sinal – Testa hipóteses da diferença entre amostras emparelhadas ser positiva ou negativa, com igual probabilidade • Teste da Mediana – Testa se X e Y, são extraídas de populações com a mesma mediana • 17 Não tem, em geral, Distribuição Conhecida Podem ser aplicados em situações para as quais testes paramétricos não têm solução Eficiência Relativa Assintótica de Testes baseados em Ranks Perda de Informação Eficiência Relativa depender da escolha de , e H1 Geralmente, os testes paramétricos são mais potentes do que os testes não paramétricos 18 Fim 07/01/2004 19