UNIFESP Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP São Paulo, 01 novembro de 2007 MÉTODOS QUALITATIVOS ESTATISTICA NÃO - PARAMÉTRICA Orientador: Prof. Dr. Daniel Sigulem Ana Paula Nunes Peixoto UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV Sumário • • • • • • • Introdução Métodos Não Paramétricos O método Kolmogorov - Smirnov Exemplo Resolução Conclusão Bibliografia [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 2 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV Métodos Não Paramétricos Testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a distribuição subjacente aos dados. Vantagens dos testes não paramétricos: Se a dimensão da amostra e muito pequena, pode não haver alternativa senão o recurso a testes não paramétricos, a não ser que a distribuição exata da população seja conhecida. Os testes não paramétricos requerem usualmente poucos pressupostos acerca dos dados e podem ser mais relevantes para uma determinada situação. [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 3 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV O Método Kolmogorov -Smirnov O teste de Kolmogorov-Smirnov avalia se duas amostras tem distribuições semelhantes, ou melhor dizendo, se foram extraídas de uma mesma população. Se apresentarem grandes diferenças provavelmente estas não se devem ao acaso. É um teste que detecta diferenças em relação à tendência central, dispersão e simetria. [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 4 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV Exemplo do teste de K-S Suponha que um pesquisador esteja interessado na confirmação experimental da observação sociológica, de que os negros americanos aparentam demonstrar uma hierarquia de preferências em relacão a tonalidade de pele. Para comprovar o quanto sistemáticas são essas preferências, o pesquisador tira uma fotografia de cada 1 entre 10 indivíduos negros. O fotógrafo revela essas fotografias e obtem 5 cópias de cada uma de modo que cada copia difira ligeiramente das outras em tonalidade, podendo, pois ser classificadas em 5 tipos, desde a mais clara ; Filho, UD. Introdução à Bioestatística. 9ªed. São Paulo: Elsevier; 1999. [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 5 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV Exemplo do teste de K-S até a mais escura. Em cada caso a posição mais escura é atribuido o posto 1 e assim sucessivamente ate o posto 5 a mais clara. Pede-se então a cada individuo que escolha uma dentre as 5 cópias de sua propria foto. Se os individuos forem indiferentes em relacão a tonalidade da cor da pele, a escolha deverá recair igualmente sobre os cinco postos( com excessão é claro, de diferenças aleatórias). Se, por outro lado, a cor tiver importancia, tal como supomos, entao os diversos individuos deverao consistentemente manifestar preferencia por um dos postos extremos. 1. Hipotese de Nulidade: Ho Não há diferencas no numero esperado de escolhas para cada um dos 5 postos, e quaisquer diferencas observadas serao simplesmente variacoes aleatorias da populacao retangular em que f1 = f2 =...... Fs. H1: as frequencias f1, f2, .....fs não são iguais. [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 6 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV Exemplo do teste de K-S Prova estatística: Escolhe – se a prova K-S de uma amostra porque o pesquisador deseja comparar uma distribuicão observada de escores em escala ordinal, com uma distribuicão teórica. Nível de Significância: Seja α = 0,01. N = número de indivíduos que se submeteram ao estudo 10. Distribuição amostral: A Tabela de valores Críticos de D(1) apresenta vários valores críticos de D da distribuição amostral, juntamente com suas probabilidades associadas de ocorrência sob Ho. [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 7 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV Exemplo do teste de K-S Região de rejeição: A região de rejeição consiste de todos os valores de D, calculados pela fórmula, tão grandes que a probabilidade associada a sua ocorrência sob Ho seja ≤ α = 0,01. Tabela: Preferências hipotéticas de 10 indivíduos negros em relacão a tonalidade de pele [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 8 UNIFESP UNIFESP UNIFESP Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP Tabela 1 – Método K-S Posto da Foto Escolhida METODO KOLMOGOROV-SMIRNOV (1 = Posto da mais escura) 1 2 3 4 5 f= número de indivíduos que escolheram o posto 0 1 0 5 4 Fo(x)= Distribuição Teórica acumulada das Escolhas, Segundo Ho 1\5 2\5 3\5 4\5 5\5 S10 (X) = Distribuição acumulada observada das escolhas 0\10 1\10 1\10 6\10 10\10 l Fo (X) - S10 (X) l 2\10 3\10 5\10 2\10 0 [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 9 UNIFESP UNIFESP UNIFESP Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV Exemplo do teste de K-S Tamanho da Amostra Nivel de Significancia para D= Maximo l Fo (X) - SN (X) l (N) 0,20 0,15 0,10 0,05 0,01 1 0,900 0,925 0,950 0,975 0,995 2 0,684 0,726 0,776 0,842 0,929 3 0,565 0,597 0,642 0,708 0,828 4 0,494 0,525 0,564 0,624 0,733 5 0,446 0,474 0,510 0,565 0,669 6 0,410 0,436 0,470 0,521 0,618 7 0,381 0,405 0,438 0,486 0,577 8 0,358 0,381 0,411 0,457 0,543 9 0,339 0,360 0,388 0,432 0,514 10 0,322 0,342 0,368 0,410 0,490 11 0,307 0,326 0,352 0,391 0,468 12 0,295 0,313 0,338 0,375 0,450 13 0,284 0,302 0,325 0,361 0,433 14 0,274 0,292 0,314 0,349 0,418 15 0,266 0,283 0,304 0,338 0,404 [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 10 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV K-S – O Processo Especificar a função acumulada teórica, isto é, a distribuição acumulada Ho. Dispor os escores observados em uma distribuição cumulativa, fazendo corresponder cada intervalo de SN(x) com o intervalo comparável de Fo(X). Para cada posto da distribuição cumulativa, subtrair SN(x) de Fo (x). Por meio da fórmula ( D = máximo ( Fo(X) – SN(X)) Mediante referência a Tabela, determinar a probabilidade bilateral associada a ocorrência, sob Ho, de valores tão grandes quanto o valor observado D. Se o valor p correspondente é igual, ou inferior, a α, rejeitar Ho. [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 11 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV K-S – O Processo Observe-se que fo(X) e a distribuição acumulada teórica, sob Ho, onde Ho e a hipótese de que cada uma das 5 cópias tenha precisamente 1/5 das preferências. S10(X) e a distribuição acumulada das frequências observadas das escolhas dos 10 individuos. A linha inferior da tabela de preferências hipotéticas da o valor absoluto do desvio de cada valor amostral em relacao ao correspondente valor teórico. Assim, o primeiro desvio absoluto é 2/10, que se obtém subtraindo 0 de 1/5. A simples inspeção da linha inferior da tabela de preferencias hipotéticas, revela que o valor de D para esses dados é 5/10 = 0,500. E a Tabela de valores críticos indica que, para N=10, D ≥ 0,500 tem probabilidade associada, sob Ho, p >0,01. Como o p associado ao valor observado de D é menor do que α = 0,01, nossa decisão neste estudo será rejeitar Ho em favor de H1. [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 12 UNIFESP UNIFESP Departamento de Informática em Saúde UNIFESP Universidade Federal de São Paulo – UNIFESP METODO KOLMOGOROV-SMIRNOV Conclusão do Teste Conclui-se que os indivíduos demonstram significativa preferência em relacão as tonalidades de cor. [email protected] Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa 13