PROBABILIDADE DE SIGNIFICÂNCIA O procedimento de construção de um teste de hipóteses parte da fixação de um valor denominado nível de significância ,cujo procedimento pode levar à rejeição da hipótese nula (HO) para um valor menor. Outra forma de proceder consiste em determinar a probabilidade de significância ou nível descritivo ou ainda valor-p (“p-value”) do teste. Os passos dos dois procedimentos são muito parecidos; a principal diferença está em não construir a região crítica, no último procedimento. O que se faz é indicar a probabilidade de ocorrer valores da estatística mais extremos que o observado, sob a veracidade da hipótese HO. EXEMPLO 1: Uma estação de TV afirma que 60% dos televisores estavam ligados no seu programa especial da última segunda-feira. Uma rede competidora deseja contestar essa afirmação e decide usar uma amostra de 200 famílias para um teste. Vamos colocar à prova a afirmação da estação, isto é, HO : = 0,60 (60% ligados no programa,a competidora não tem razão) H1 : < 0,60 (menos de 60% ligados no programa: a competidora tem razão). Admitamos que da pesquisa feita com as 200 famílias, 104 que estavam assistindo ao programa. Resolução por testes de hipóteses (Graduação) Fixaremos = 0,05 e sob a veracidade de HO, tem-se: 0,24 (1 ) ˆp ~ N , ˆ p ~ N 0,60; n 200 0,05 z 1,64 zcalc 0,52 0,60 0,08 2,31 0,0346 0,24 zcalc < z -4 -3,5 => -3 -2,5 -2 -2,31 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 -1,64 rejeita-se HO CONCLUSÃO: No nível de 5% de significância, há evidências que a audiência do programa de 2ª feira não foi de 60% e sim inferior a esse número ( < 60%). Resolução por Nível Descritivo (“p-value”) HO : = 0,60 e sob a veracidade de HO; 0,24 ˆ ~ N 0,60; p 200 A partir dos resultados amostrados obtivemos pˆ 0,52 . Portanto, podemos calcular qual a probabilidade de ocorrerem valores de p mais desfavoráveis para HO do que o obtido. pˆ 0,52 200 (0,52 0,60 ) P Z P 0 , 24 H 0 Verd . P( Z 2,31) 0,01044 1,044 % Esse resultado mostra que, se a audiência do programa fosse de 60% realmente, a probabilidade de encontrarmos uma amostra de 200 famílias com 52% ou menos de audiência é de 1%. Isso sugere que, ou estamos diante de uma amostra rara de ocorrer, 1 em 100, ou então a hipótese formulada não é aceitável. Nesse caso, somos levados a essa segunda opção, ou seja, os dados da amostra sugerem que a hipótese HO deve ser rejeitada. EXEMPLO 2: Um antibiótico X traz em sua bula a seguinte citação: “Nas broncopneumonias, a ação antiinflamatória de X é colocada em evidência pelo estudo dos parâmetros ventilatórios em duplo-cego contra placebo. Durante o tratamento com X pode-se observar uma melhora significativa em relação ao placebo, da capacidade vital ( p < 0,05 ) e o VEMS ( p < 0,001 ) e do débito respiratório máximo ( p < 0,001 ).” No procedimento de testar uma hipótese tem-se utilizado a escala de evidências sugerida por FISHER (1954). Suponha que estamos testando HO contra H1 e, como vimos, rejeitamos HO se o p-valor calculado for “bastante pequeno”. A tabela abaixo ilustra a escala de FISHER, contra HO (ou a favor de H1). Tabela 1. Escala de significância de FISHER p-valor 0,10 0,05 0,025 0,01 0,005 0,001 Natureza da Marginal Moderada Substancial Forte evidência Muito Forte Fortíssima Assim, um valor de 0,01 indica uma evidência forte contra a validade de HO; 0,05 indica uma evidência moderada etc. É interessante notar que FISHER tomou como ponto de referência o valor 0,05: valores do p-valor menores do que 0,05 indicam que devemos rejeitar a hipótese nula. Referência Bibliográfica FISHER, R. A.Statistical methods for research workers, 12th edition. New York, Hafner, 1954.