•Teste de Hipóteses 4 Prof. Miguel Angel Uribe Opazo Introdução Ao contrário do que ocorria nos problemas de estimação, vamos agora supor que exista uma hipótese a respeito de valores dos parâmetros populacionais, a qual será considerada válida até prova em contrário. Pelo fato de se tratar de testes referentes aos parâmetros populacionais, estes são ditos de testes paramétricos. Essa hipótese será testada com base em resultados experimentais, sendo rejeitada ou não rejeitada. Conceitos Fundamentais Define-se por H0 a hipótese existente, chamada hipótese nula, a ser testada e por H1 a hipótese alternativa. Nos casos que serão examinados, H1 será a hipótese complementar de H0. O teste irá levar a não rejeitar ou rejeição de H0, o que corresponde à negação ou aceitação de H1. Conceitos Fundamentais Entretanto para manter a uniformidade, enuncia-se o resultado final sempre em termos da hipótese H0, ou seja, rejeitar ou não rejeitar H0. Podem ocorrer situações em que a hipótese nula H0 seja verdadeira e o teste leve à rejeitar H0, o que consiste em num erro, chamado erro tipo I. Por outro lado, pode-se não rejeitar H0, sendo ela falsa, o que levaria a cometer erro tipo II. Em resumo, em um teste de hipótese pode ocorrer dois tipos de erro, erro tipo I, rejeitar H0, sendo H0 verdadeira e erro tipo II, não rejeitar H0 sendo H0 falsa. P[erro tipo I]= P[rejeitar H0, sendo H0 verdadeira] = α P[erro tipo II]= P[não rejeitar H0, sendo H0 falsa] = β A probabilidade do erro tipo I, α é denominada nível de significância do teste. A probabilidade do erro tipo II, β está associado ao Poder do teste (1-β) . Possíveis resultados de um teste de hipóteses e suas probabilidades condicionadas a realidade Decisão Aceitar H0 Rejeitar H0 Realidade H0 verdadeira Decisão correta (1- ) Erro tipo I ( ) H0 falsa Erro tipo II ( ) Decisão correta ( 1- ) A faixa de valores da variável de teste que leva à rejeição de H0 é denominada Região Crítica ou Região de Rejeição do Teste. A faixa restante, Região de Não rejeição. Em nossos problemas de teste de hipóteses, serão controlados as probabilidade do erro tipos I e II, ou seja, o nível de significância do teste () e o poder do teste (1- ). Etapas Básicas em um Teste de Hipótese Em um teste de hipótese, inicia-se com um valor suposto (hipotético) de um parâmetro da população. Fixe qual é a hipótese H0 a ser testada e qual é a hipótese alternativa H1. Fixar a probabilidade de cometer erro tipo I. Use este valor para construir a Região Crítica - RC Etapas Básicas em um Teste de Hipótese Depois de coletar uma amostra aleatória, compara-se a estatística da amostra com o parâmetro suposto. Então rejeita-se ou não o valor hipotético. O valor hipotético é rejeitado somente se o resultado da amostra for claramente improvável de ocorrer. Isto é, se o valor da estatística observada na amostra não pertencer a região crítica, não rejeito H0, caso contrário, rejeita-se H0 ao nível de % de significância. PROCURE SEMPRE, QUE FIZER TESTE DE HIPÓTESE, DISTINGUIR BEM ESTAS ESTAPAS. Teste de Hipótese da Média Objetivo: avaliar afirmação feita respeito da média populacional. Considerar dois casos: A) Desvio Padrão Populacional Conhecido; e B) Desvio Padrão Populacional Desconhecido. Procedimentos Geral i) Dados X , 0 , n, , ou S ii) Sejam as hipóteses: H0 : = 0 (hipótese nula) Versus a) H1 : 0 ou b) H1 : > 0 ou c) H1 : < 0 (hipótese alternativa) . iii) Cálculos: Se é conhecida, a estatística do teste é: X 0 Z = n Se é desconhecida, a estatística do teste é: X 0 T= S n iii) Regra de Decisão: 1) Para o teste bicaudal H0: = 0 versus H1: 0 Considerando é conhecida, rejeita-se H0 , se | Z | > z/2 ao nível de % de significância, onde z/2, é o valor da tabela normal padrão bicaudal ao nível de % de significância. Considerando é desconhecido, rejeita-se H0, se | T | > t/2 ao nível de % de significância, onde t/2, é o valor da tabela t-Student bicaudal com n-1 graus de liberdade e ao nível de % de significância. 2) Para o teste unicaudal a direita H0: <= 0 versus H1: > 0 Considerando é conhecida, rejeita-se H0, se Z > z ao nível de % de significância, onde z é o valor da tabela normal padrão unicaudal ao nível de % de significância. Considerando é desconhecido, rejeita-se H0 , se T > t ao nível de % de significância, onde t é o valor da tabela t-Student unicaudal com n-1 graus de liberdade e ao nível de % de significância. 3) Para o teste unicaudais a direita e esquerda H0: = > 0 versus H1: < 0 Considerando é conhecido, rejeita-se H0, se Z < - z ao nível de % de significância, onde z é o valor da tabela normal padrão unicaudal ao nível de % de significância. Considerando é desconhecido, rejeita-se H0, se T < - t ao nível de % de significância, onde t é o valor da tabela t-Student unicaudal com n-1 graus de liberdade e ao nível de % de significância. Nível de significância para testes bicaudal e unicaudal Nível de confiança (1- )% 99,90 99,00 95,00 90,00 Nível de significância Valor bicaudal Valor Unicaidal ( )% 0,1 1,00 5,00 10,00 z/2 3,29 2,58 1,96 1,65 z 2,33 1,65 1,28 Exemplo Os registros dos últimos anos de um colégio atestam para os calouros admitidos que a nota média 115 pontos (teste vocacional). Para testar a hipótese de que a média de uma nova turma é a mesma, tirou-se, ao acaso, uma amostra de 50 notas, obtendo-se uma média 118 e um desvio padrão 20. Admitir que = 5%, para efetuar o teste. H0: = 115 (hipótese nula, com 0 =115) versus H1: 115 (hipótese alternativa) Como é desconhecida, a estatística do teste é: T= X 0 S n = 118 115 = 1,06, 20 50 Para = 5% /2 o valor t/2 da tabela t-Student bicaudal com ( n– 1) = 49 graus de liberdade é t/2 =.2,093. Como |T| = 1,06 < 2,093, concluímos que não rejeitamos H 0 , isto é, ao nível de 5% de significância concluímos que a nova turma tem a mesma nota média no teste vocacional que os do registro dos últimos anos. Teste de Hipótese para Proporção Quando a finalidade da amostragem é julgar a validade de uma alegação de uma proporção (p), é apropriado um teste de uma amostra. O procedimento é análogo ao das médias, inclusive, a preocupação de se tratar de uma distribuição normal padronizada para valores críticos. Procedimento Geral Procedimento Geral: i. i) Dados x, n, p0 , ii. ii) Hipóteses: a) Teste bicaudal: iii. (hipótese nula) versus iv. H1: p p0 ( hipótese alternativa) v. Teste unicaudal: vi. H0: p = p0 vii. viii. a) Teste unicaudal: H0 : p <= p0 versus H1: p > p0 H0 : p = > p0 ix. versus x. H1: p < p0 ii) Cálculos: pˆ x n q0 = 1 – p0 ; ; 0= p0 q0 n A estatística do teste ( a), (b) ou (c) é: pˆ p 0 Z= 0 iv) Regra de Decisão: a) Para o teste bicaudal H0 : p = p0 versus H1 : p p0 Rejeita-se H0 se | Z| > z/2 ao nível de % de significância. b) Para o teste unicaudal H0 : p <= p0 versus H1 : p > p0 Rejeita-se H0 se Z > z ao nível de % de significância. c) Para o teste unicaudal H0 : p = > p0 versus H1 : p < p0 Rejeita-se H0 se Z < - z ao nível de % de significância Exemplo Um certo analgésico adotado em determinado hospital é eficaz em 70% dos casos. Um grupo de médicos chineses em visita a esse hospital afirma que a utilização de acupuntura produz melhores resultados. A direção do hospital resolve testar o método alternativo em 80 pacientes, com a finalidade de adotá-lo em definitivo se ele apresentar eficiência satisfatória numa proporção de casos maior que do anestésico atual. Seja 85% dos casos que o método de acupuntura apresenta a eficiência satisfatória quando aplicado a um paciente. Que decisão tomar ao nível de 5% de significância?. A hipótese de interesse é: H0: p = 0,70 (hipótese nula) versus H1: p > 0,70 (hipótese alternativa) Neste problema p0 = 0,70 ; q0 = 1 –0,70 = 0,30 ; n=80; 0= 0,70 * 0,30 =0,051 e pˆ 0,85 80 A estatística do teste é: Z= ˆ p0 p 0 0,85 0,70 = = 2,94 0,051 Decisão: O valor de z unicaudal ao nível de 5% de significância é z =1,65. Como Z > 1,65 concluímos que se rejeita H0 ao nível de 5% de significância, isto é, o método de acupuntura produz melhores resultados que o método tradicional ao nível de 5% de significância. Testes Não -Paramétricos O método não-paramétrico é um método estatístico que não formula a hipótese sobre formas específicas de distribuição e, assim, não cogita de estimar valores desconhecidos de parâmetros. Teste Qui-Quadrado Tabela de Contingência Teste de Aderência Teste para Adequação de Ajuste Análise Bidimensional de Variáveis Qualitativas A técnica mais simples e mais flexível para descrever o grau de associação entre duas variáveis é a análise por classificação cruzada. Exemplo 1.7 Cento e vinte e cinco proprietários de certa marca de automóvel foram entrevistados acerca do desempenho e do consumo de seus carros. O resultado da pesquisa de opinião é resumido na Tabela 1.9. Devemos considerar que, no consenso geral, o desempenho e o consumo guardam relação entre sem? Para responder esta pergunta é necessário utilizar o Teste Qui-quadrado de Independência, considerando as hipóteses: H0: o consumo e o desempenho são independentes ou não existe associação.(hipótese nula) versus H1: o consumo e o desempenho não são independentes ou existe associação. (hipótese alternativa). Ao um nível de 5% de siginificância. (probabilidade de erro tipo I: rejeitar H0 quando ela é verdadeira) A estatística do teste é da forma: i. Regra de Decisão: ii. Se 2 > 2 TAB , rejeito a hipótese H0 ao nível de 5%, onde 2 TAB é o valor da tabela qui-quadrado com (r-1)(c-1) graus de liberdade (Anexo 2) iii. Em nosso exemplo temos 2 = 3,7915 e 2 TAB = 5,99 o qual implica que não existe de associação entre o consumo e o desempenho. Outra regra é a seguinte se o nível descritivo p-valor < 0,05 rejeito a hipótese H0 ao nível de 5%. iv. Tabela Qui -quadrado Teste de Aderência Devemos localizar neste teste os problemas em que se deseja verificar se a prática esta de acordo com a teoria, ou seja, problemas em que se deseja comparar a freqüência esperada (teoria) com a freqüência observada (prática). Exemplo A tabela abaixo mostra o número de vitórias de cavalos que correram em 8 raias diferentes de um moderno hipódromo. Sabe-se que a numeração das raias são feitas em sentido crescente da parte interna para a externa da pista circular. Um determinado turista acha que a raia em que o cavalo corre influência o resultado. Verifique se o mesmo tem razão. Raias Oi 1 29 2 19 3 18 4 25 5 17 6 10 7 15 8 11 Total 144 A hipótese de nulidade dá a freqüência ou proporção de indivíduos ou objetos, que se enquadram em cada uma das k categorias na população presumida. Isto é, a partir da hipótese de nulidade, podemos deduzir as freqüências esperadas. A técnica ² testa se as freqüências observadas estão suficientemente próximas das esperadas para justificar sua ocorrência sob H0. A hipótese de nulidade pode ser testada por: 2cal k i 1 onde Oi Ei ² (2k 1) Ei Oi = n° de casos observados classificados na categoria i Ei = n° de casos esperados classificados na categoria i, sob H 0 a) Quando se espera que a freqüência de cada categoria seja a mesma, então Ei i = 1, 2, ..., k. n , k b) Quando se espera que cada freqüência seja diferente, para pelo menos uma (r )(n) categoria, na razão de r1, r2, ..., rk tal que r1 + r2 + ... + rk = S, então Ei i , S onde n é o tamanho da amostra e k, o n° de categorias. Se há concordância entre os valores observados e os valores esperados, as diferenças (Oi - Ei) serão pequenas e, conseqüentemente, ²cal será também pequeno. Se as divergências forem grandes, o valor ²cal também será grande. De modo intuitivo, quanto maior for o valor do ²cal, maior será a probabilidade de rejeitar H0, ou seja, das freqüências observadas não serem provenientes da população em que se baseou a hipótese de nulidade. As hipóteses são do tipo: H0: f1 = f2 = ... = fk ou H0: f1 : f2 : ... = fk (não existe diferença entre as freqüências observadas e as esperadas) H1: existe diferença entre as freqüências observadas e as esperadas 2cal k i 1 Oi Ei ² Ei segue uma distribuição (2k 1) . Daí a hipótese H0 é testada em comparação ao ²cal com ²(k – 1, ) onde é o nível de significância. Como estaremos sempre comparando os dados de uma amostra com uma população presumida, usa-se sempre uma teste unilateral à direita. Os valores do ²(k – 1, ) é observado na tabela da Distribuição Qui-quadrado. Conclusão: Rejeitamos H0, se ²cal ²(k – 1, ), ou se a probabilidade associada à ocorrência, sob H0, do valor obtido do ²cal com (k - 1) g.l. não superar o valor de a, ou seja, P[²k - 1 ²cal ] < (for significativo ) Teste de Adequação do Ajuste Quando usamos a estatística ² para comprovar a concordância entre valores esperados e observados para certo fenômeno, estaremos realizando um teste de adequação do ajustamento. Quando usamos o Teste Qui-Quadrado para colocar à prova hipóteses referentes à forma da distribuição da população, como a Normal, Binomial, Poisson, etc, estaremos efetuando um "Teste de Aderência". Nesses testes, admitimos que a distribuição da variável em estudo seja descrita por determinado modelo teórico de probabilidade e verificamos o grau de aderência dos dados amostrais ao modelo. Essa forma de testar a aderência foi desenvolvida por Karl Pearson e baseia-se na estatística 2cal k i 1 Oi Ei ² Ei que tem distribuição qui-quadrado com (k - r - 1) graus de liberdade, sendo k, o n° de parcelas somadas e r, o n° de parâmetros do modelo estimados independentemente a partir da amostra. O cálculo das freqüências esperadas é feito através da expressão Ei = npi, onde pi é a probabilidade, segundo o modelo, de se obter um valor da variável na classe considerada, e n, o tamanho da amostra. Verificar se os dados a seguir se ajustam a uma distribuição de Poisson Número de acidentes Número de dias 0 25 1 19 2 10 3 9 4 4 5 3