CURSO – ENGENHARIA ELÉTRICA 8 Disciplina: Probabilidade e Estatística Selma Rozane 1 TESTE DE HIPÓTESES INTRODUÇÃO Um parâmetro pode ser estimado a partir dos dados da amostra tanto por um único número (uma estimativa pontual) como por um intervalo de valores plausíveis (um intervalo de confiança). Frequêntemente , entretanto, o objetivo de uma investigação não é estimar um parâmetro, mas decidir qual das duas alegações contraditórias sobre o parâmetro está compreendem correta. a parte Os métodos da inferência de decisão estatística chamada Teste de Hipótese. 2 TESTE DE HIPÓTESES Vamos considerar envolvendo um problemas parâmetro estatísticos cujo valor é desconhecido mas deve cair dentro de um certo domínio (isto é, é o conjunto de todos os possíveis valores de ). Vamos supor que possa ser dividido em dois subconjuntos distintos 0 e 1, e que o estatístico deva decidir se o valor desconhecido de cai em 0 ou em 1. 3 Hipótese Nula e Hipótese Alternativa Seja H0 a hipótese de que 0 e H1 a hipótese de que 1, isto é: H 0 : 0 (hipótese nula) H1 : 1 (hipótese alternativa) Como 0 e 1 são disjuntos (0 1 = ), somente uma das hipóteses são verdadeira. O estatístico deve decidir se aceita H0 ou se aceita H1. 4 Região Crítica do teste O procedimento adotado para decidir se ele aceita H0 ou aceita H1 é denominado procedimento do teste, ou simplesmente teste. Suponha que antes de decidir se aceita ou não a hipótese nula, ele observa uma amostra aleatória X1;X2; ;Xn. Seja S o espaço amostral, isto é, S é o conjunto de todos os possíveis resultados da amostra. Em um problema desse tipo o estatístico especifica um procedimento de teste que consiste em dividir o espaço amostral em dois subconjuntos: um deles consiste dos valores da amostra para o qual ele aceita H0, e o outro contem os valores para o qual ele rejeita H0. O subconjunto para o qual H0 será rejeitada é chamada região crítica do teste. O complemento da região crítica contem portanto todos os possíveis valores para o qual H0 será aceita. 5 Erros do Tipo I e Erros do Tipo II Quando estabelecemos um procedimento do teste, estamos sujeitos a dois tipos de erros: i) O de rejeitar H0 quando ela é de fato verdadeira. Este erro é denominado erro do tipo I. A probabilidade () deste tipo de erro ocorrer é controlada pelo estatístico e é denominada nível de significância do teste. ii) O de aceitar H0 quando H1 é verdadeira. Este erro é denominado erro do tipo II. A probabilidade deste erro ocorrer é representada por . Representação dos erros tipo I e II aceita H 0 H 0 é verdadeira Decisão correta (1 ) rejeita H 0 Erro tipo I ( ) H 0 é falsa Erro tipo II ( ) Decisão correta (1 ) 6 Teste de Significância para média populacional com valor específico 0 H : 0 conhecido 0 H1 : 0 1. Retira-se uma amostra de tamanho n e calcula-se x . x 0 2. Calcula-se o valor da estatística Z / n 3. Sob a hipótese nula, tem-se que Z possui distribuição normal padrão. Portanto, Rejeita-se H 0 se Z Z / 2 (isto é, se Z Z / 2 ou Z Z / 2 ) Aceita-se H 0 se Z Z / 2 (isto é, Z / 2 Z Z / 2 ) onde é o nível de significância do teste. 7 Teste bilateral: 2 H 0 : 0 H1 : 0 2 8 Teste de Significância para média populacional com valor específico 0 conhecido Teste: Unilateral à direita H 0 : 0 H1 : 0 Região de rejeição: z z Teste: Unilateral à esquerda H 0 : 0 H1 : 0 Região de rejeição: z z 9 Exemplo 1 A tensão de ruptura dos cabos produzidos por um fabricante apresenta média de 1800 kg e desvio padrão de 100 kg. Mediante nova técnica no processo de fabricação proclama-se que a tensão de ruptura pode ser aumentada. Para testar esta declaração, ensaiou-se uma amostra de 41 cabos, tendo-se determinado a tensão média de ruptura de 1850 kg. Pode-se confirmar a declaração ao nível de significância de 0,01? Solução: H 0 : 1800 kg Passo 1: Definição da Hipótese H : 1850 kg 1 = 100 kg Passo 2: Calcular a estatística x 0 1850 1800 z 3, 20 / n 100 / 41 Isso significa que a média da amostra retirada aleatoriamente da produção está a 3,20 desvios-padrão da média alegada em Ho que é 1800. 10 Passo 3: Região crítica Na tabela: = 1% temos: z 2,58??? Passo 4: Regra de Decisão Como o valor crítico para 1% é 2,58 desvios (Z tabelado), estamos na região de rejeição de Ho. Passo 5: Conclusão Ho é rejeitada e concluímos que a tensão de ruptura dos cabos aumentou. 11 Exemplo 2 A resistência à tração do aço inoxidável produzido numa usina permanecia estável, com uma resistência média de 72 kg/mm2 e um desvio padrão de 4,0 kg/mm2. Recentemente, a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas. 76,2 78,3 76,4 74,7 72,6 78,4 75,7 70,2 73,3 74,2 Presuma que o desvio padrão seja o mesmo que antes do ajuste. Podemos concluir que o ajuste mudou a resistência à tração de aço? (Adote um nível de significância de 1%) Solução: H 0 : 72kg/mm 2 Passo 1: Definição da hipótese 2 H1 : 72kg/mm 2 = 4 kg/mm 12 Passo 2: Calcular a estatística do Teste Sendo x 75 kg/mm2 e 4 kg/mm2 Z cal x 0 75 72 2,37 / n 4 / 10 Isso significa que a média da amostra retirada aleatoriamente da produção está a 2,37 desvios-padrão da média alegada em Ho que é 72. Passo 3: região crítica Na tabela: = 1% temos: z 2,58 Passo 4: regra de decisão Como o valor crítico para 1% é 2,37 desvios (Z tabelado), estamos na região de aceitar de Ho. Passo 5: Conclusão Ho é aceito e concluímos que a resistência à tração do aço não mudou. 13 Teste de Significância para média populacional com valor específico 0 H : 0 desconhecido 0 H1 : 0 1. Retira-se uma amostra de tamanho n e calcula-se x . 2. Calcula-se a estatística t 8 x 0 s/ n 3. Sob a hipótese nula, tem-se que t possui uma distribuição t-Student com n -1 graus de liberdade. Portanto, Rejeita-se H 0 se t t / 2,( n 1) Aceita-se H 0 se t t / 2,( n 1) 14 Controlando o erro tipo II () Vimos que o erro tipo I representa o erro de se rejeitar H0 quando ela é de fato verdadeira. A probabilidade deste erro é () e é fixada e portanto controlada pelo estatístico. Temos também o erro tipo II () que representa o erro de aceitar H0 quando ela é falsa. Quando rejeitamos H0, automaticamente estamos aceitando H1, isto é, estamos aceitando que o parâmetro pertença ao espaço definido pela hipótese H1. O erro tipo II dependerá do verdadeiro valor do parâmetro. Quanto mais afastado o verdadeiro valor do parâmetro estiver do valor especificado em H0, menor será o erro tipo II. Portanto, para calcular , temos que especificar este valor em H1, isto é, ter-se as hipóteses definidas por: H 0 : 0 H1 : 1 15 Exemplo – controle do erro tipo II Para exemplificar isto, considere o exemplo anterior. Suponha que as hipóteses tenham sido definidas por: H0 : = 1800 H1 : = 1850. Vimos que o erro tipo I foi fixado em 0,01, supondo que H0 fosse verdadeiro, isto é, 8 x 0, 01 P(erro I) P( z 2, 70) P 2, 70 1800 / n 100 x 1800 = P 2, 70 1800 P x 1800 2, 70 100 / 41 41 P( x 1842, 24) Portanto, a probabilidade do erro tipo II será: P(erro II) P( x 1842, 24 1850) 1842, 24 1850 x =P P( Z 0, 49) 0,3121 100 / 40 100 / n 16 Exemplo – controle do erro tipo II O cálculo anterior pode ser efetuado para vários valores de . Considerando-se () a probabilidade de aceitar H0 como função de , isto é, ( ) P(aceitar H 0 ) P( x 1842, 24 ), 8 Pode-se calcular a função ( ) 1 ( ) Esta função é denominada função poder de teste. Bibliografia • Jay L. Devore, (Tradução: Joaquim Pinheiro Nunes Silva) Probabilidade e Estatística para Engenharia e Ciências - 2006. • Jairo S. da Fonseca e Gilberto A. Martins, Curso de Estatística - 1996. • Notas do Curso de Estatística: Dra. Corina da Costa Freitas, MSc. Camilo Daleles Rennó e MSc. Manoel Araújo Sousa Júnior 17