1 1. TESTES DE HIPÓTESES Avaliam afirmações sobre os valores de parâmetros populacionais. Os testes representam uma regra de decisão que permite aceitar ou rejeitar uma hipótese questionada, decisão esta que é tomada em função de valores obtidos numa amostra. Temos 2 hipóteses iniciais: 1) Hipótese nula (H0): é aquela que será testada; é uma afirmação que diz que o parâmetro populacional é tal como especificado (afirmação verdadeira). 2) Hipótese alternativa (H1): é qualquer hipótese diferente da hipótese nula, isto é, é aquela que será aceita caso o teste indique que H0 deva ser rejeitada, aceitando esta hipótese conclui-se que a diferença é significativa. Tipos de Erros Erro do Tipo I : é aquele que se comete ao rejeitar uma hipótese que é correta, a probabilidade desse erro é (nível de significância do teste). Erro do Tipo II: é aquele que se comete ao aceitar uma hipótese que é incorreta; a probabilidade desse erro é simbolizada por . Realidade Decisão H0 Verdadeiro . H0 Falso Aceitar H0 Decisão correta (prob = 1 - ) Erro Tipo II Rejeitar H0 Erro Tipo I Decisão correta (prob = 1 - ) (prob = ) (prob = ) Obs.: A decisão sempre será em relação a Ho. Nível de Significância = 1% Teste altamente significativo = 5% Teste provavelmente significativo = 10% Teste empiricamente significativo Obs.: Usa-se a Tabela Z quando se tem amostra maior do que 25 e usa-se a Tabela t quando se tem um tamanho de amostra igual ou menor do que 25 (alguns autores consideram 30 ao invés de 25). 1.1. ROTEIRO PARA TESTES DE SIGNIFICÂNCIA (ESPECIFICAÇÃO DE ) 1 – ENUNCIAR HIPÓTESES: H0 E H1 2 – DETERMINAR E IDENTIFICAR A VARIÁVEL DO TESTE (Z , t) 3 – TIPO DE TESTE: (BILATERAL = /2) OU UNILATERAL () 4 – DETERMINAR REGIÃO CRÍTICA EM FUNÇÃO DA VARIÁVEL TABELADA (REGIÃO DE ACEITAÇÃO E REGIÃO DE REJEIÇÃO) Planejamento e Otimização de Experimentos 2 5 – CALCULAR O VALOR DA VARIÁVEL DO TESTE, OBTIDO NA AMOSTRA (Z ou t crítico) 6 – CONCLUSÃO: ACEITAR OU REJEITAR H0 1.2. TESTES PARA MÉDIA H0 : = 0 H1 : 0 (PARA UNILATERAIS : H1 : > 0 OU H1 : < 0 ) Variáveis de Teste: PARA (DESVIO-PADRÃO POPULACIONAL) CONHECIDO: z x 0 n PARA (DESVIO-PADRÃO POPULACIONAL) DESCONHECIDO: x 0 s n t Exemplo 1 O desvio padrão de uma população é conhecido e igual a 42. Numa amostra de 35 elementos dessa população obtevese uma média de 325,8. Pode-se afirmar que a média dessa população é superior a 300, ao nível de significância de 5%? H0 : = 0 H1 : > 0 Z de 0,05 na tabela (Distr. Normal reduzida) =1,65 z x 0 n z 325,8 300 42 35 0 =42 n = 35 x > 300 = 325,8 z 3,63 Conclusão: O valor de 3,63 é bem maior do que 1,65, portanto, aceita-se H1. Ou seja, a média da população é maior do que 300. Exemplo 2 Em uma linha de produção opera-se com uma média de preenchimento de 980 ml por recipiente. O sobrepreenchimento causa prejuízos à empresa, ao passo que o subpreenchimento causará problemas com a fiscalização. Portanto, em cada uma das situações a linha de produção deve ser paralisada para calibragem. De dados passados sabe-se que o desvio padrão é de 9 ml. A retirada de 30 amostras aponta uma média de 976,5 ml. Pergunta-se: diante dessa situação, considerando um nível de significância de 2,5%, a linha deve ser paralisada para efetuar a calibragem? H0 : = 0 H1 : 0 Z na tabela (Distr. Normal reduzida) = para 0,025 = (-1,96;1,96) 0 = 9 ml ; n = 30 ; Planejamento e Otimização de Experimentos x = 980 ml = 976,5 ml 3 z x 0 z n z 2,13 976 ,5 980 9 30 Conclusão: O valor de -2,13 é menor do que -1,96, portanto, está na área de H1. Ou seja, a média da população está abaixo da região crítica e a linha precisa ser recalibrada, pois se permanecer assim haverá problemas com a fiscalização. Exemplo 3 Uma agência de empregos alega que os candidatos por ela colocados nos últimos 6 meses tem salários de $ 9.000 anuais, em média. Uma agência governamental extraiu uma amostra aleatória de um grupo, encontrando um salário médio de $ 8.000, com desvio padrão de $ 1.000, com base de 50 empregados. Testar a hipótese da agência contra a alternativa de que o salário médio é inferior a $ 9.000 ao nível de significância de 10% ? H0 : = 0 H1 : < 0 Z na tabela (Distr. Normal reduzida) =-1,28 z x 0 z n s = $ 1.000 0 = $ 9.000 n = 50 x = $ 8.000 z 7,07 8000 9000 1000 50 Conclusão: O valor de -7,07 é bem menor do que -1,28, portanto, aceita-se H1. Ou seja, a média do salário é menor do que os $ 9.000 que a agência afirma. Exemplo 4 – Distribuição de Student Uma amostra aleatória de alunos do curso de Engenharia aponta as seguintes médias finais em determinada Disciplina: 2,8; 3,7; 6,4; 3,2; 4,1; 4,4; 4,3; 4,6; 5,2 e 3,9. O professor da Disciplina afirma que a média da população (de seus alunos) é superior a 4,0. Teste essa hipótese para = 5%. H0 : = 0 H1 : > 0 t na tabela = 1,8331 s = 1,02 (calculado) n = 10 x 0 = 4,0 = 4,26 (calculada) Como é uma amostra pequena torna-se necessário usar a tabela “t”. Assim, graus de liberdade (GL) = n – 1 = 9 e = 5%. Na tabela “t” ou Student encontra-se o valor de 1,8331. t x 0 s n t 4,26 4,0 1,02 10 t 0,81 Conclusão: O professor não pode afirmar com 95% de confiança que a nota de seus alunos é superior a 4,0, pois o valor de 0,81 está dentro da área de H0. Planejamento e Otimização de Experimentos 4 1.3. TESTES PARA PROPORÇÃO H0 : = 0 H1 : 0 (PARA UNILATERAIS : H1 : > 0 OU z VARIÁVEIS DE TESTE: H1 : < 0 p 0 o (1 o ) n Onde: - p é a proporção da amostra; - o é a proporção da população e - n é o tamanho da amostra Obs.: Nos testes para proporção usa-se sempre a Tabela Z (Normal Reduzida). Exemplo 1 Um jogador de basquete tem um sucesso de 60% nos arremessos de 3 pontos. Em um treino de 100 arremessos ele acertou 70. É possível aceitar a hipótese de que ele está melhorando a pontaria para = 0,05 H0 : p = o p = 70/100 = 0,7 H1 : p > o o Z na tabela (Distr. Normal Reduzida) =1,65 n = 100 z p 0 o (1 o ) n z 0,7 0,6 0,6(1 0,6) 100 = 0,6 z 2,04 Conclusão: Como 2,04 é maior do que 1,65, aceita-se a H1. Ou seja, ao nível de 5% de significância o jogador está melhorando a sua performance. EXERCÍCIOS: 1) Uma empresa produz barras com especificações de 115 cm e desvio padrão de 2,5cm. Todo o mês é retirado uma amostra de 20 barras para se testar a média. O último valor obtido apresentou média de 116 cm. Verificar se é possível aceitar que a média continue sendo a mesma para um nível de significância de 5%? 2) Um jornal afirma que aproximadamente 15% dos adultos em sua área de circulação são analfabetos segundo os padrões governamentais. Teste essa afirmação contra a alternativa de que a verdadeira percentagem populacional não é 15%, e use a probabilidade de 5%. Uma amostra de 740 pessoas indica que apenas 10% seriam considerados analfabetos segundo os mesmos padrões. Planejamento e Otimização de Experimentos 5 2. TESTE DO QUI-QUADRADO ( ) 2 Este teste tem o objetivo de verificar se há diferenças entre vários parâmetros com diversas respostas. Ex: (DOWNING e CLARK – adaptado) O órgão do governo responsável pelas pesquisas sobre remédios fez uma pesquisa com 495 voluntários para testar 4 antigripais e verificar as diferenças e sua eficácia. Os resultados estão na tabela abaixo. Remédio 1 Remédio 2 Remédio 3 Remédio 4 Total 15 26 9 14 64 Ficaram imunes 111 107 96 117 431 Total 126 133 105 131 495 Quantos resfriaram Esta é uma tabela de contingência com duas linhas e quatro colunas contendo oito células. Elabora-se então uma tabela contendo as frações correspondentes a cada célula. Os que resfriaram representam 0,129 do total (64/495) e os que ficaram imunes representam 0,871 (431/495). Remédio 1 Remédio 2 Remédio 3 Remédio 4 15 26 9 14 16,254 17,157 13,545 16,899 111 107 96 117 109,746 115,843 91,455 114,101 Quantos resfriaram Efetivo (f1) Previsto (f1*) Ficaram imunes Efetivo (f1) Previsto (f1*) n Estatística teste: s i 1 ( f i f i *) 2 fi * s s ou seja: ( f f n *) 2 ( f1 f1 *) 2 ( f f 2 *) 2 2 ... n f1 * f2 * fn * (15 16,254 ) 2 ( 26 17,157 ) 2 (9 13,545 ) 2 (14 16,899 ) 2 16,254 17,157 13,545 16,899 (111 109 ,746 ) 2 (107 115,843) 2 (96 91,455) 2 (117 114 ,101) 2 7,666 109 ,746 115,843 91,455 114 ,101 O número de Graus de Liberdade é: GL=(nº de linhas – 1) X (nº de colunas – 1) Portanto, neste caso: GL = (2 – 1) X (4 – 1) = 3 Na tabela do qui-quadrado procura-se 32 , se considerarmos a hipótese de 5% para o teste procura-se na coluna do 0,95 com a linha 3 e encontra-se o valor de 7,815. Isso significa que, se 7,666 é inferior a 7,815 pode-se concluir que não há diferenças significativas entre os remédios. No entanto, pelo fato dos valores estarem muito próximos, sugere-se o aprofundamento dos estudos. Planejamento e Otimização de Experimentos 6 Exercícios 1. (MORETTIN, L.G, 2011) Testar a hipótese, ao nível de 5%, de que não há relação entre o nível educacional e o êxito no casamento Ajustamento no casal Muito baixo Baixo Alto Muito alto Universitário 18 29 70 115 Ensino médio 17 28 30 41 Ensino fundamental 11 10 11 20 Nível educacional 2. (MORETTIN, L.G, 2011) Testar ao nível de 5% que a relação entre o aproveitamento dos alunos em física é independente de matemática. Matemática Grau alto Grau médio Grau baixo Grau alto 56 71 12 Grau médio 47 163 38 Grau baixo 14 42 85 Física Planejamento e Otimização de Experimentos 7 4 TABELAS ESTATÍSTICAS Planejamento e Otimização de Experimentos 8 Tabela de Distribuição Normal reduzida Planejamento e Otimização de Experimentos 9 Área numa cauda ( Área em 2 caudas Graus liberdade 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 Valores de t para Probabilidades escolhidas Probabilidades (ou área sob a curva da distribuição t) 0,10 0,05 0,025 0,20 0,10 0,05 Valores de t 3,078 6,314 12,706 1,886 2,920 4,303 1,638 2,353 3,182 1,533 2,132 2,776 1,476 2,015 2,571 1,440 1,943 2,447 1,415 1,895 2,365 1,397 1,860 2,306 1,383 1,833 2,262 1,372 1,812 2,228 1,363 1,796 2,201 1,356 1,782 2,179 1,350 1,771 2,160 1,345 1,761 2,145 1,341 1,753 2,131 1,337 1,746 2,120 1,333 1,740 2,110 1,330 1,734 2,101 1,328 1,729 2,093 1,325 1,725 2,086 1,323 1,721 2,080 1,321 1,717 2,074 1,319 1,714 2,069 1,318 1,711 2,064 1,316 1,708 2,060 1,315 1,706 2,056 1,314 1,703 2,052 1,313 1,701 2,048 1,311 1,699 2,045 1,310 1,697 2,042 1,303 1,684 2,021 1,296 1,671 2,000 1,289 1,658 1,980 1,282 1,645 1,960 Planejamento e Otimização de Experimentos 0,01 0,02 0,005 0,01 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326 63,656 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,576 10 Planejamento e Otimização de Experimentos