5 Inferências Relativas à Média Albertazzi.Inferências Relativas à Média. (5.1) estatística e estimadores • estatística: – uma estatística é qualquer função das observações de uma amostra aleatória • convenção: é o parâmetro de interesse ˆ é uma estatística Albertazzi.Inferências Relativas à Média. (5.2) estatística e estimadores • estimador não tendencioso: – uma estatística ˆ é denominada de “estimador não tendencioso” se, e somente se, a média da distribuição amostral do estimador é igual a exemplo: 1 n ˆ X xi é uma estimativa não tendenciosa de n i 1 Albertazzi.Inferências Relativas à Média. (5.3) estimativa pontual • X é uma estimativa de . Mas quanto X se aproxima de ? X- Z n é uma VA praticamente normal padronizada se n é grande Logo, há uma probabilidade de 1 - da inequação abaixo ser satisfeita: - z/2 X- z / 2 n f(x) /2 /2 1- -z/2 z/2 o que eqüivale a: X- n z / 2 onde z/2 é um valor tal que a área da curva normal padronizada a sua direita é /2 Albertazzi.Inferências Relativas à Média. (5.4) estimativas da média (com nível de confiança 1 - ) • quando é conhecido: X - z / 2 . n • quando é desconhecido: s X - t / 2 . n Albertazzi.Inferências Relativas à Média. (5.5) intervalo de confiança da média • quando é conhecido: X - z / 2 . n X z / 2 . n • quando é desconhecido: s s X - t / 2 . X t / 2 . n n Albertazzi.Inferências Relativas à Média. (5.6) exemplo 1: Sabe-se que a vida em horas de lâmpadas incandescentes é uma variável aleatória normal com = 50 h. Uma amostra de 10 lâmpadas foi ensaiada e a vida média obtida foi 1.556 h. Qual o intervalo dentro do qual, com nível de confiança 95%, espera-se encontrar a média da população? é conhecido. Estima-se o intervalo de confiança da média por: X - z / 2 . n X z / 2 . 0,05 para P = 95% n 50 50 1556 - z0,025. 1556 z0,025. 10 10 1525 1587 z0,025 = 1,960 (1556 31) h Albertazzi.Inferências Relativas à Média. (5.7) exemplo 2: Qual o tamanho necessário da amostra da questão anterior para, com a mesma probabilidade, reduzir o tamanho do intervalo de confiança de ±31 h para apenas ±10 h? é conhecido. Estima-se o intervalo de confiança da média por: X - z / 2 . z / 2 . n X- 2 n 50 n z0,025. 10 2 2 50 n 1,960. 96 10 Albertazzi.Inferências Relativas à Média. (5.8) exemplo 3: A massa de um diamante foi medida repetidamente nove vezes por uma balança com erro sistemático desprezável. As indicações não se repetem pela ação de um erro aleatório com distribuição normal e média zero. Encontre o intervalo de confiança dentro do qual, com uma probabilidade de 95% deve encontrar-se o valor verdadeiro da massa do diamante. 20,4 20,1 20,4 20,6 20,2 20,4 20,3 20,5 20,3 não é conhecido, mas pode se estimado por s: da tabela: t(=0,025, u=8) = 2,306 9 s 2 ( x X ) i i 1 9 1 X 20,36 0,1509 s 0,1509 X - t / 2 . 2,306. 0,116 n 3 (20,36 0,12) g Albertazzi.Inferências Relativas à Média. (5.9) teste de hipóteses • Uma hipótese estatística é uma afirmação sobre uma população (e não sobre a amostra) • Normalmente são formuladas duas hipóteses: – H0: (hipótese nula) que é a hipótese que se quer testar – H1: (hipótese alternativa) que será aceita se não for possível provar que H0 é verdadeira • Exemplos: (a) H0: mulheres vivem mais que homens H1: mulheres vivem o mesmo ou menos que homens (b) H0: o réu é culpado H1: o réu é inocente Albertazzi.Inferências Relativas à Média. (5.10) teste de hipóteses (unilateral) • Exemplo: seja: H0: = 50 MPa e H1: < 50 MPa Se X 50MPa Ho é aceita Pergunta: quanto X deve ser menor que 50 MPa para H0 ser falsa? rejeitar H0 e aceitar H1 Não é possível rejeitar H0 50 - 50 Qual é o valor crítico de ? Albertazzi.Inferências Relativas à Média. (5.11) teste de hipóteses (bilateral) • Exemplo: seja: H0: = 50 MPa H1: 50 MPa e Se X 50MPa Ho é aceita Pergunta: quanto X deve se afastar de 50 MPa para H0 ser falsa? rejeitar H0 e aceitar H1 Não é possível rejeitar H0 50 - 50 rejeitar H0 e aceitar H1 50 + Qual é o valor crítico de ? Albertazzi.Inferências Relativas à Média. (5.12) exemplo 1: Suponha que a resistência do material seja uma variável aleatória com distribuição normal com X = 2,5 MPa. No exemplo anterior = 1,5 MPa seria uma boa escolha? Assim, a resistência de um corpo de prova seria determinada, testada e: – Se estiver no intervalo entre (50,0 ± 1,5) MPa afirma-se que = 50 MPa; – Caso contrário, afirma-se que 50 MPa. Este é um bom teste? 48,5 51,5 Albertazzi.Inferências Relativas à Média. (5.13) Para responder esta questão, suponha que a resistência do material tenha mesmo média 50 MPa e X = 2,5 MPa: 0,452 z1 48,5 50,0 0,60 2,5 /2 = 0,274 /2 = 0,274 51,5 50,0 z2 0,60 2,5 48,5 50 51,5 z1 = -0,60 z2 = 0,60 A escolha de = 1,5 MPa não é boa. Quando o material tiver resistência de 50 MPa apenas 45,2% dos ensaios darão a resposta certa. Cerca de 54,8% levarão à conclusão errada, o que é uma margem de erro muito alta! Albertazzi.Inferências Relativas à Média. (5.14) exemplo 2: Suponha que em lugar de ensaiar um corpo de prova, 10 corpos de prova sejam ensaiados e sua média calculada. Se as demais condições forem mantidas, = 1,5 MPa seria uma boa escolha? Sintetizando o teste: Dez corpos de prova serão ensaiados e resistência média calculada e submetida ao seguinte critério: – Se estiver no intervalo entre (50,0 ± 1,5) MPa afirma-se que = 50 MPa; – Caso contrário, afirma-se que 50 MPa. E agora: este é um bom teste? Albertazzi.Inferências Relativas à Média. (5.15) Para responder esta questão, suponha que a resistência do material tenha mesmo média 50 MPa e X = 2,5 MPa. A média de 10 corpos de prova terá desvio padrão de: X n 48,5 50,0 z1 1,90 0,790 z2 /2 = 0,942 2,5 0,790 10 51,5 50,0 1,90 0,790 /2 = 0,0288 /2 = 0,0288 48,5 50 z1 = -1,90 51,5 z2 = 1,90 Neste caso, a escolha de = 1,5 MPa resulta em uma margem de acerto de 94,2% e uma margem de erro de apenas 5,76%, o que é aceitável. Portanto, para estas condições, = 1,5 MPa é uma boa escolha! Albertazzi.Inferências Relativas à Média. (5.16) erros de decisão Erro tipo I: rejeitar H0 quando esta é verdadeira Erro tipo II: não rejeitar H0 quando esta é falsa decisão H0 é verdadeira H0 é falsa não rejeita H0 decisão correta erro tipo II rejeita H0 erro tipo I decisão correta – A probabilidade de cometer erro tipo I é denominada “nível de significância” e é denotada por – A probabilidade de cometer erro tipo II é denotada por b Albertazzi.Inferências Relativas à Média. (5.17) nível de significância () No exemplo anterior, sendo a distribuição normal, X = 2,5 MPa, n = 10, e = 1,5 MPa. Quanto vale ? /2 = 0,0288 48,5 z1 = -1,90 /2 = 0,0288 50 51,5 = P(Z<-1,90) + P(Z>1,90) = 0,0288 + 0,0288 = 0,0576 z2 = 1,90 5,76% das amostras aleatórias vão rejeitar H0 quando a resistência do material for mesmo 50 MPa. Para diminuir : – (a) aumentar ou – (b) aumentar n Albertazzi.Inferências Relativas à Média. (5.18) erro tipo II – b pode ser calculado para um dado valor específico. Exemplo, seja = 52. Quanto vale b? b = 0,2643 48,5 50 51,5 52 b P(48,5 X 51,5 quando 52,0) 0,2643 26,43% das amostras aleatórias vão aceitar H0 quando a resistência do material for 52 MPa Albertazzi.Inferências Relativas à Média. (5.19) erro tipo I versus erro tipo II • e b para várias combinações de n e região de aceitação n b em 52 b em 50,5 48,5 X 51,5 10 0,0576 0,2643 0,8923 48,0 X 52,0 10 0,0114 0,500 0,9705 48,5 X 51,5 16 0,0164 0,2119 0,9445 48,0 X 52,0 16 0,0014 0,500 0,9918 Albertazzi.Inferências Relativas à Média. (5.20) teste de hipóteses: conclusões 1. O tamanho da região crítica (aceitação) e podem sempre ser reduzidas pela escolha apropriada dos valores críticos 2. Os erros tipo I e II estão sempre relacionados. Para o mesmo “n” o aumento da probabilidade de um reduz a do outro 3. Para os mesmos valores críticos, o aumento de “n” reduz as probabilidades dos erros I e II 4. Quando H0 é falsa, b aumenta quando o valor verdadeiro do parâmetro se aproxima do valor especificado em H0 e vicee-versa Albertazzi.Inferências Relativas à Média. (5.21) teste de hipóteses: procedimento geral 1. Identifique o parâmetro de interesse no problema 2. Formule a hipótese nula (H0) 3. Formule uma hipótese alternativa apropriada (H1) 4. Defina o nível de significância 5. Estabeleça a estatística usada 6. Estabeleça a região de rejeição da estatística 7. Execute o experimento, obtenha os dados e faça as contas 8. Decida se H0 deve ou não ser rejeitada e transponha esta conclusão para o contexto do problema Albertazzi.Inferências Relativas à Média. (5.22) hipóteses relativas a uma média H0: = 0 hipóteses alternativas 0 0 0 X 0 Z n conhecido desconhecido rejeite H 0 se rejeite H 0 se Z z T t Z z T t Z z / 2 ou Z z / 2 T t / 2 ou T t / 2 X 0 T s n Albertazzi.Inferências Relativas à Média. (5.23) exemplo 3: Verificar se a condutividade térmica de um certo tipo de tijolo é 0,340 com nível de significância 0,05 a partir de uma amostra com n = 35 que resultou no valor médio 0,343. Sabe-se que = 0,010. Solução: P1 P2 P3 P4 P5 - parâmetro de interesse: condutividade térmica do tijolo H0: = 0,340 H1: 0,340 nível de significância: 0,05 é conhecido, usar a estatística Z < -z 0.025 ou Z > z 0.025 Albertazzi.Inferências Relativas à Média. (5.24) P6 H0 será rejeitada se o valor de Z, calculado a partir da média dos 35 ensaios, obedecer uma das seguintes condições: Z < -1.960 P7 - ou Z > 1,960 Fazendo as contas: 0,343 0,340 z 1,77 0,010 35 P8 Como -1,960 < 1,77 < 1,960, H0 não pode ser rejeitada, isto é, a pequena diferença entre 0,340 e 0,343 pode decorrer do acaso. Albertazzi.Inferências Relativas à Média. (5.25) exemplo 4: Um certo tipo de barbante deve apresentar resistência média à ruptura de 180 N. Se cinco pedaços, selecionados aleatoriamente de alguns rolos apresentaram média 169,5 N com s = 5,7 N. Teste a H0 = 180 N contra H1 < 180 N com = 0,01. Assuma que a população é normal. Solução: P1 P2 P3 P4 P5 - parâmetro de interesse: resistência do barbante H0: = 180 N H1: < 180 N X 0 nível de significância: 0,01 T s n não é conhecido, usar a estatística T < -t 0.01 para u = 4 Albertazzi.Inferências Relativas à Média. (5.26) P6 H0 será rejeitada se o valor de T, calculado a partir da média dos cinco ensaios, obedecer a seguinte condição: T < -3,747 P7 - Fazendo as contas: 169,5 180,0 t 4,12 5,7 5 P8 Como o valor obtido é menor que o crítico, rejeita-se H0 e aceita-se a hipótese de que a resistência média do barbante é mesmo menor que 180 N. Albertazzi.Inferências Relativas à Média. (5.27) hipóteses relativas a duas médias H0: 1 - 2 = hipóteses alternativas 1 2 1 2 1 2 Z n1 1 X2 n2 desconhecido rejeite H 0 se rejeite H 0 se Z z T t Z z T t Z z / 2 ou Z z / 2 T t / 2 ou T t / 2 ( X1 X 2 ) X2 conhecido 2 ( X1 X 2 ) n1n2 (n1 n2 2) T . 2 2 n1 n2 (n1 1) s1 (n2 1) s2 n1 n2 2 Albertazzi.Inferências Relativas à Média. (5.28) exemplo 5: Verifique se a diferença entre a resistência elétrica entre dois condutores é maior que 0,050 com nível de significância = 0,05. Uma amostra com n = 32 foi extraída de cada condutor resultando em: X1 = 0,136 e s1 = 0,004 e X2 = 0,083 e s2 = 0,005 . Solução: P1 P2 P3 P4 P5 - parâmetro de interesse: diferença de resistência H0: 1 2 = 0,050 H1: 1 2 > 0,050 X 0 nível de significância: 0,05 T s n não é conhecido, mas n > 30 é possível usar a estatística Z > z 0.05 Albertazzi.Inferências Relativas à Média. (5.29) P6 H0 será rejeitada se o valor de Z, calculado a partir da diferença das médias dos 32 ensaios, obedecer a condição: Z > 1,645 P7 - Fazendo as contas: z 0,136 0,083 0,050 2 (0,004) (0,005) 32 32 2 2,65 P8 Como 2,65 > 1,645 rejeita-se a H0 e afirma-se que a resistência do primeiro condutor é maior que a do segundo em pelo menos 0,050 . Albertazzi.Inferências Relativas à Média. (5.30)