Estatística Teste de hipóteses Teste de Hipóteses Pontos mais importantes: -objectivo -nível de significância, região crítica, erros -construção de testes de hipóteses -teste para a média de uma distr. normal (s conhecida), valor de prova -teste para a média de uma distr. normal (s desconhecida) -teste de igualdade de duas médias de distr. normal (s conhecida) -teste de igualdade de duas médias de distr. normal (s desconhecida) -teste do “t” para dados emparelhados -teste para a variância de populações normais, comparação de duas variâncias, distribuição F 1 Teste de hipóteses Estatística Objectivo: Verificar a consistência de uma hipótese estatística (sobre um parâmetro da distribuição em estudo) com os dados disponíveis (amostra). e.g.: -os filtros que a minha empresa comprou conseguem resistir uma pressão de 5 Bar? -o número de células numa água contaminada diminuiu, por um factor de 10-5/ml, após o nosso tratamento? -A pasteurização de leite com um permutador de calor mais barato não resultou numa qualidade inferior em relação ao processo com um permutador de calor mais caro?... 2 Estatística Teste de hipóteses Hipóteses Aceitar verdadeira Aceitar um hipótese não significa que esta é verdadeira, só significa que os dados aparecem consistentes com a nossa hipótese (provável) rejeitar muito improvável 3 Estatística Teste de hipóteses Nível de significância Suponha que temos uma população com distribuição F. Queremos testar um hipótese sobre P da F. Este hipótese chama-se “hipótese nula”. a) H0: m=5 Bar b) H0: m<5 Bar (N~(m,0.2)) (N~(m,0.2)) Caso a) é um hipótese simples: determina completamente F Caso b) é um hipótese complexo: não determina F Baseado numa mostra de tamanho n, podemos aceitar ou rejeitar H0 4 Estatística Teste de hipóteses H0 é rejeitada se a amostra (estatística) fizer parte da região crítica ,C, do espaço amostral: aceitar H0 se (X1, X2 ,...Xn ) C rejeitar H0 se (X1, X2 ,...Xn ) C Erro de tipo I: rejeitar erradamente H0 quando é verdadeira Erro de tipo II: aceitar erradamente H0 quando é falsa Quando H0 é verdadeira, a nossa hipótese só deve ser rejeitada se os valores observados forem muito improváveis. A probabilidade de cometer erro de tipo I não deve ultrapassar um valor especificado, a (geralmente baixo). 5 Estatística Teste de hipóteses a chama-se nível de significância. Existem convencionais, mas a escolha depende do objectivo: alguns níveis a=0.2 a=0.1 -é suficiente ser suspeitoso que H0 seja falsa -moderadamente convencido que H0 é falsa a=0.05 -bastante convencido que H0 é falsa a=0.005 -muito convencido que H0 é falsa 6 Estatística Teste de hipóteses Construção de um teste de hipótese 1) Escolha da estatística para o teste: geralmente um estimador e.g. média amostral 2) Escolha de um nível de significância 3) Determinação da distribuição de probabilidade da estatística e a correspondente região crítica 7 Estatística Teste de hipóteses Testar a média de uma distribuição normal de variância conhecida Hipótese nula: H0 : m=m0 Hipótese alternativa: H1 : mm0 Estatística (óbvia): X= n Região crítica: i =1 (média é igual com um dado valor) Xi n C = ( X m 0 c) Nos queremos determinar c em concordância de uma a tal que ( ) Pm 0 X m 0 c = a (e.g. a=5%, só 5 vezes em 100 amostras, a diferença entre a média amostral e a média ultrapassa c se H0 for verdadeira) 8 Estatística Teste de hipóteses Se for verdade que m=m0, nos podemos dizer: Z= n Assim, X m0 ~ N(0,1) s n Pm0 Z s c = a n a c = Aplicando simetria temos, Pm 0 Z 2 s Também sabemos que, O resultado, Pm0 (Z z a 2 ) = a c= 2 z a 2s n 9 Estatística Teste de hipóteses aceitar H0 se rejeitar H0 se X m0 X m0 z a 2s n z a 2s n 10 Estatística Teste de hipóteses Exemplo: Pretende-se re-calibrar uma balança. O erro das medições da balança tem uma s2=4 (mg2) e, desejavelmente, média 0. Fazendo 5 medições com peso calibrados a média amostral do erro é 1.5 mg. Pode ser que o erro da balança continue, em média, a ser 0 (a=0.05) H0 : m=0 H1 : mm0 n 5 X m0 = 1.5 = 1.68 z 0.025 = 1.96 s 2 H0 é aceite com 5% de nível de significância. 11 Estatística Teste de hipóteses Uma alternativa ao procedimento anterior é primeiro calcular: p n = P z X m0 2 s p chama-se valor de prova e dá o nível de significância crítica. H0 rejeita-se para todos valores de a que verifica pa. Exemplo: Determine p para o exemplo anterior p n = P z X m0 2 s = P(z 1.68) = 4.65% Assim para qualquer nível de significância superior de 2*0.0465=0.093 H0: erro do balanço=0 seria rejeitado (e.g. a=0.1) 12 Teste de hipóteses Estatística 13 Estatística Teste de hipóteses Erro de tipo II: qual é a probabilidade de aceitar erradamente H0 quando a verdadeira média mm0? Resultados possíveis H0 verdadeira H0 falsa H0 rejeitada Erro tipo I (probabilidade a) Correcta (probabilidade 1-b) H0 aceite Correcta (probabilidade 1-a) Erro tipo II (probabilidade b) 14 Estatística Teste de hipóteses Esta probabilidade (aceitar H0) é uma função da média verdadeira (m), b(m): X m0 b(m) = Pm z a 2 n z a 2 s para calcular b(m): m m X m m b(m) = Pm z a 2 n n n 0 z a 2 n = s s s s m m m m X m = = Pm n 0 za 2 n za 2 n 0 s s s m m m m = Pm n 0 za 2 Z za 2 n 0 s s 15 Estatística Teste de hipóteses m= m0+s m= m0+3s m= m0+2s 16 Estatística Teste de hipóteses Exemplo: Pretende-se re-calibrar uma balança. O erro das medições da balança tem uma s2=4 (mg2) e, desejavelmente, média 0. Fazendo 5 medições com pesos calibrados qual é a probabilidade de aceitarmos erradamente H0, se o factor de calibração verdadeiro era 2mg n m0 m 5 = 2 = 5 s 2 ; z0.025=1.96 ( ) ( ) = 1 ( 5 1.96) 1 ( 5 1.96) = = (4.196) ( 5 1.96) = 0.392 b(2) = 1.96 5 5 1.96 = 17 Estatística Teste de hipóteses No exemplo anterior é óbvio que a probabilidade de cometer o erro tipo II só depende do tamanho da mostra (para um dado a). Assim a função b(m1) podia ser usada para determinar o tamanho da mostra maximizando a probabilidade de aceitar H0: m=m0 à b, quando a verdadeira média é m1. Infelizmente não existe solução analítica mas pode ser usada a seguinte aproximação (sem prova): ( z n 2 a 2 zb ) s 2 (m 0 m1 )2 18 Estatística Teste de hipóteses O teste de hipótese discutido agora resultou uma rejeição de H0 quando o valor média da amostra ficou longe da média “hipotética” da população em qualquer sentido. O que acontece e.g. se a única alternativa é que mm0 ou: H0 : m=m0 (ou mm0) Neste caso o teste chama-se teste unilateral. Região crítica: H1 : mm0 C = (X m0 c) Nos queremos determinar c em concordância de uma a tal que Pm0 (X m0 c) = a 19 Estatística Teste de hipóteses n Assim podemos escrever: Pm 0 Z c(= z a ) = a s c= ou H0 : m=m0(ou mm0) H1 : mm0 zas n aceitar H0 se rejeitar H0 se zas X m0 n zas X m0 n A probabilidade do erro tipo II é dado m0 m m0 m b(m) = Pm Z z a n = z a n s s 20 Estatística Teste de hipóteses Exemplo: Considere o exemplo de calibração da balança(s2=4 (mg2)). Agora sabemos que se existe um erro, não pode ser negativo. Poderá o erro da balança em média continuar a ser 0 em média (a=0.05)? H0 : m=0 H1 : mm0 n (X m0 ) = 5 1.5 = 1.68 z0.05 = 1.645 s 2 H0 é rejeitado com 5% de nível de significância. A mesma forma podemos construir testes de hipótese unilateral para: H0 : m=m0 (ou mm0) aceitar H0 se rejeitar H0 se H1 : m<m0 X m0 zas n zas X m0 n 21 Estatística Teste de hipóteses Nota: Existe uma analogia directa entre os intervalos da confiança e os testes de hipóteses X m0 aceitar H0 se z a 2s n X m0 X z a 2s n z a 2s n z a 2s n X m0 ou z a 2s n X z a 2s n m0 X z a 2s n o intervalo de confiança: s s P X Za / 2 < m < X Za / 2 = 1 a n n Se m0 fica no intervalo da confiança com nível de conf. 1-a, H0 é aceitado 22 Estatística Teste de hipóteses Testar a média de uma distribuição normal de variância desconhecida-Teste do “t” de Student Hipótese nula: H0 : m=m0 Hipótese alternativa: H1 : mm0 Estatística: T= n Assim: aceitar H0 se rejeitar H0 se (média é igual a um dado valor) X m0 ~ t S X m0 t a 2,n 1S X m0 t a 2,n 1S n n 23 Estatística Teste de hipóteses Exemplo: Suspeita-se que nos EUA o consumo diário de água num domicilio seja de 350 (10-1) gal/dia. Realizou-se uma experiência, que envolveu 20 famílias, e observaram-se os seguintes resultados: 340 386 340 324 344 354 355 318 362 364 362 360 H0 : m=350 T= n p 2 375 332 322 338 356 402 372 370 H1 : m350 X m0 = 0.7778 s = P(t n 1 T ) = P(t19 0.7778) = 0.2231 ou p=0.4462 e.g. com a=0.05 H0 é aceitado (p>a). 24 Estatística Teste de hipóteses 0.22 25 Estatística Teste de hipóteses Podemos efectuar os testes unilaterais: A) H0 : m=m0 mm0) aceitar H0 se rejeitar H0 se B) H1 : mm0 (ou H0 : m=m0 (ou mm0) aceitar H0 se rejeitar H0 se X m0 t a ,n 1S X m0 t a ,n 1S n n H1 : m<m0 X m0 t a ,n 1S X m0 < t a ,n 1S n n 26 Estatística Teste de hipóteses Teste da igualdade das médias de duas populações normais com as variâncias conhecidas Hipótese nula: H0 : mX=mY Hipótese alternativa: H1 : mX mY i=1 Xi n Estatística: XY = n m i =1 m Yi s 2X s 2Y ~ N m X m Y , n m Assim se Ho for verdade: XY s s n m 2 X 2 Y ~ N(0,1) 27 Estatística Teste de hipóteses Assim podemos facilmente construir um teste de hipóteses porque, XY aceitar H0 se rejeitar H0 se s s n m 2 X 2 Y XY s s n m 2 X 2 Y za 2 za 2 28 Estatística Teste de hipóteses Exemplo: Temos dois métodos, um barato (B) e um caro (A), para imobilizar enzimas. Medimos o tempo (em horas) que as enzimas imobilizadas mantém a sua capacidade catalítica. Determine se o método mais barato pode ser considerado como uma boa alternativa ao método A com 5% nível de significância com sB=4 e sB=6. A 61.1 58.2 62.3 64 59.7 66.2 57.8 61.4 62.2 63.6 61.7 B 62.2 56.6 66.4 56.2 57.5 58.4 57.6 65.4 H0 : mA=mB Z= 61.7 60 16 36 10 8 H1 : mA mB = 1.7 = 0.688 z 0.025 = 1.96 2.47 H0 está aceitado com 5% nível de significância 60 29 Teste de hipóteses Estatística 30 Estatística Teste de hipóteses Teste da igualdade das médias de duas populações normais com as variâncias desconhecidas Hipótese nula: H0 : mX=mY Hipótese alternativa: H1 : mX mY Suponha que: sY sX= Estatística: T= X Y (m X m Y ) 2 2 1 1 (n 1)SX (m 1)SY nm2 n m aceitar H0 se |T|<ta/2,n+m-2 Assim se Ho for verdade: T~tn+m2 rejeitar H0 se |T|>ta/2,n+m-2 31 Estatística Teste de hipóteses Exemplo: Considere o exemplo anterior, mas agora suponha que as variâncias são também desconhecidos A 61.1 58.2 62.3 64 59.7 66.2 57.8 61.4 62.2 63.6 61.7 B 62.2 56.6 66.4 56.2 57.5 58.4 57.6 65.4 H0 : mA=mB T= H1 : mA mB 1.7 = 1.02 t 0.025 ,16 = 2.12 3.33 * 0.47 H0 está aceitado com 5% nível de significância 60 32 Teste de hipóteses Estatística 33 Estatística Teste de hipóteses Teste do “t” para dados emparelhados Muitas vezes estamos interessados em avaliar, se uma alteração qualquer no nosso sistema, melhorou ou não o sistema (menos custo, mais produção, melhor qualidade etc.) Para saber isso, compara-se o sistema antes (X) e após (Y) a alteração feita. Com n pares da amostra (Xi, Yi) podem ser usados para obter uma nova v.a. Wi= Xi-Yi Assim: Estatística: Hipótese nula: H0 : mW=0 Hipótese alternativa: H1 : mW 0 T= n W ~ t SW 34 Estatística Teste de hipóteses Assim: aceitar H0 se rejeitar H0 se W t a 2,n 1SW W t a 2,n 1SW n n Vantagem: O teste do “t” emparelhado pode ser utilizada, apresar as amostras não serem independentes ou não tiveram variâncias iguais, garantido que n1=n2. Desvantagem: o grau de liberdade em vez que 2n-2 fica apenas n-1. 35 Estatística Teste de hipóteses Exemplo: Recentemente um novo programa de segurança do trabalho foi introduzido na industria de produção de latas. O tempo (em horas) médio perdido na produção de cada semana por causa de acidentes foi medido em 10 empresas. Determine se o programa teve um efeito positivo com 5% de nível de significância. Antes 30.5 18.5 24.5 32 16 15 23.5 25.5 28 18 W = 2.15 SW = 3 Depois 23 21 22 28.5 14.5 15.5 24.5 21 23.5 16.5 10 W 7.5 -2.5 2.5 3.5 1.5 -0.5 -1 4.5 4.5 1.5 H0 : mW 0 H1 : mW 0 aceitar H0 se n W t n 1,a SW rejeitar H0 se n W t n 1,a SW 2.15 = 2.67 t 9,0.05 = 1.833 3 Assim H0 é rejeitado, o programa teve um efeito positivo com 5% de nível de significância 36 Teste de hipóteses Estatística 37 Estatística Teste de hipóteses Teste de hipóteses para a variância de populações normais Hipótese nula: H0 : s2=s20 Hipótese alternativa: H1 : s2s20 Estatística: Sabemos: (variância é igual com um dado valor) (n 1)S2 2 ~ n 1 s02 2 s2 2 P 1a / 2,n 1 < (n 1) 2 < a / 2,n 1 = 1 a s0 aceitar H0 se rejeitar H0 2 s 21a / 2,n 1 < (n 1) 2 < 2 a / 2,n 1 s0 para outros 38 Estatística Teste de hipóteses Exemplo: Uma nova máquina de encher garrafas da água foi instalada numa empresa de água. A máquina pode ser considerada eficiente se o desvio padrão do volume da água engarrafada não ultrapassar 0.15l (garrafas de 15l). 20 amostras indicaram uma variância amostral 0.025l2. O que podemos dizer sobre a máquina? H0 : s2s20 H1 : s2s20 (n 1)S2 19* 0.025 = = 21.111 19,0.1 = 27.2 2 s0 0.0225 (p = 33.07%) H0 é aceite com 10% nível de significância (e qualquer nível de significância a<p=33.07%). 39 Estatística Teste de hipóteses 21.1 40 Estatística Teste de hipóteses Teste da igualdade de variâncias de duas populações normais Hipótese nula: H0 : s2X=s2Y Hipótese alternativa: H 1 : s2 X s2 Y Estatística: S2X ~ Fn 1,m1 2 SY Então: = n 2 X S i =1 (X i X) 2 n 1 = m 2 Y ; S i =1 (Yi Y) 2 m 1 2 SX P F1a 2,n 1,m 1 < 2 < Fa 2,n 1,m 1 = 1 a SY 2 aceitar H0 se S F1a 2,n 1,m1 < X 2 < Fa 2,n 1,m1 SY rejeitar H0 para outros 41 Estatística Teste de hipóteses Distribuição Fn1,n2: Sejam 2n1 e 2n2 duas v.a. com distribuição chi-quadrado a v.a. F definida: n21 Fn1,n 2 = n2 2 n1 n2 tem uma distribuição F com n1e n2 graus de liberdade - f(x) muito complicado -tabelas para calcular probabilidades 42 Teste de hipóteses Estatística 43 Estatística Teste de hipóteses Exemplo: Existem dois catalisadores utilizados num processo químico. A quantidade de produto formado usando qualquer um dos catalisadores não tem uma diferença significativa em termos do valor da média. Mas também queremos testar, se as variâncias podem ser considerados iguais com 5% nível de significância. As mostras indicaram que S21=0.14 (n=10) e S22=0.28 (n=12). Hipótese nula: H0 : s2X=s2Y Hipótese alternativa: H1 : s2X s2Y 2 SX = 0 .5 2 SY F10.025,9,11 = 1 F0.025,11,9 = 0.26 F0.025,9,11 = 3.59 0.26 < 0.5 < 3.59 assim o hipótese de variâncias iguais é aceite. 44 Teste de hipóteses Estatística 4 45