Boa tarde, colegas. Hoje veremos mais um tópico de Estatística Avançada para o ISS-SP. Trata-se do Teste de Hipóteses. Inicialmente, gostaria de salientar que o Teste de Hipóteses não é complicado, muito pelo contrário. Basta seguir uma série de passos e ele é feito com facilidade razoável. Mas, primeiramente, devemos pensar: qual é o objetivo do Teste de Hipóteses? O objetivo deste Teste é afirmar se um parâmetro θ desconhecido é aceito ou não dentro de uma Distribuição de Probabilidade. Vamos utilizar um exemplo bem simples para aprender estes passos. Depois, já tendo aprendido, faremos uma questão, recente, da FCC. Vejamos: “Uma amostra de 49 elementos de uma variável X, normalmente distribuída, forneceu X = 51 e S = 7,5. Testar, no nível de significância de 5%, a hipótese de que μ = 50 versus a hipótese alternativa de que μ ≠ 50”. PASSO 1: Definir H0 e H1. H0 será sempre uma igualdade. No nosso caso, por exemplo, H0 = μ = 50. H1 será a hipótese alternativa, que contesta H0. No nosso caso, H1 = μ ≠ 50. PASSO 2: Definir o tipo de Teste de Hipóteses. O tipo de Teste de Hipóteses será definido pelo sinal de H1. ≠ Æ Teste Bilateral Sinal de H1 > Æ Teste Unilateral Direito < Æ Teste Unilateral Esquerdo Neste caso, temos um teste Bilateral. PASSO 3: Definir o tipo de curva. O tipo de curva será definido pelo valor de n. n >= 30 e σ dado Æ curva normal Valor de n n < 30 e σ não dado Æ curva t de student No nosso caso, n = 49 e S, que é o σ de uma amostra, foi dado. Assim, usaremos a curva normal. Agora, vamos ao mais importante, a realização do teste de hipóteses. Temos: PASSO 4: Definir ztabelado, com base no desenho da curva. PASSO 5: Definir zcalculado, com base nos dados do problema. PASSO 6: Realizar o teste de hipóteses, comparando ztabelado e zcalculado. PASSO 4: Definir ztabelado, com base no desenho da curva. Vamos fazer uma curva normal padrão, como a que vimos no último artigo. Com base no nível de significância dado, haverá uma área aceita e uma área rejeitada. Esta área rejeitada é igual ao nível de significância. E tudo o que precisamos para desenhar a curva é do valor do nível de significância. O nível de significância é o valor para “fora” do intervalo desejado. O nosso teste é bilateral, como já vimos. Isso significa que a área rejeitada estará dividida metade para um lado e metade para outro. Ou seja, em cada lado a área será de α/2: α/2 α/2 Com base na área acima, de α/2, vamos na tabela de z, que vimos anteriormente, e encontramos ztabelado. No nosso caso, α/2 = 5/2 = 2,5%. Numa tabela z<Z devemos procurar a área a partir do µ = 0, ou seja, temos que procurar a área em cinza do gráfico acima. Esta área é igual a 1 - 0,025 = 0,9750. Então, temos que procurar a área de 0,9750 na tabela: z 0,0 1,8 1,9 0,0 0,5000 0,9641 0,9713 0,01 0,5040 0,9649 0,9719 0,02 0,5080 0,9656 0,9726 0,03 0,5120 0,9664 0,9732 0,04 0,5160 0,9671 0,9738 0,05 0,5199 0,9678 0,9744 0,06 0,5239 0,9686 0,9750 0,07 0,5279 0,9693 0,9756 0,08 0,5319 0,9699 0,9761 0,09 0,5359 0,9706 0,9767 Como podemos perceber na tabela acima, para esta área z = 1,96. Ou seja, nosso ztabelado = 1,96. PASSO 5: Definir zcalculado, com base nos dados do problema. A partir dos dados, calculamos um z que chamamos zcalculado. A equação de zcalculado é: zcalculado = X −μ σ n Assim, temos: zcalculado = X −μ σ n = 51 − 50 1 = = 0, 93 7,5 7,5 7 49 PASSO 6: Realizar o teste de hipóteses, comparando ztabelado e zcalculado. Finalmente, utilizamos o mesmo gráfico anterior para fazer o teste da hipótese. O teste é: “O z que foi calculado está dentro da área delimitada pelo z tabelado?”. Assim, temos: Como podemos ver, o zcalculado está dentro da área de aceitação, delimitada por ztabelado. Isso significa que a hipótese H0 é aceita. Se zcalculado estivesse fora da área de aceitação, a hipótese H0 não seria aceita, por conseguinte, a hipótese aceita seria H1. Existem três variações do Teste de Hipóteses: Variação 1: n < 30 (usaríamos a curva t de student, mas fiquem tranquilos pois só muda a tabela de “z”, mais nada). Variação 2: ao invés de falar em média, o problema fala em proporção. A única coisa que muda é a equação, usa-se uma equação de proporção: zcalculado = p−P P(1 − P ) n 3: Variação a população ser finita. Neste denominador de ambas as equações de zcalculado zcalculado = o X −μ σ n zcalculado = caso, multiplicar N−n por : N −1 N−n N −1 p−P P(1 − P ) N − n . n N −1 Portanto, passemos à resolução da questão da FCC: FCC/TRT 23a Região/Analista Jud. - Estatística/2011 A população correspondente aos salários dos empregados de um determinado ramo de atividade é considerada normal, de tamanho infinito e desvio padrão populacional igual a R$ 400,00. Uma amostra aleatória de tamanho 100 é extraída desta população obtendo-se uma média igual a R$ 2.050,00. Com base nesta amostra, deseja-se testar a hipótese se a média μ da população é igual a R$ 2.000,00, a um nível de significância de 5%. Foram formuladas as hipóteses Ho: μ = R$ 2.000,00 (hipótese nula) e H1: μ ≠ R$ 2.000,00 (hipótese alternativa). Para a tomada de decisão, o valor do escore reduzido, utilizado para comparação com o valor z da distribuição normal padrão (Z) tal que a probabilidade P (|Z| > z) = 5%, é (A) 2,50. (B) 2,25. (C) 2,00. (D) 1,75. (E) 1,25. Vamos aos passos que vimos: PASSO 1: Definir H0 e H1. O enunciado forneceu: H0: μ = 2000 e H1: μ ≠ 2000 PASSO 2: Definir o tipo de Teste de Hipóteses. O tipo de Teste de Hipóteses será definido pelo sinal de H1: μ ≠ 2000 ≠ Æ Teste Bilateral Sinal de H1 > Æ Teste Unilateral Direito < Æ Teste Unilateral Esquerdo PASSO 3: Definir o tipo de curva. O tipo de curva será definido pelo valor de n = 100. n >= 100 e σ dado Æ curva normal Valor de n n < 30 e σ não dado Æ curva t de student PASSO 4: Definir ztabelado, com base no desenho da curva. O enunciado não forneceu nenhum dado nem tabela. Disse apenas que o intervalo deve ser de 95%. Isso ocorre porque ele não quer que o Teste de Hipóteses seja efetivamente realizado. Vejam que ele pede, simplesmente, o valor do escore reduzido, utilizado para comparação com o valor z da distribuição normal padrão (Z) tal que a probabilidade P (|Z| > z) = 5%. Ou seja, ele quer que encontremos, simplesmente, zcalculado. PASSO 5: Definir zcalculado, com base nos dados do problema. A partir dos dados, calculamos um z que chamamos zcalculado. A equação de zcalculado é: zcalculado = X −μ σ n Temos os seguintes dados no enunciado: X =2050 μ = 2000 σ = 400 n = 100 zcalculado = X −μ σ n = 2050 − 2000 50 50 = = = 1,25 400 400 40 10 100 Assim, a resposta é a letra E. Resposta: Letra E. Ficamos por aqui. Na próxima semana veremos a Estatística F. Bons estudos, Karine