Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites Teste de Hipóteses Na abordagem descritiva, de coleta de fatos, estimar médias e proporções tem a sua importância evidente, ela não constitui o objetivo principal da tomada de decisões ou atividade de pesquisa social. Ao contrário, a maioria dos pesquisadores sociais está preocupada com a tarefa de testar hipóteses. Nas ciências sociais, as hipóteses geralmente dizem respeito a diferenças entre grupos. Ao testar essas diferenças, os pesquisadores sociais formulam perguntas como: os alemães diferem dos norte-americanos em questões de obediência à autoridade? Os protestantes acusam maior taxa de suicídio do que os católicos? Os políticos conservadores impõem a seus filhos uma disciplina mais severa do que os liberais? Note que cada pergunta da pesquisa envolve uma comparação entre dois grupos: conservadores versus liberais, protestantes versus católicos, alemães versus norte-americanos. Tomando um exemplo mais concreto, suponha que um gerontologista deseje comparar dois métodos para melhorar a memória dos internos de um asilo. Para tanto, seleciona 10 internos e divide-os aleatoriamente em dois grupos. A um dos grupos é aplicado o Método A; ao outro grupo, o Método B. Suponhamos ainda que, em seguida ao treinamento de reforço da memória, a todos os 10 indivíduos seja aplicado o mesmo teste de memorização. O escore médio amostral para os 5 indivíduos sob o Método A é 82, e a média amostral para o grupo do Método B é 77. O Método A é melhor para reforçar a capacidade de memorização? Talvez sim, talvez não. É impossível tirar qualquer conclusão até que tenhamos maior conhecimento sobre os dados. Suponhamos, apenas por um momento, que os conjuntos de escores de memorização para os dois grupos de internos tenham sido os seguintes: No grupo do Método A, os escores de memorização situam-se consistentemente nos 80, o que nos leva a crer que a média 2 78 populacional esteja próxima da média amostral de 82. Analogamente, 83 77 diríamos que a média populacional para o Método B está próxima da 82 76 média amostral de 77. Dada a homogeneidade dos escores e, assim, 80 78 das médias amostrais, provavelmente concluiríamos que a diferença 83 76 Média = 82 Média = 77 entre as médias amostrais é mais do que o simples resultado da chance ou do erro amostral. Na realidade, o Método A parece ser mais eficiente do que o Método B. Método A Método B Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites Suponhamos agora que os seguintes conjuntos de escores tenham dado as médias amostrais 82 e 77. É claro que, em ambos os grupos, há ampla variabilidade ou dispersão entre os escores de 70 70 memorização. Como resultado, ambas as médias amostrais são 90 90 estimativas relativamente instáveis de suas respectivas médias 91 91 56 56 populacionais. Dada a heterogeneidade dos escores amostrais e a 78 78 não-confiabilidade das médias amostrais, não poderíamos concluir Média = 82 Média = 77 que a diferença entre as médias amostrais fosse algo mais que o resultado de pura chance ou de erro amostral. De fato, não há evidência suficiente para concluir que o Método A seja mais eficiente do que o Método B. Método A Método B A Hipótese Nula: Nenhuma Diferença entre as Médias Tornou-se uma convenção na análise estatística iniciar o trabalho testando a hipótese nula - a hipótese segundo a qual duas amostras foram extraídas de populações equivalentes. De acordo com a hipótese nula, qualquer diferença observada entre amostras é encarada como uma ocorrência casual resultante apenas do erro amostral. Portanto, uma diferença constatada entre duas médias amostrais não representa uma diferença verdadeira entre suas médias populacionais. No presente contexto, a hipótese nula pode ser simbolizada como: H0: µ1=µ2 Ha: µ1≠µ2 onde µ1 = média da primeira população µ2 = média da segunda população Examinemos as hipóteses nulas para os problemas de pesquisa postos anteriormente: 1. Os alemães não são nem mais nem menos submissos à autoridade do que os norte-americanos. 2. Os protestantes apresentam a mesma taxa de suicídio que os católicos. 3. Os políticos conservadores e os políticos liberais disciplinam seus filhos da mesma maneira. Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites A Hipótese de Pesquisa: Alguma Diferença entre as Médias A hipótese nula é geralmente (embora não necessariamente) estabelecida com o intuito de a negarmos. Isso faz sentido, porque a maioria dos pesquisadores sociais procura estabelecer relações entre variáveis; ou seja, eles estão em geral mais interessados em achar diferenças do que em determinar que elas não existem. As diferenças entre grupos - quer esperadas teoricamente ou em bases empíricas - quase sempre proporcionam o fundamento lógico para a pesquisa. Se rejeitamos a hipótese nula, isto é, se achamos que nossa hipótese de não haver diferença entre médias provavelmente não é válida, automaticamente aceitamos a hipótese de pesquisa de que de fato existe uma diferença entre as populações. Esse é, em geral, o resultado esperado em pesquisa social. A hipótese de pesquisa nos diz que as duas amostras foram extraídas de populações com médias diferentes e que a diferença obtida entre médias amostrais é demasiadamente grande para ser atribuída a erro amostral. .Teste de Diferença entre Médias A hipótese de pesquisa para a diferença entre médias é simbolizada por: Ha: µ1≠µ2 onde µ1= média da primeira população µ2= média da segunda população Nota: ≠ significa não é igual. Podemos especificar as seguintes hipóteses de pesquisa para os problemas de pesquisa vistos anteriormente: 1. Os alemães diferem dos norte-americanos em relação à obediência à autoridade. 2. Os protestantes não apresentam a mesma taxa de suicídio que os católicos. 3. Os políticos liberais diferem dos políticos conservadores em relação aos métodos permissivos de educação dos filhos. Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites Distribuição Amostral da Diferença entre Médias No capitulo precedente vimos que as 100 médias das 100 amostras extraídas por nosso excêntrico pesquisador social poderiam ser grafadas na forma de uma distribuição amostral de médias. De maneira análoga, imaginemos agora que o mesmo pesquisador estude não apenas uma, mas duas amostras simultaneamente, a fim de compará-las. Suponha, por exemplo, que o pesquisador esteja ministrando um curso sobre a sociologia da família. Seu interesse consiste em saber se há diferenças de sexo nas atitudes em relação à educação das crianças. Especificamente, interessa-lhe determinar se os homens e as mulheres diferem em termos de permissividade na educação de crianças. Para testar diferenças, ele constrói inicialmente uma escala de itens múltiplos, que inclui várias perguntas sobre a conveniência de dar palmadas, tarefas para crianças pequenas e obediência às ordens dos pais. Sua escala de permissividade varia de um mínimo de 1 (nenhuma permissividade) até 100 (extremamente permissivo). Em seguida, o pesquisador seleciona uma amostra aleatória de 30 mulheres e uma amostra aleatória de 30 homens da relação de estudantes e submete seu questionário a todos os 60 estudantes. Conforme ilustrado graficamente na Figura 7.1, nosso excêntrico pesquisador descobre que sua amostra de mulheres é mais permissiva ( que sua amostra de homens ( x x = 58,0) do = 54,0). Nota: +4 representa a diferença de médias entre duas amostras aleatórias, cada uma contendo 30 pessoas. Antes de concluir que as mulheres são efetivamente mais permissivas do que os homens, nosso pesquisador poderia perguntar: à luz do erro amostral, podemos Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites esperar uma diferença entre 58,0 e 54,0 (58,0 - 54,0 = +4,0) estritamente com base na chance e somente na chance? Com base exclusivamente na sorte da extração, poderia a amostra de mulheres consistir em pessoas mais permissivas do que a amostra de homens? Devemos manter a hipótese nula (de nenhuma diferença) ou a diferença amostral obtida, de +4,0, é suficientemente grande para indicar uma verdadeira diferença populacional entre mulheres e homens em relação a suas atitudes para com a educação de crianças? A diferença média de permissividade entre amostras de mulheres e de homens extraídas de uma população hipotética. Ao abordarmos a questão em causa, deve levar a noção de distribuição de freqüência um passo adiante e examinar a natureza de uma distribuição amostral de diferença entre médias - isto é, uma distribuição de freqüência de um grande número de diferenças entre médias amostrais extraídas aleatoriamente de determinada população. Para ilustrar a distribuição amostral de diferenças entre médias, voltemos às atividades compulsivas do nosso excêntrico pesquisador, cuja paixão pela extração de amostras aleatórias mais uma vez o levou a continuar o processo de amostragem além de seus limites razoáveis. Em vez de extrair uma única amostra de 30 mulheres e uma única amostra de 30 homens, ele estuda 70 pares dessas amostras (70 pares de amostras, contendo cada um 30 mulheres e 30 homens), dando-se por feliz por lecionar em um grande colégio. Para cada par de amostras, o pesquisador administra a mesma escala de permissividade na educação de crianças. Ele calcula então uma média amostral para cada amostra de mulheres e uma média amostral para cada amostra de homens e obtém uma média das mulheres e uma média dos homens para cada um dos 70 pares de amostra. Em seguida, o pesquisador estabelece um escore de diferenças entre médias subtraindo o escore médio para homens do escore médio para mulheres, para cada par de amostra. Por exemplo, sua primeira comparação deu uma diferença entre médias de +4,0. Seu segundo par de médias poderia ser 57,0 para a amostra de mulheres e 56,0 para a amostra de homens, dando um escore de diferenças entre médias de + 1,0. Da mesma maneira, o terceiro par de amostras pode ter gerado uma média de 60,0 para as mulheres e uma média de 64,0 para os homens, e a diferença entre médias seria de -4,0. Obviamente, quanto maior o escore da diferença, maior a diferença entre as duas amostras de entrevistados no que se refere à permissividade. Note-se Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites Figura 2: Setenta escores de diferenças entre médias. Os 70 escores que representam diferenças entre médias, apresentados na Figura 7.2, foram reorganizados na Tabela 7.1 como uma distribuição amostral de diferenças entre médias. Como no caso de escores de outros tipos de distribuição de freqüências, estes também foram dispostos em ordem consecutiva, do maior para o menor, e a freqüência de ocorrência está indicada em uma coluna adjacente. Para ilustrar as propriedades-chave de uma distribuição amostral de diferenças entre médias, a distribuição de freqüências da Tabela 7.1 foi apresentada graficamente na Figura 7.3. Tabela 7.1. – Distribuição amostral de diferenças para 70 pares de amostras aleatórias Diferença de médias +5 +4 +3 +2 +1 0 -1 -2 -3 -4 -5 Total f 1 2 5 7 10 18 10 8 5 3 1 70 Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 Figura 7.3. – Polígono de freqüências da distribuição amostral de diferença de médias Conforme ilustrado, vemos que a distribuição amostral de diferenças entre médias tende para uma curva normal cuja média (média de diferenças entre médias) é zero. Isso faz sentido, porque as diferenças positivas e negativas entre médias na distribuição tendem a cancelar-se mutuamente (para cada valor negativo, tende a haver um valor positivo a igual distância da média). Como uma curva normal, a maioria das diferenças entre médias amostrais nessa distribuição está próxima de zero - seu ponto mais central. Há relativamente poucas diferenças entre médias que acusam valores extremos em qualquer direção a contar da média dessas diferenças. Isso já era de esperar, porque a distribuição total de diferenças entre médias é resultado de erro amostral e não de diferenças populacionais reais entre mulheres e homens. Em outras palavras, se a diferença média real entre as populações de mulheres e de homens é zero, esperamos também que a média da distribuição de diferenças entre médias amostrais seja zero. Teste de Hipóteses com a Distribuição da Diferença entre Médias Em capítulos anteriores vimos como fazer afirmações probabilísticas sobre a ocorrência tanto de escores brutos como de médias amostrais. No caso presente, procuramos fazer essas afirmações sobre os escores de diferenças na distribuição amostral de diferenças entre médias. Como já salientamos, essa distribuição amostral toma a forma da curva normal e, assim, pode ser encarada como uma distribuição de probabilidade. Podemos dizer que a probabilidade decresce à medida que nos afastamos mais e mais da média das diferenças (zero). Mais especificamente, conforme ilustrado na Figura 7.4, vemos que 68,26% das diferenças entre médias Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites situam-se a +1 σ x1 − x 2 e -1 σ x1 − x 2 a contar de zero. ( A notação σ x −x 1 2 representa o deesvio padrão da diferença entre as médias) FIGURA 7.4. A distribuição amostral de diferenças entre médias como uma distribuição de probabilidade. Para determinar quão distante de uma diferença de zero está a diferença obtida entre as médias. Ao fazermos isso, devemos primeiro transformar a diferença obtida em unidades de desvio padrão, σ x −x 1 Zc = 2 . Portanto, a estatística de teste é ( x1 − x 2 ) − 0 σ x −x 1 onde σx 1 − x2 = σ 12 n1 + 2 σ 22 n2 quando as variâncias populacionais forem conhecidas, usa-se a tabela Z. Exemplo: Uma companhia distribuidora tem por hipótese que uma chamada telefônica é mais eficiente que uma carta para acelerar s cobrança de contas atrasadas. Esta companhia fez uma experiência usando duas amostras e obteve os resultados da tabela abaixo. Analisando os resultados e sabendo-se que as variâncias populacionais são 4,6 e 4,1 respectivamente no que se refere ao número de dias de Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites pagamento por carta e por chamada telefônica, dê uma sugestão a respeito da tomada de decisão mais viável para a companhia, baseado nos resultados dos testes elaborados via Excel que se encontram abaixo. Justifique o teste utilizado baseado nas suposições que foram feitas. Adote α =5%.(Não esqueça de elaborar as hipóteses estatísticas) Método utilizado Carta Chamada telefônica 10 7 Nº de dias até o pagamento 8 9 11 11 14 10 4 5 4 8 6 9 Quando as variâncias populacionais forem desconhecidas, usa-se a estimativa de desvio padrão da diferença entre médias t c ( Χ −Χ ) 2 = 1 σˆ x − x 1 σˆ x − x 1 onde 2 2 2 ⎛1 1⎞ + ⎟⎟. σˆ ⎝ n1 n2 ⎠ = ⎜⎜ ou σˆ x − x 1 2 , e a tabela t, ou seja, Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites ( ) ( ) n −1 S2+ n −1 S2 2 1 2 2 σˆ = 1 n +n −2 1 2 com n1 + n2 − 2 gl . Exemplo: Uma amostra de 100 lâmpadas da marca A acusou uma vida média de 1.190 horas, e desvio-padrão amostral de 90 horas. Uma amostra de 75 lâmpadas da marca B acusou uma vida média de 1.230 horas e desvio-padrão amostral de 120 horas. Fixando α=0,05, pode-se admitir que a vida média B é superior à vida média de A? Admita populações normais. Teste de Hipóteses para observações emparelhadas -Comparando Duas Medições da Mesma Amostra Até aqui discutimos as comparações entre duas amostras extraídas independentemente (por exemplo, homens versus mulheres, negros versus brancos ou liberais versus conservadores). Antes de deixarmos este tópico, devemos introduzir uma variante final da comparação de duas médias, conhecida como planejamento antes-depois ou painel: o caso de uma única amostra medida em pontos diferentes do tempo (tempo 1 versus tempo 2). Por exemplo, um pesquisador pode procurar medir o grau de hostilidade em uma única amostra de crianças, antes e depois de ! assistirem a determinado programa de televisão. Da mesma maneira, podemos interessar-nos: em medir diferenças de atitudes em relação a determinado candidato a um posto, antes e depois de ser lançada uma campanha de propaganda. Exemplo: Para testar o grau de amabilidade, entrevistamos uma amostra de 6 indivíduos em relação aos seus vizinhos, antes e após serem forçados a se mudar. Nossa entrevista acusou os seguintes escores de amabilidade escores de 1 a 4, maior escore, maior amabilidade). Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites Entrevistado Antes da Após a mudança (X1) mudança (X2) 2 1 3 3 1 4 - 1 2 1 1 2 1 - Stephanie Myron Carol Inez Leon David ΣX1 = 14 ΣX2 = 8 Diferença (D = XI-X2) (Diferença)2 (D2) 1 -I 2 2 -1 3 1 1 4 4 1 9 - ΣD=6 ΣD2 = 20 Se D = escore bruto após a mudança subtraído do escore bruto antes da mudança n = número de casos ou entrevistados na amostra A média dos escores é D= ∑D D= 1 n Sendo SD = desvio padrão da distribuição de escores das diferenças antes-depois sD = sD = ∑D 2 − n.D 2 n −1 20 − 6.1 = 1,67 5 A estatística de teste é t c = D − µ S D n D ; (n − 1 ) gl Pontifícia Universidade Católica – PUCRS Faculdade de Matemática – Departamento de Estatística Profa. Rossana Fraga Benites t c = 1− 0 = 1,47 1 , 67 6 olhando na tabela t com n-1gl temos 5gl e para alfa igual a 0,05, temos o valor de t tabelado igual a 2,571.