Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
Teste de Hipóteses
Na abordagem descritiva, de coleta de fatos, estimar médias e proporções tem a sua
importância evidente, ela não constitui o objetivo principal da tomada de decisões ou
atividade de pesquisa social. Ao contrário, a maioria dos pesquisadores sociais está
preocupada com a tarefa de testar hipóteses.
Nas ciências sociais, as hipóteses geralmente dizem respeito a diferenças entre
grupos. Ao testar essas diferenças, os pesquisadores sociais formulam perguntas
como: os alemães diferem dos norte-americanos em questões de obediência à
autoridade? Os protestantes acusam maior taxa de suicídio do que os católicos? Os
políticos conservadores impõem a seus filhos uma disciplina mais severa do que os
liberais? Note que cada pergunta da pesquisa envolve uma comparação entre dois
grupos: conservadores versus liberais, protestantes versus católicos, alemães versus
norte-americanos.
Tomando um exemplo mais concreto, suponha que um gerontologista deseje
comparar dois métodos para melhorar a memória dos internos de um asilo. Para tanto,
seleciona 10 internos e divide-os aleatoriamente em dois grupos. A um dos grupos é
aplicado o Método A; ao outro grupo, o Método B.
Suponhamos ainda que, em seguida ao treinamento de reforço da memória, a
todos os 10 indivíduos seja aplicado o mesmo teste de memorização. O escore médio
amostral para os 5 indivíduos sob o Método A é 82, e a média amostral para o grupo do
Método B é 77. O Método A é melhor para reforçar a capacidade de memorização?
Talvez sim, talvez não. É impossível tirar qualquer conclusão até que tenhamos maior
conhecimento sobre os dados.
Suponhamos, apenas por um momento, que os conjuntos de escores de
memorização para os dois grupos de internos tenham sido os seguintes:
No grupo do Método A, os escores de memorização situam-se
consistentemente nos 80, o que nos leva a crer que a média
2
78
populacional esteja próxima da média amostral de 82. Analogamente,
83
77
diríamos que a média populacional para o Método B está próxima da
82
76
média amostral de 77. Dada a homogeneidade dos escores e, assim,
80
78
das médias amostrais, provavelmente concluiríamos que a diferença
83
76
Média = 82 Média = 77 entre as médias amostrais é mais do que o simples resultado da
chance ou do erro amostral. Na realidade, o Método A parece ser mais eficiente do
que o Método B.
Método A Método B
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
Suponhamos agora que os seguintes conjuntos de escores tenham
dado as médias amostrais 82 e 77. É claro que, em ambos os
grupos, há ampla variabilidade ou dispersão entre os escores de
70
70
memorização. Como resultado, ambas as médias amostrais são
90
90
estimativas relativamente instáveis de suas respectivas médias
91
91
56
56
populacionais. Dada a heterogeneidade dos escores amostrais e a
78
78
não-confiabilidade das médias amostrais, não poderíamos concluir
Média = 82 Média = 77
que a diferença entre as médias amostrais fosse algo mais que o
resultado de pura chance ou de erro amostral. De fato, não há evidência suficiente
para concluir que o Método A seja mais eficiente do que o Método B.
Método A
Método B
A Hipótese Nula: Nenhuma Diferença entre as Médias
Tornou-se uma convenção na análise estatística iniciar o trabalho testando a hipótese
nula - a hipótese segundo a qual duas amostras foram extraídas de populações
equivalentes. De acordo com a hipótese nula, qualquer diferença observada entre
amostras é encarada como uma ocorrência casual resultante apenas do erro amostral.
Portanto, uma diferença constatada entre duas médias amostrais não representa uma
diferença verdadeira entre suas médias populacionais.
No presente contexto, a hipótese nula pode ser simbolizada como:
H0: µ1=µ2
Ha: µ1≠µ2
onde
µ1 = média da primeira população
µ2 = média da segunda população
Examinemos as hipóteses nulas para os problemas de pesquisa postos anteriormente:
1. Os alemães não são nem mais nem menos submissos à autoridade do que os
norte-americanos.
2. Os protestantes apresentam a mesma taxa de suicídio que os católicos.
3. Os políticos conservadores e os políticos liberais disciplinam seus filhos da
mesma maneira.
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
A Hipótese de Pesquisa: Alguma Diferença entre as Médias
A hipótese nula é geralmente (embora não necessariamente) estabelecida com o
intuito de a negarmos. Isso faz sentido, porque a maioria dos pesquisadores sociais
procura estabelecer relações entre variáveis; ou seja, eles estão em geral mais
interessados em achar diferenças do que em determinar que elas não existem. As
diferenças entre grupos - quer esperadas teoricamente ou em bases empíricas - quase
sempre proporcionam o fundamento lógico para a pesquisa.
Se rejeitamos a hipótese nula, isto é, se achamos que nossa hipótese de não
haver diferença entre médias provavelmente não é válida, automaticamente aceitamos
a hipótese de pesquisa de que de fato existe uma diferença entre as populações. Esse
é, em geral, o resultado esperado em pesquisa social. A hipótese de pesquisa nos diz
que as duas amostras foram extraídas de populações com médias diferentes e que a
diferença obtida entre médias amostrais é demasiadamente grande para ser atribuída
a erro amostral.
.Teste de Diferença entre Médias
A hipótese de pesquisa para a diferença entre médias é simbolizada por:
Ha: µ1≠µ2
onde
µ1= média da primeira população
µ2= média da segunda população
Nota: ≠ significa não é igual.
Podemos especificar as seguintes hipóteses de pesquisa para os problemas de
pesquisa vistos anteriormente:
1. Os alemães diferem dos norte-americanos em relação à obediência à autoridade.
2. Os protestantes não apresentam a mesma taxa de suicídio que os católicos.
3. Os políticos liberais diferem dos políticos conservadores em relação aos métodos
permissivos de educação dos filhos.
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
Distribuição Amostral da Diferença entre Médias
No capitulo precedente vimos que as 100 médias das 100 amostras extraídas por
nosso excêntrico pesquisador social poderiam ser grafadas na forma de uma
distribuição amostral de médias. De maneira análoga, imaginemos agora que o mesmo
pesquisador estude não apenas uma, mas duas amostras simultaneamente, a fim de
compará-las.
Suponha, por exemplo, que o pesquisador esteja ministrando um curso sobre a
sociologia da família. Seu interesse consiste em saber se há diferenças de sexo nas
atitudes em relação à educação das crianças. Especificamente, interessa-lhe
determinar se os homens e as mulheres diferem em termos de permissividade na
educação de crianças.
Para testar diferenças, ele constrói inicialmente uma escala de itens múltiplos,
que inclui várias perguntas sobre a conveniência de dar palmadas, tarefas para
crianças pequenas e obediência às ordens dos pais. Sua escala de permissividade varia
de um mínimo de 1 (nenhuma permissividade) até 100 (extremamente permissivo). Em
seguida, o pesquisador seleciona uma amostra aleatória de 30 mulheres e uma amostra
aleatória de 30 homens da relação de estudantes e submete seu questionário a todos
os 60 estudantes. Conforme ilustrado graficamente na Figura 7.1, nosso excêntrico
pesquisador descobre que sua amostra de mulheres é mais permissiva (
que sua amostra de homens (
x
x = 58,0) do
= 54,0).
Nota: +4 representa a diferença de médias entre duas amostras aleatórias, cada uma
contendo 30 pessoas.
Antes de concluir que as mulheres são efetivamente mais permissivas do que os
homens, nosso pesquisador poderia perguntar: à luz do erro amostral, podemos
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
esperar uma diferença entre 58,0 e 54,0 (58,0 - 54,0 = +4,0) estritamente com base
na chance e somente na chance? Com base exclusivamente na sorte da extração,
poderia a amostra de mulheres consistir em pessoas mais permissivas do que a
amostra de homens? Devemos manter a hipótese nula (de nenhuma diferença) ou a
diferença amostral obtida, de +4,0, é suficientemente grande para indicar uma
verdadeira diferença populacional entre mulheres e homens em relação a suas atitudes para com a educação de crianças?
A diferença média de permissividade entre amostras de mulheres e de homens
extraídas de uma população hipotética.
Ao abordarmos a questão em causa, deve levar a noção de distribuição de
freqüência um passo adiante e examinar a natureza de uma distribuição amostral de
diferença entre médias - isto é, uma distribuição de freqüência de um grande número
de diferenças entre médias amostrais extraídas aleatoriamente de determinada
população.
Para ilustrar a distribuição amostral de diferenças entre médias, voltemos às
atividades compulsivas do nosso excêntrico pesquisador, cuja paixão pela extração de
amostras aleatórias mais uma vez o levou a continuar o processo de amostragem além
de seus limites razoáveis. Em vez de extrair uma única amostra de 30 mulheres e uma
única amostra de 30 homens, ele estuda 70 pares dessas amostras (70 pares de
amostras, contendo cada um 30 mulheres e 30 homens), dando-se por feliz por
lecionar em um grande colégio.
Para cada par de amostras, o pesquisador administra a mesma escala de
permissividade na educação de crianças. Ele calcula então uma média amostral para
cada amostra de mulheres e uma média amostral para cada amostra de homens e
obtém uma média das mulheres e uma média dos homens para cada um dos 70 pares de
amostra.
Em seguida, o pesquisador estabelece um escore de diferenças entre médias
subtraindo o escore médio para homens do escore médio para mulheres, para cada par
de amostra. Por exemplo, sua primeira comparação deu uma diferença entre médias de
+4,0. Seu segundo par de médias poderia ser 57,0 para a amostra de mulheres e 56,0
para a amostra de homens, dando um escore de diferenças entre médias de + 1,0. Da
mesma maneira, o terceiro par de amostras pode ter gerado uma média de 60,0 para
as mulheres e uma média de 64,0 para os homens, e a diferença entre médias seria de
-4,0. Obviamente, quanto maior o escore da diferença, maior a diferença entre as
duas amostras de entrevistados no que se refere à permissividade. Note-se
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
Figura 2: Setenta escores de diferenças entre médias.
Os 70 escores que representam diferenças entre médias, apresentados na
Figura 7.2, foram reorganizados na Tabela 7.1 como uma distribuição amostral de
diferenças entre médias. Como no caso de escores de outros tipos de distribuição de
freqüências, estes também foram dispostos em ordem consecutiva, do maior para o
menor, e a freqüência de ocorrência está indicada em uma coluna adjacente.
Para ilustrar as propriedades-chave de uma distribuição amostral de diferenças
entre médias, a distribuição de freqüências da Tabela 7.1 foi apresentada
graficamente na Figura 7.3.
Tabela 7.1. – Distribuição amostral de diferenças para 70 pares de amostras aleatórias
Diferença de médias
+5
+4
+3
+2
+1
0
-1
-2
-3
-4
-5
Total
f
1
2
5
7
10
18
10
8
5
3
1
70
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
-5 -4
-3 -2
-1
0 +1 +2 +3 +4
+5
Figura 7.3. – Polígono de freqüências da distribuição amostral de diferença de médias
Conforme ilustrado, vemos que a distribuição amostral de diferenças entre médias
tende para uma curva normal cuja média (média de diferenças entre médias) é zero.
Isso faz sentido, porque as diferenças positivas e negativas entre médias na
distribuição tendem a cancelar-se mutuamente (para cada valor negativo, tende a
haver um valor positivo a igual distância da média).
Como uma curva normal, a maioria das diferenças entre médias amostrais nessa
distribuição está próxima de zero - seu ponto mais central. Há relativamente poucas
diferenças entre médias que acusam valores extremos em qualquer direção a contar
da média dessas diferenças. Isso já era de esperar, porque a distribuição total de
diferenças entre médias é resultado de erro amostral e não de diferenças
populacionais reais entre mulheres e homens. Em outras palavras, se a diferença média
real entre as populações de mulheres e de homens é zero, esperamos também que a
média da distribuição de diferenças entre médias amostrais seja zero.
Teste de Hipóteses com a Distribuição da Diferença entre Médias
Em capítulos anteriores vimos como fazer afirmações probabilísticas sobre a
ocorrência tanto de escores brutos como de médias amostrais. No caso presente,
procuramos fazer essas afirmações sobre os escores de diferenças na distribuição
amostral de diferenças entre médias. Como já salientamos, essa distribuição amostral
toma a forma da curva normal e, assim, pode ser encarada como uma distribuição de
probabilidade. Podemos dizer que a probabilidade decresce à medida que nos
afastamos mais e mais da média das diferenças (zero). Mais especificamente,
conforme ilustrado na Figura 7.4, vemos que 68,26% das diferenças entre médias
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
situam-se a +1 σ x1 − x 2 e -1 σ x1 − x 2 a contar de zero. ( A notação
σ x −x
1
2
representa o
deesvio padrão da diferença entre as médias)
FIGURA 7.4. A distribuição amostral de diferenças entre médias como uma
distribuição de probabilidade.
Para determinar quão distante de uma diferença de zero está a diferença obtida
entre as médias. Ao fazermos isso, devemos primeiro transformar a diferença obtida
em unidades de desvio padrão,
σ x −x
1
Zc =
2
. Portanto, a estatística de teste é
( x1 − x 2 ) − 0
σ x −x
1
onde
σx
1 − x2
=
σ 12
n1
+
2
σ 22
n2
quando as variâncias populacionais forem conhecidas, usa-se a tabela Z.
Exemplo: Uma companhia distribuidora tem por hipótese que uma chamada
telefônica é mais eficiente que uma carta para acelerar s cobrança de contas
atrasadas. Esta companhia fez uma experiência usando duas amostras e obteve os
resultados da tabela abaixo. Analisando os resultados e sabendo-se que as variâncias
populacionais são 4,6 e 4,1 respectivamente no que se refere ao número de dias de
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
pagamento por carta e por chamada telefônica, dê uma sugestão a respeito da tomada
de decisão mais viável para a companhia, baseado nos resultados dos testes
elaborados via Excel que se encontram abaixo. Justifique o teste utilizado baseado
nas suposições que foram feitas. Adote α =5%.(Não esqueça de elaborar as hipóteses
estatísticas)
Método utilizado
Carta
Chamada
telefônica
10
7
Nº de dias até o pagamento
8
9
11 11
14
10
4
5
4
8
6
9
Quando as variâncias populacionais forem desconhecidas, usa-se a estimativa de
desvio padrão da diferença entre médias
t
c
(
Χ −Χ )
2
= 1
σˆ x − x
1
σˆ x − x
1
onde
2
2
2
⎛1 1⎞
+ ⎟⎟. σˆ
⎝ n1 n2 ⎠
= ⎜⎜
ou
σˆ x − x
1
2
, e a tabela t, ou seja,
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
( )
(
)
n −1 S2+ n −1 S2
2
1
2
2
σˆ = 1
n +n −2
1 2
com n1 + n2 − 2 gl .
Exemplo: Uma amostra de 100 lâmpadas da marca A acusou uma vida média de 1.190
horas, e desvio-padrão amostral de 90 horas. Uma amostra de 75 lâmpadas da marca B
acusou uma vida média de 1.230 horas e desvio-padrão amostral de 120 horas. Fixando
α=0,05, pode-se admitir que a vida média B é superior à vida média de A? Admita
populações normais.
Teste de Hipóteses para observações emparelhadas -Comparando Duas Medições da
Mesma Amostra
Até aqui discutimos as comparações entre duas amostras extraídas
independentemente (por exemplo, homens versus mulheres, negros versus brancos ou
liberais versus conservadores). Antes de deixarmos este tópico, devemos introduzir
uma variante final da comparação de duas médias, conhecida como planejamento
antes-depois ou painel: o caso de uma única amostra medida em pontos diferentes do
tempo (tempo 1 versus tempo 2). Por exemplo, um pesquisador pode procurar medir o
grau de hostilidade em uma única amostra de crianças, antes e depois de ! assistirem a
determinado programa de televisão. Da mesma maneira, podemos interessar-nos: em
medir diferenças de atitudes em relação a determinado candidato a um posto, antes e
depois de ser lançada uma campanha de propaganda.
Exemplo: Para testar o grau de amabilidade, entrevistamos uma amostra de 6
indivíduos em relação aos seus vizinhos, antes e após serem forçados a se mudar.
Nossa entrevista acusou os seguintes escores de amabilidade escores de 1 a 4, maior
escore, maior amabilidade).
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
Entrevistado
Antes da
Após a
mudança
(X1)
mudança
(X2)
2
1
3
3
1
4
-
1
2
1
1
2
1
-
Stephanie
Myron
Carol
Inez
Leon
David
ΣX1 = 14
ΣX2 = 8
Diferença
(D = XI-X2)
(Diferença)2
(D2)
1
-I
2
2
-1
3
1
1
4
4
1
9
-
ΣD=6
ΣD2 = 20
Se
D = escore bruto após a mudança subtraído do escore bruto antes da mudança
n = número de casos ou entrevistados na amostra
A média dos escores é
D=
∑D
D=
1
n
Sendo
SD = desvio padrão da distribuição de escores das diferenças antes-depois
sD =
sD =
∑D
2
− n.D 2
n −1
20 − 6.1
= 1,67
5
A estatística de teste é
t
c
=
D − µ
S
D
n
D
;
(n − 1 )
gl
Pontifícia Universidade Católica – PUCRS
Faculdade de Matemática – Departamento de Estatística
Profa. Rossana Fraga Benites
t
c
=
1− 0
= 1,47
1 , 67
6
olhando na tabela t com n-1gl temos 5gl e para alfa igual a 0,05, temos o valor de t
tabelado igual a 2,571.
Download

Teste de Hipóteses