Janete Pereira Amador
1
1 Introdução
Os métodos utilizados para realização de inferências a respeito dos parâmetros
pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro, através da
estimação de parâmetros ou pode-se tomar decisões relativas ao mesmo, através de um teste
de hipótese paramétrico (teste de significância).
O teste de significância ou teste de hipóteses paramétrico consiste em verificar se a
diferença entre um valor alegado de um parâmetro populacional e o valor de uma estatística
amostral pode ser razoavelmente atribuído a variabilidade amostral ou se a discrepância é
demasiadamente grande para ser encarada assim.
A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos
parâmetros populacionais.
2 Hipótese Estatística
Uma hipótese estatística é uma afirmação que pode ou não ser verdadeira sobre o valor
de um parâmetro ou sobre a distribuição de probabilidade de uma variável aleatória. Em
estatística existem dois tipos de hipótese estatística.
A Hipótese nula “H0” é a hipótese conservadora sempre pode ser expressa por uma
igualdade a zero. Por exemplo: H 0 :    0 ou H 0 :    0  0 .
A Hipótese alternativa “H1” é qualquer hipótese que diferi de uma dada hipótese nula é a
Hipótese experimental. Por exemplo: H 1 :    0 ou H 1 :    0 ou H 1 :    0 .
A Hipótese nula “H0” é uma afirmação que diz que o parâmetro populacional é tal
como especificado (isto é, a afirmação é verdadeira).
A Hipótese alternativa “H1” é uma afirmação que oferece uma alternativa à alegação
(Isto é, o parâmetro é maior ou menor que o valor alegado)
As hipóteses “H0” e “H1” são mutuamente excludentes, aceitando-se uma hipótese como
verdadeira, a outra, automaticamente, será rejeitada. Portanto deve-se tomar cuidado para
não ser cometido erros com relação aceitação e rejeição de “H0” e “H1”.
3 Tipos de Erro
Quando se realiza um teste de hipótese, pode-se cometer dois tipos de erro:
 Erro tipo I: consiste em rejeitar “H0” quando ela é verdadeira. Pode ser
limitado pela escolha do nível de significância  que probabilidade de
rejeitar “H0” quando essa for verdadeira.
 Erro tipo II: Consiste em aceitar “H0”, quando ela é falsa.
O quadro a seguir mostra as possibilidades de se cometer os erros tipo I e tipo II.
Realidade
Ho Verdadeira
Ho Falsa
Aceitar Ho Decisão correta (1 -  )
Erro Tipo II (  )
Decisão
Rejeitar Ho
Erro Tipo I (  )
Decisão Correta (1 -  )/Eficácia
Janete Pereira Amador
2
O nível de significância do  teste (probabilidade de rejeitar “H0” quando essa for
verdadeira) é fixada antes da extração das amostras. Os valores mais comuns para  são:
0.01, 0.05 e 0.10 ou 1%, 5% e 10%. Se por exemplo, ao delinear-se um teste, escolhe-se 
= 0.05 ou 5%, significa que em cerca de 5% rejeitar-se-ia erroneamente H0.
O coeficiente de confiança, indicado por (1 -  ), é a probabilidade de que a hipótese
nula H0 não seja rejeitada quando de fato for verdadeira e não deve ser rejeitada. Em
termos de metodologia do teste de hipóteses, esse coeficiente representa a probabilidade de
se concluir que o determinado valor do parâmetro que está sendo testado para hipótese nula
seja plausível.
O risco  a probabilidade de se cometer um erro Tipo II identificado por  é
diferente do erro Tipo I que pode ser controlado pela seleção de  . A probabilidade de se
cometer o erro Tipo II depende da diferença entre o valor da hipótese e os verdadeiros
parâmetros da população.
A eficácia de um teste estatístico denotada por 1 -  , é a probabilidade de se rejeitar a
hipótese nula quando ela é de fato falsa e deveria ser rejeitada.
A probabilidade “p” é a área, abaixo de uma curva de probabilidade, compreendida
entre a estatística calculada e o infinito mais próximo, no caso do teste unilateral. Se o teste
for bilateral, considera-se este valor multiplicado por dois. Se p   , rejeita-se H0 (quanto
menor o valor de “p” mais significativo é o teste), e se p   , aceita-se H0
3.1 Controle dos erros Tipo I e Tipo II
Para controlar  e  valem as seguintes considerações práticas:
 Para  fixo, um aumento do tamanho “n” da amostra ocasiona uma redução de  ; isto
é, uma amostra maior reduz a chance de cometermos o erro de não rejeitar a hipótese
nula quando ela for falsa.
 Para um tamanho “n”, fixo, de amostra, uma diminuição de  acarreta um aumento de
 ; reciprocamente, um aumento de  acarreta uma diminuição de  .
 Para reduzir  e  , devemos aumentar o tamanho da amostra.
4 Teste de Hipóteses Unilateral e Bilaterais
Dependendo da hipótese alternativa, os testes são classificados como unilaterais e
bilaterais.
4.1 Teste de hipóteses bilateral
Os testes bilaterais se usam sempre que há divergência crítica em ambas as direções,
tal como ocorreria na fabricação de roupas, onde camisas muito grandes ou muito
pequenas não correspondem à determinação do padrão. Outro exemplo é o caso em que
peças devem ajustar-se uma a outra, como o parafuso e porca. Uma variação excessiva
ocasionará seja um ajuste muito frouxo, de modo que as peças não permanecerão unidas,
ou um ajuste excessivo impedindo a conjugação das peças. Assim por exemplo:
 H 0 :    0 contra H 1 :    0 é um teste bilateral, esquematicamente:
Janete Pereira Amador
3
Valor
tabelado
também
chamado de valor crítico, separa
a região de aceitação H0 (RA H0)
da região de rejeição (RR H0).
4.2 Teste de hipóteses unilateral a direita
O teste unilateral a direita é útil para testar se determinado padrão máximo não foi
excedido Como exemplo seria: teor máximo de gordura permitida em determinado tipo de
leite, radiação emitida por usinas nucleares, número de passas defeituosas de uma remessa
de certa mercadoria, quantidade de poluição atmosférica emitida por uma determinada
fabrica. Assim por exemplo:
H 0 :    0 contra , H 1 :    0 (  0 é o valor suposto para o parâmetro) é um teste
unilateral a direita, esquematicamente:
4.2 Teste de hipóteses unilateral a esquerda
O teste unilateral a esquerda é útil para verificar se determinado padrão mínimo foi
atingido. Como exemplo seria: conteúdo mínimo de gordura no leite, peso líquido de
pacotes de determinado produto, vida de um produto tal qual como especificado no
certificado de garantia. Assim por exemplo:
 H 0 :    0 contra H 1 :    0
é um teste unilateral a esquerda,
esquematicamente:
5 Procedimentos para Realização de um Teste de Hipóteses
Para realizar um teste de hipótese sugere-se seguir as seguintes etapas:
1) Formular as hipóteses;
Janete Pereira Amador
2)
3)
4)
5)
6)
4
Identificara a estatística do teste;
Determinar o nível de significância;
Calcular a estatística utilizando os valores amostrais;
Comparar as estatística calculada com a estatística tabelada;
Concluir.
5.1 Teste de hipóteses para média 
O objetivo do teste de significância para médias é avaliar afirmações feitas a
respeito de médias populacionais. Há basicamente três tipos de afirmação que se podem
fazer a cerca das médias populacionais e cada tipo requer um tipo diferente de avaliação.
Uma afirmação pode dizer respeito a média de uma única população; a avaliação envolve
então um teste de uma amostra. Ou pode-se afirmar que a média de duas populações são
iguais; tem-se então um teste de duas amostras. Finalmente pode-se afirmar que a as
médias de mais de duas populações são iguais, o que envolve um teste de K amostras
(Análise de Variância) que será visto em um capítulo aparte.
5.1.1. Teste de significância de uma amostra para uma média  amostral contra um
valor paramétrico
Caso I - Variância populacional conhecida  2 e/ou n > 30
De acordo com o teorema do limite central, se obtemos amostras grandes (n > 30)
(de qualquer população com qualquer distribuição), a distribuição das médias pode ser
aproximada por uma distribuição normal. Sendo assim, distribuição das médias amostrais
será aproximadamente normal com media  e desvio padrão 
n.
Em um teste de hipóteses, o valor de  corresponde a hipótese nula, e o valor do
desvio padrão populacional deve ser conhecido. Se  é desconhecido e as amostras são
grandes, podemos usar o desvio padrão amostral “S” em substituição σ , porque grandes
amostras aleatórias tendem a representar a população.
Assim temos:
 Retira-se uma amostra de tamanho n e calcula-se X .
X  0
 Calcula-se o valor da estatística Z c 

n
 Sob a hipótese nula, tem-se que Zc possui uma distribuição normal padrão.Portanto,
Rejeita-se H0 se Z c  Z  2 (isto é, se Z <  Z  2 ou Z  Z  2 )
Aceita-se H0 se Z c  Z  2 (isto é,  Z  2  Z c  2 ), onde  é o nível de significância do
teste.
Ex1: Uma máquina automática para encher pacotes de café enche-os segundo uma
distribuição normal, com média  e variância sempre igual a 400g 2. A máquina foi
regulada para  = 500g. Colhe-se, periodicamente uma amostra de 16 pacotes para
verificar se a produção está sob controle, isto é, se  = 500g ou não. Se uma dessas
amostras apresentasse uma média amostral de X = 492 g, você pararia ou não a produção
para regular máquina, considerando o nível de significância de 1%?
Solução
Janete Pereira Amador
5
  0,01 2  0,005 = 2,58
H 0 :   500
H 1 :   500
492  500
Zc 
 1,6
400
16
Conclusão: Aceita-se a hipótese nula, ou seja, não existe evidências de que a
máquina esta embalando pacotes de café com uma média diferente de 500g, sendo assim a
máquina não necessita ser parada.
Ex2: A tensão de ruptura dos cabos produzidos por um fabricante apresenta média de 1800
kg e desvio padrão de 100 kg. Mediante nova técnica no processo de fabricação, proclamase que a tensão de ruptura pode ter aumentado. Para testar esta declaração, ensaiou-se uma
amostra de 50 cabos, tendo-se determinado a tensão média de ruptura de 1850 kg. Pode-se
confirmar a declaração ao nível de significância de 0,01?
Solução
  0,01 2  0,005 = 2,33
H 0 :   1800
H 1 :   1800
1850  1800
50
Zc 

 3,53
100
14,14
50
Ao nível de significância de 0,01, a regra de decisão é:
Rejeita-se H0 se Z c  Z 0, 01 = 2,33
Aceita-se H0 se Z c  Z 0,01 < 2,33
Conclusão: Rejeita-se H0, e confirma a declaração de que a tenção de ruptura foi
aumentada.
Caso II - Variância populacional desconhecida  2 e/ou n  30
Neste caso, a população original deve ter distribuição essencialmente normal, pois
de acordo com o teorema do limite central.”Se a população sob amostragem tem
distribuição normal, a distribuição das médias amostrais também será normal para todos os
tamanhos de amostras”.
Desta forma teremos que usar a distribuição t de Student utilizada para trabalhar
com pequenas amostras, quando a variância populacional é desconhecida.
Condições para usar a distribuição t de Student
 A amostra é pequena n  30
2
  é desconhecido
 A população original tem distribuição essencialmente normal.
Desta forma para um teste de hipótese para medis têm-se:
Janete Pereira Amador
6
.
Sob a hipótese nula, tem-se que t possui uma distribuição t de Student com n-1
graus de liberdade. Portanto,
X  0
Calcula-se a estatística: t c 
S
n
Se o teste tiver uma hipótese alternativa unilateral ( H 1 :    0 ou H 1 :    ) o
teste deverá rejeitar unilateralmente ( t  t ,( n1) ou t  t ,( n 1) )
Ex: Um fabricante afirma que seus cigarros contém não mais que 30 mg de nicotina. Uma
amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg. Ao nível de
5%, os dados refutam ou não a afirmação do fabricante?
Solução:
Neste caso, as hipóteses são:
H 0 :   30
H 1 :   30
Como não se conhece a variância populacional, e esta foi estimada pela amostra, devemos
X  0
utilizar a estatística t de Student: t c 
S
n
A regra de decisão é dada por:
Rejeita-se H 0 se t  t ,( n 1  t0,05, 24  1,711
Aceita-se H 0 se t  1,711
31,5  30 1,5
tc 

 2,5
3
0,6
25
Conclusão: Rejeita-se H0, ou seja, há evidências de que os cigarros contenham mais de
30g de nicotina.
5.1.2 Teste de significância para a diferença entre duas médias populacionais
independentes.
Caso I – Amostras grandes n >30 e/ou  12 e  22 (conhecidas)
Os testes de duas amostras são usados para decidir se as médias de duas populações
são iguais. Para a realização do teste exige que as duas amostras sejam independentes, uma
de cada população. Duas amostras são independentes se a amostra extraída de uma das
populações não tem qualquer relação com a amostra extraída da outra.
Esses testes são freqüentemente usados para comparar dois métodos de ensino, duas
marcas, duas cidades, dois distritos escolares, e outros casos análogos.
Ao testar as hipóteses para diferença entre duas médias supõe-se que:
Janete Pereira Amador
7
 As duas amostras são independentes
 O tamanho das duas amostras são grandes n1 > 30 e n2 > 30 e/ou as variâncias são
conhecidas.
De acordo com o teorema do limite central quando o tamanho da amostra for maior
do que 30 a distribuição normal constitui aproximação razoável da distribuição das médias
amostrais.Por raciocínio análogo os valores de x1  x 2 também tendem para uma
distribuição normal com media 1   2 . Quando ambas as amostras são grandes, a
propriedade seguinte das variâncias leva-nos a concluir que os valores de x1  x2 tem um
 12
n1
desvio padrão dado por:

n

2
2
.
2
A variância da diferença entre duas variáveis aleatórias independentes é igual a soma das
variâncias destas variáveis.
Isto é, a variância dos valores amostrais x1  x 2 tende a ser igual a  x21   x22
desde que x1 e x2 sejam independentes. Assim,  2x
1  x2
Como
Z 
Z
estatistica
é
um
escore
amostral  média
padronizado
populaciol
 12
2
 2
n1
n2
corresponde
  x21   x22 
que
a:
desta forma vem;
desviopadrão da estatística amostral
Z 
x
1
 x2   1   2 
 12
2
 2
n1
n2
Quanto às hipóteses temos que:
A hipótese nula pode ser de que as duas populações tem médias iguais.
H 0 : 1   2
Enquanto que as alternativas podem ser:
H 1 : 1   2 ;
H 1 : 1   2 e H1 : 1   2 note que:
H 1 : 1   2 é equivalente a H1 : 1   2
Ex: Um fabricante de pneus faz dois tipos. Para o tipo A,  = 2500 milhas, e para o tipo B,
 = 3000 milhas. Um táxi testou 50 pneus do tipo A e 40 do tipo B, obtendo 24.000 milhas
e 2.600 milha de duração média dos respectivos tipos. Adotando-se um risco  =4%, testar
a hipótese de que a vida média dos dois tipos é a mesma.
Solução:
H 0 : 1  2  0  1  2
H1 : 1  2
  0,04 2  0,02
Aceita-se-se H 0 se  Z 
2
 Z  Z
2
Rejeita-se H 0 se Z   Z  ou Z   Z 
2
Z = 2,05
2
2
Janete Pereira Amador
8
24.000  26.000
 2000


2500 3000
353,60  474,68

50
40
Z c  2,41
Conclusão: Rejeita-se H0, ou seja, existe diferença em relação a vida média do dois tipos
de pneus.
Zc 
5.1.3. Teste de significância para a diferença entre duas médias de populações
dependentemente relacionadas
Os resultados de duas amostras constituem dados emparelhados ou pareados
quando estão relacionados dois a dois segundo algum critério que introduz uma influência
marcante entre os diversos pares, que supõe-se, porém influir igualmente sobre os valores
de cada par. Sendo assim, como os dados das duas amostras estão emparelhados, tem
sentido calcular a diferença di correspondente a cada par de valores, reduzindo assim os
dados a uma única amostra n de diferenças. Desta forma testa-se a hipótese de que a
diferença entre as médias das duas populações seja igual a um certo valor Δ equivale
atestar a hipnotese de que a media de todas as diferenças (referente as populações) seja
igual a Δ, o que decorre das propriedades da média. Ou seja, testa-se simplesmente a
hipótese H 0 :  d  Δ contra uma hipótese alternativa H 1 que poderá corresponder a um
teste unilateral ou bilateral conforme seja o interesse.
Ao tomar as diferenças d i, reduzimos o problema ao teste de uma única média
recaindo no item acaba recaindo no item 5.1.1 – Caso II. Logo, a expressão vista neste
item, pode ser aplicada à amostra das diferenças, realizando-se teste simplesmente através
da comparação t-Student com o valor crítico obtido em função de  com n-1 graus de
liberdade.
As notações para o teste de hipóteses para duas amostras dependentes
correspondem;
 d  média das diferenças d para população de dados emparelhados.
d = valor médio das diferenças di (x-y) para os dados amostrais emparelhados é dado por
 di .
d 
n
S d  desvio padrão das diferenças d i para dados amostrais emparelhados
 d
 
2
d
2
i
i
n
.
n 1
n= números de pares de dados.
Sd 
d  d
Sd
n
Ex: Dez cobaias adultas foram submetidas ao tratamento com certa ração durante uma
semana. Os animais foram identificados sendo mantidos em gaiolas individuais. Os pesos,
em gramas, anotados no inicio e no final do experimento, designados respectivamente, por
x e y foram anotados, sendo estes:
1
2
3
4
5
6
7
8
9
10
Cobaia
635 704 662 560 603 745 698 575 633 669
xi (peso inicial)
Sendo assim, a equação para o teste é da por t c 
Janete Pereira Amador
9
640 712 681 558 610 740 707 585 635 682
yi(peso final)
Testar a hipótese a 1% de que a ração não contribui para o aumento de peso dos animais
H0, contra a hipótese alternativa H1 o peso dos animais foi afetado pela ração (o peso inicial
deve ser menor que o final).
Solução:
H 0 : d  0
H1 :  d  0
t 9;1% = 2,821
Cobaia xi (peso inicial)
1
2
3
4
5
6
7
8
9
10
Total
857 
Sd 
 65
10
9
yi(peso final)
di
d i2
640
712
681
558
610
740
707
585
635
682
-5
-8
-19
2
-7
5
-9
-10
-2
-12
-65
25
64
361
4
49
25
81
100
4
144
857
635
704
662
560
603
745
698
575
633
670
2

48,27  6,94
 65
 6,5
10
 6,5
 6,6


 2,96
6,94
2,34
10
d 
tc
Conclusão: Rejeita-se H0 , ou seja, com 99% de confiança conclui-se que o uso da ração
contribui para o aumento dos pesos dos animais.
5.2 Teste de Hipótese para proporção
Os testes para proporções são adequados quando os dados sob análise consistem em
contagens ou freqüências de itens em duas ou mais classes. A finalidade de tais testes é
avaliar afirmações sobre a proporção ou percentagem de uma população. Os testes se
baseiam na premissa de que uma proporção amostral, isto é, x ocorrências em n
observações, ou x/n, será igual a verdadeira proporção populacional. Os testes focalizam
geralmente as diferenças entre um número esperado de ocorrências (supondo-se verdadeira
uma afirmação) e o número efetivamente observado. A diferença é então comparada com a
variabilidade prescrita por uma distribuição amostral baseada na hipótese de que H0 é
realmente verdadeira.
Em muitos aspectos, os testes para proporção se assemelham grandemente aos testes
para médias; apenas, nos testes para proporções, os dados amostrais se apresentam e
termos de contagens, ao invés de medidas. Por exemplo, os testes tanto para médias como
para proporções podem ser usados para avaliar alegações sobre:
Janete Pereira Amador
10



Um parâmetro de uma única população (teste de uma amostra).
Igualdade de parâmetros de duas amostras (teste de duas amostras ).
Igualdade de parâmetros de mais de duas amostras (teste de k amostras)
Além disso, para grandes amostras, a distribuição amostral apropriada para testes de
proporções de uma e duas amostras é aproximadamente normal, tal como no caso de
testes para médias de uma e duas amostras.
5.2.1 Teste de significância de uma amostra para a proporção 
Seja  a proporção dos elementos de uma população que possuem uma
determinada característica. Por exemplo,  é igual a proporção ou percentagem dos
habitantes, de uma determinada localidade, que possuem automóvel. Se quisermos testar a
hipótese de que essa proporção é igual a determinado valor, contra a alternativa dessa
proporção ser maior de que o valor especificado, lança-se as hipóteses:
H0:  =  0
Contra uma das hipóteses alternativas:
H1 :  >  0
H1 :    0
H1 :    0
Um bom estimador do parâmetro  é a proporção amostral P, que para grandes
amostras segue uma distribuição aproximadamente normal com média  e a variância
 (1   )
 (1  ) 
ou seja, P ~ N ,
.
n
n 

Portanto pode-se usar a variável normal padronizada.
P 
~ N (0,1)
Z 
sendo:
 (1   )
n
número de sucessos na amostra
x
P=
=
n
tamanho da amostra
  proporção de sucesso a partir da hipótese nula
Para proceder ao teste de hipóteses, como nos casos anteriores, o valor de Zc.
calculado deve ser comparado com o de Z  dado em função de  , o nível de significância
do teste.
“Ex: Um industrial deseja certificar-se de que a fração de mercado que prefere seu produto
ao de seu concorrente é superior a 70%. Para tanto colheu uma amostra aleatória de 165
opiniões, das quais 122 lhe foram favoráveis. Pode o industrial ficar satisfeito com esse
resultado, adotado o nível de significância de 5%?”
Solução:
H0 :  = 70% = 0.7
H1 :  > 0.7
x 122
P= =
 0,739
n 165
Janete Pereira Amador
Z 
P 

11
0,739  0,7

 (1   )
0,7(1  0,7 )
n
165
  5%  z  165
. Teste unilateral
0,039
 0,50
0,0778
Conclusão: Não há evidência, ao nível de 5%, de que a proporção seja superior a 70%.
5.2.2 Teste de significância para a diferença entre duas poporções populacionais
independentes.
Sejam P1 e P2 as proporções obtidas em duas amostras de tamanho n1 e n2 . Se
quisermos testar a hipótese de que as proporções  1 1 e  2 das proporções das quais foram
retiradas as amostras são iguais, formula-se as hipóteses de acordo com o tipo de deste que
poderá ser:
Teste bicaudal
Teste unicaudal a direita
Teste unicaudal a esquerda
H0 : 1   2
H 0 : 1   2
H0 : 1   2
H1 :  1   2
H1 :  1   2
H1 :  1   2
Para realizar o teste usa-se a variável padronizada:
( P1  P2 )  ( 1   2 )
Z 
, que para grandes amostras segue uma
 1 (1   )
 2 (1   2 )

n1
n2
distribuição aproximadamente normal com média zero e variância 1.
Comparando-se o valor calculado Z (Zcalc) com o valor crítico, obtido na tabela da
distribuição normal padronizada, a um nível dado de significância  , decide-se pela
rejeição ou não de H0.
Deve-se observar que por H0:  1 -  2 = 0 e assim caso esses parâmetros sejam
desconhecidos, pode-se substituí-los pelos valores estimados P1 e P2 (são os estimadores)
de  na população) no cálculo de Z. Assim:
p1  p 2
x
x
Zc 
sendo : P1  1
e
P1  2
n1
n2
p1 (1  p1 )
p (1  p 2 )
 2
n1
n2
Ex: Um empresário deseja saber se o percentual de satisfação de seus clientes em relação a
dois produtos oferecidos por sua empresa são similares. Para isso entrevistou 150 pessoas,
das quais 80 disseram estar satisfeitas com o produto A e 100 com o produto B. Use =
5% e conclua a respeito.
Solução:
Janete Pereira Amador
12
H0 : 1   2
H1 :  1   2

  0,05 
 0,025 =1,96 teste bicaudal
2
80
PA 
 0,533
150
100
PB 
 0,666
150
Zc 
0,533  0,666

 0,133

 0,133
 1,821
0,0730
0,533(1  0,533) 0,66(1  0,666)
0,00311  0,00222

80
100
Conclusão: Aceita-se H0, ou seja, não existe diferença entre o percentual e satisfação dos
clientes em relação aos produtos A e B.