•Teste
de Hipóteses 4
Prof. Miguel Angel Uribe Opazo
Introdução

Ao contrário do que ocorria nos problemas de
estimação, vamos agora supor que exista uma
hipótese a respeito de valores dos parâmetros
populacionais, a qual será considerada válida até
prova em contrário.

Pelo fato de se tratar de testes referentes aos
parâmetros populacionais, estes são ditos de testes
paramétricos.

Essa hipótese será testada com base em
resultados experimentais, sendo rejeitada ou não
rejeitada.
Conceitos Fundamentais

Define-se por H0 a hipótese existente,
chamada hipótese nula, a ser testada e por
H1 a hipótese alternativa.

Nos casos que serão examinados, H1 será a
hipótese complementar de H0.

O teste irá levar a não rejeitar ou rejeição de
H0, o que corresponde à negação ou
aceitação de H1.
Conceitos Fundamentais
Entretanto para manter a uniformidade,
enuncia-se o resultado final sempre em
termos da hipótese H0, ou seja, rejeitar ou
não rejeitar H0.
 Podem ocorrer situações em que a
hipótese nula H0 seja verdadeira e o teste
leve à rejeitar H0, o que consiste em num
erro, chamado erro tipo I.


Por outro lado, pode-se não rejeitar H0,
sendo ela falsa,
o que levaria a
cometer erro tipo II.

Em resumo, em um teste de hipótese
pode ocorrer dois tipos de erro, erro
tipo I, rejeitar H0, sendo H0 verdadeira e
erro tipo II, não rejeitar H0 sendo H0
falsa.

P[erro tipo I]=
P[rejeitar H0, sendo H0 verdadeira] = α
P[erro tipo II]=
P[não rejeitar H0, sendo H0 falsa] = β

A probabilidade do erro tipo I,
α é
denominada nível de significância do teste.

A probabilidade do erro tipo II, β está
associado ao Poder do teste (1-β) .
Possíveis resultados de um teste de hipóteses e
suas probabilidades condicionadas a realidade
Decisão
Aceitar H0
Rejeitar H0
Realidade
H0 verdadeira
Decisão correta
(1-  )
Erro tipo I
( )
H0 falsa
Erro tipo II
( )
Decisão correta
( 1- )
A faixa de valores da variável de teste
que leva à rejeição de H0 é denominada
Região Crítica ou Região de Rejeição
do Teste.
 A faixa restante, Região de Não
rejeição.
 Em nossos problemas de teste de
hipóteses,
serão
controlados
as
probabilidade do erro tipos I e II, ou
seja, o nível de significância do teste
() e o poder do teste (1- ).

Etapas Básicas em um Teste de
Hipótese
Em um teste de hipótese, inicia-se com
um valor suposto (hipotético) de um
parâmetro da população.
 Fixe qual é a hipótese H0 a ser testada e
qual é a hipótese alternativa H1.
 Fixar a probabilidade  de cometer erro
tipo I. Use este valor para construir a
Região Crítica - RC

Etapas Básicas em um Teste
de Hipótese
Depois de coletar uma amostra aleatória,
compara-se a estatística da amostra com
o parâmetro suposto.
 Então rejeita-se ou não o valor hipotético.
O valor hipotético é rejeitado somente se o
resultado da amostra for claramente
improvável de ocorrer.

Isto é, se o valor da estatística observada na
amostra não pertencer a região crítica, não
rejeito H0, caso contrário, rejeita-se H0 ao nível
de % de significância.
PROCURE SEMPRE, QUE FIZER TESTE DE
HIPÓTESE,
DISTINGUIR
BEM
ESTAS
ESTAPAS.
Teste de Hipótese da Média
Objetivo: avaliar afirmação feita respeito
da média populacional.
 Considerar dois casos:
A) Desvio Padrão Populacional Conhecido; e
B) Desvio Padrão Populacional
Desconhecido.

Procedimentos Geral
i)
Dados X , 0 , n, ,  ou S
ii)
Sejam as hipóteses:
H0 :  = 0 (hipótese nula)
Versus
a) H1 :   0
ou
b) H1 :  > 0 ou
c) H1 :
 < 0
(hipótese alternativa) .
iii) Cálculos:

Se  é conhecida, a estatística do teste é:
X  0
Z =


n
Se  é desconhecida, a estatística do teste é:
X  0
T=
S
n
iii) Regra de Decisão:
1)


Para o teste bicaudal
H0:  = 0
versus
H1:   0
Considerando  é conhecida, rejeita-se H0 ,
se
| Z | > z/2
ao nível de % de
significância, onde z/2, é o valor da tabela
normal padrão bicaudal ao nível de % de
significância.
Considerando  é desconhecido, rejeita-se H0,
se | T | > t/2 ao nível de % de significância,
onde t/2, é o valor da tabela t-Student bicaudal
com n-1 graus de liberdade e ao nível de % de
significância.
2) Para o teste unicaudal a direita
H0:  <= 0
versus
H1:  > 0
 Considerando  é conhecida, rejeita-se H0,
se Z > z ao nível de % de significância, onde z
é o valor da tabela normal padrão unicaudal ao nível
de % de significância.
 Considerando  é desconhecido, rejeita-se H0 ,
se T > t ao nível de % de significância, onde t
é o valor da tabela t-Student unicaudal com n-1
graus de liberdade
e ao nível de % de
significância.
3) Para o teste unicaudais a direita e esquerda


H0:  = > 0
versus
H1:  < 0
Considerando  é conhecido, rejeita-se H0,
se Z < - z ao nível de % de significância, onde z
é o valor da tabela normal padrão unicaudal ao nível de
% de significância.
Considerando  é desconhecido, rejeita-se H0,
se T < - t ao nível de % de significância, onde t
é o valor da tabela t-Student unicaudal com n-1 graus
de liberdade e ao nível de % de significância.
Nível de significância para testes
bicaudal e unicaudal
Nível de confiança
(1-  )%
99,90
99,00
95,00
90,00
Nível de significância Valor bicaudal Valor Unicaidal
(  )%
0,1
1,00
5,00
10,00
z/2
3,29
2,58
1,96
1,65
z
2,33
1,65
1,28
Exemplo

Os registros dos últimos anos de um colégio
atestam para os calouros admitidos que a nota
média 115 pontos (teste vocacional). Para testar
a hipótese de que a média de uma nova turma é
a mesma, tirou-se, ao acaso, uma amostra de
50 notas, obtendo-se uma média 118 e um
desvio padrão 20. Admitir que  = 5%, para
efetuar o teste.
H0:  = 115 (hipótese nula, com 0 =115)
versus
H1:   115 (hipótese alternativa)
Como  é desconhecida, a estatística do teste é:
T=
X  0
S
n
=
118 115
= 1,06,
20 50
Para = 5% /2 o valor t/2 da tabela t-Student bicaudal com ( n– 1) = 49 graus de liberdade
é t/2 =.2,093.
Como |T| = 1,06 < 2,093, concluímos que não rejeitamos H 0 , isto é, ao nível de 5% de
significância concluímos que a nova turma tem a mesma nota média no teste vocacional que
os do registro dos últimos anos.
Teste de Hipótese para Proporção
Quando a finalidade da amostragem é
julgar a validade de uma alegação de uma
proporção (p), é apropriado um teste de
uma amostra.
 O procedimento é análogo ao das médias,
inclusive, a preocupação de se tratar de
uma distribuição normal padronizada para
valores críticos.

Procedimento Geral
Procedimento Geral:
i.
i) Dados x, n, p0 , 
ii.
ii) Hipóteses:
a) Teste bicaudal:
iii.
(hipótese nula)
versus
iv.
H1: p  p0 ( hipótese alternativa)
v.
Teste unicaudal:
vi.
H0: p = p0
vii.
viii.
a) Teste unicaudal:
H0 : p <= p0
versus
H1: p > p0
H0 : p = > p0
ix.
versus
x.
H1: p < p0
ii)
Cálculos:
pˆ 
x
n
q0 = 1 – p0 ;
;
0=
p0 q0
n
A estatística do teste ( a), (b) ou (c) é:
pˆ  p 0
Z=
0
iv) Regra de Decisão:
a) Para o teste bicaudal H0 : p = p0 versus H1 : p  p0
Rejeita-se H0 se | Z| > z/2 ao nível de % de significância.
b) Para o teste unicaudal H0 : p <= p0 versus
H1 : p > p0
Rejeita-se H0 se Z > z ao nível de % de significância.
c) Para o teste unicaudal H0 : p = > p0 versus
H1 : p < p0
Rejeita-se H0 se Z < - z ao nível de % de significância
Exemplo

Um certo analgésico adotado em determinado hospital é
eficaz em 70% dos casos. Um grupo de médicos
chineses em visita a esse hospital afirma que a
utilização de acupuntura produz melhores resultados. A
direção do hospital resolve testar o método alternativo
em 80 pacientes, com a finalidade de adotá-lo em
definitivo se ele apresentar eficiência satisfatória numa
proporção de casos maior que do anestésico atual. Seja
85% dos casos que o método de acupuntura apresenta
a eficiência satisfatória quando aplicado a um paciente.
Que decisão tomar ao nível de 5% de significância?.
A hipótese de interesse é:
H0: p = 0,70 (hipótese nula)
versus
H1: p > 0,70 (hipótese alternativa)
Neste problema
p0 = 0,70 ;
q0 = 1 –0,70 = 0,30 ; n=80;
0=
0,70 * 0,30
=0,051 e pˆ  0,85
80
A estatística do teste é:
Z=
ˆ  p0
p
0
0,85  0,70
=
= 2,94
0,051
Decisão:
O valor de z unicaudal ao nível de 5% de significância é z  =1,65.
Como Z > 1,65 concluímos que se rejeita H0 ao nível de 5% de significância, isto é, o
método de acupuntura produz melhores resultados que o método tradicional ao nível de 5%
de significância.
Testes Não -Paramétricos

O método não-paramétrico é um método
estatístico que não formula a hipótese
sobre formas específicas de distribuição e,
assim, não cogita de estimar valores
desconhecidos de parâmetros.
Teste Qui-Quadrado
Tabela de Contingência
 Teste de Aderência
 Teste para Adequação de Ajuste

Análise Bidimensional de Variáveis Qualitativas
A técnica mais simples e mais flexível para descrever o grau
de associação entre duas variáveis é a análise por
classificação cruzada.
Exemplo 1.7
Cento e vinte e cinco proprietários de certa
marca de automóvel foram entrevistados acerca do
desempenho e do consumo de seus carros. O resultado da
pesquisa de opinião é resumido na Tabela 1.9.
Devemos considerar que, no consenso geral, o
desempenho e o consumo guardam relação entre sem?
 Para responder esta pergunta é necessário utilizar o
Teste Qui-quadrado de Independência, considerando as
hipóteses:
H0: o consumo e o desempenho são independentes
ou
não existe associação.(hipótese nula)
versus
H1: o consumo e o desempenho não são independentes ou
existe associação. (hipótese alternativa).
 Ao um nível de 5% de siginificância. (probabilidade de
erro tipo I: rejeitar H0 quando ela é verdadeira)

A estatística do teste é da forma:
i.
Regra de Decisão:
ii.
Se  2 >  2 TAB , rejeito a hipótese H0 ao nível de 5%, onde  2 TAB é o valor da tabela
qui-quadrado com (r-1)(c-1) graus de liberdade (Anexo 2)
iii. Em nosso exemplo temos  2 = 3,7915 e  2 TAB = 5,99 o qual implica que não existe
de associação entre o consumo e o desempenho. Outra regra é a seguinte se o nível
descritivo p-valor < 0,05 rejeito a hipótese H0 ao nível de 5%.
iv.
Tabela Qui -quadrado
Teste de Aderência

Devemos localizar neste teste os
problemas em que se deseja verificar se a
prática esta de acordo com a teoria, ou
seja, problemas em que se deseja
comparar a freqüência esperada (teoria)
com a freqüência observada (prática).
Exemplo
A tabela abaixo mostra o número de vitórias de cavalos que correram em 8 raias diferentes
de um moderno hipódromo. Sabe-se que a numeração das raias são feitas em sentido
crescente da parte interna para a externa da pista circular. Um determinado turista acha que
a raia em que o cavalo corre influência o resultado. Verifique se o mesmo tem razão.
Raias
Oi
1
29
2
19
3
18
4
25
5
17
6
10
7
15
8
11
Total
144
A hipótese de nulidade dá a freqüência ou
proporção de indivíduos ou objetos, que
se enquadram em cada uma das k
categorias na população presumida.
 Isto é, a partir da hipótese de nulidade,
podemos
deduzir
as
freqüências
esperadas.
 A técnica ² testa se as freqüências
observadas
estão
suficientemente
próximas das esperadas para justificar
sua ocorrência sob H0.

A hipótese de nulidade pode ser testada por:
2cal 
k

i 1
onde
Oi
 Ei ²
 (2k 1)
Ei
Oi = n° de casos observados classificados na categoria i
Ei = n° de casos esperados classificados na categoria i, sob H 0
a) Quando se espera que a freqüência de cada categoria seja a mesma, então Ei 
i = 1, 2, ..., k.
n
,
k
b) Quando se espera que cada freqüência seja diferente, para pelo menos uma
(r )(n)
categoria, na razão de r1, r2, ..., rk tal que r1 + r2 + ... + rk = S, então Ei  i
,
S
onde n é o tamanho da amostra e k, o n° de categorias.



Se há concordância entre os valores observados e os
valores esperados, as diferenças (Oi - Ei) serão
pequenas e, conseqüentemente, ²cal será também
pequeno.
Se as divergências forem grandes, o valor ²cal também
será grande.
De modo intuitivo, quanto maior for o valor do ²cal,
maior será a probabilidade de rejeitar H0, ou seja, das
freqüências observadas não serem provenientes da
população em que se baseou a hipótese de nulidade.
As hipóteses são do tipo:
H0: f1 = f2 = ... = fk ou
H0: f1 : f2 : ... = fk
(não existe diferença entre as freqüências observadas e
as esperadas)
H1: existe diferença entre as freqüências observadas e as
esperadas

2cal
k


i 1
Oi  Ei ²
Ei
segue uma distribuição (2k 1) . Daí a hipótese H0 é testada em comparação
ao ²cal com ²(k – 1, ) onde  é o nível de significância. Como estaremos sempre comparando
os dados de uma amostra com uma população presumida, usa-se sempre uma teste
unilateral à direita.
Os valores do ²(k – 1, ) é observado na tabela da Distribuição Qui-quadrado.
Conclusão:
Rejeitamos H0, se ²cal  ²(k – 1, ),
ou se a probabilidade associada à
ocorrência, sob H0, do valor obtido do ²cal
com (k - 1) g.l. não superar o valor de a,
ou seja, P[²k - 1  ²cal ] <  (for
significativo )
Teste de Adequação do Ajuste



Quando usamos a estatística ² para comprovar a
concordância entre valores esperados e observados
para certo fenômeno, estaremos realizando um teste de
adequação do ajustamento.
Quando usamos o Teste Qui-Quadrado para colocar à
prova hipóteses referentes à forma da distribuição da
população, como a Normal, Binomial, Poisson, etc,
estaremos efetuando um "Teste de Aderência".
Nesses testes, admitimos que a distribuição da variável
em estudo seja descrita por determinado modelo teórico
de probabilidade e verificamos o grau de aderência dos
dados amostrais ao modelo.
Essa forma de testar a aderência foi desenvolvida por Karl Pearson e baseia-se na
estatística
2cal
k


i 1
Oi  Ei ²
Ei
que tem distribuição qui-quadrado com (k - r - 1) graus de
liberdade, sendo k, o n° de parcelas somadas e r, o n° de parâmetros do modelo estimados
independentemente a partir da amostra. O cálculo das freqüências esperadas é feito através
da expressão Ei = npi, onde pi é a probabilidade, segundo o modelo, de se obter um valor da
variável na classe considerada, e n, o tamanho da amostra.
Verificar se os dados a seguir se ajustam a uma distribuição de Poisson
Número de acidentes
Número de dias
0
25
1
19
2
10
3
9
4
4
5
3
Download

Etapas Básicas em um Teste de Hipótese