Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação
UNIVERSIDADE ESTADUAL DE GOIÁS
10 a 12 de novembro de 2010
Estudo de Simulação do Erro Tipo I Cometido em um
Teste de Hipóteses para a Média com Variância Desconhecida
Thiago Santana Lemes
Cleber Giugioli Carrasco
UEG, 75132-903, Brasil
[email protected]
[email protected]
Palavras-Chave: Erro tipo I, hipótese nula, método de Monte Carlo, t-student.
1
INTRODUÇÃO
Existem situações nas quais é necessário conhecer a média de uma
determinada população e saber se essa média fornecida é verdadeira. Será
introduzido o conceito do teste de hipóteses para a média de uma população quando
não se conhece a variância desta, e será avaliado o erro tipo I inerente ao teste. A
partir do momento em que há a necessidade de conhecer o valor real de uma média
populacional, pode-se utilizar o teste de hipóteses que consiste inicialmente em fixar
uma hipótese nula (H0) que usualmente será a própria média em questão e uma
hipótese alternativa diferente, menor ou maior do que esta média. No caso em que
não se conhece a variância da população, é possível estimá-la através da variância
da amostra e então utilizar uma distribuição conhecida como t-student (COSTA
NETO, 1977). Em seguida obtém-se uma estatística com base na amostra da
população e então será construída a região crítica do teste, que tem caráter de
decisão sobre a rejeição ou não de H0. Essa região crítica é construída a partir do
nível de significância (α) do teste e caso a estatística encontrada pertença a essa
região rejeita-se H0 ao nível de α%, caso contrário não se rejeita.
1
Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação
UNIVERSIDADE ESTADUAL DE GOIÁS
10 a 12 de novembro de 2010
No entanto ao realizar um teste de hipóteses estamos sujeitos a cometer
erros que atrapalham a análise dos resultados. O 1º denominado erro tipo I, ocorre
quando se rejeita H0 e essa hipótese é verdadeira, e o 2º denominado de erro tipo II,
ocorre quando não se rejeita H0 e esta é falsa. Porém, esses erros podem ser
controlados, principalmente o erro tipo I que recebe uma atenção maior devido à sua
importância. Neste trabalho será avaliada a probabilidade de se cometer o erro tipo I
na aplicação de um teste de hipóteses para a média com variância desconhecida a
partir de um método conhecido como Monte Carlo (MUN, 2006). Nesse método
repete-se o mesmo procedimento várias vezes a fim de verificar o que ocorre com
essa probabilidade quando são alterados os níveis de significância, os tamanhos
amostrais e os desvios padrão. Todo o processo de simulação será realizado no
software R (PETERNELLI; MELLO, 2007).
2
MATERIAL E MÉTODOS
Ao testar a média de uma determinada população, em geral não se
conhece a sua variância, no entanto, é possível estimá-la através da variância
amostral dessa população (TRIOLA, 2008). Inicialmente deve-se determinar a
hipótese nula (H0) e a hipótese alternativa (HA) e fixar o nível de significância (α) do
teste. A partir dessas hipóteses e do problema em questão, o teste poderá ser
definido como bilateral ou unilateral. Em seguida estima-se a variância da amostra
de tamanho n utilizando a conhecida expressão:
n
xi
S2
i 1
n 1
x
2
(1)
Após isso se utiliza a distribuição t-student com n-1 graus de liberdade,
para testar a média de interesse. A expressão a seguir calcula um valor denominado
como t observado (tobs):
(2)
2
Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação
UNIVERSIDADE ESTADUAL DE GOIÁS
10 a 12 de novembro de 2010
Para calcular t através dessa expressão é preciso ter a média amostral ,
a média a ser testada (µ), e o desvio padrão (s) da amostra de n elementos.
Consultando a tabela de valores t-student será coletado um valor denominado t
crítico (tc) que será usado para construir a região crítica (RC) do teste. Será feita a
comparação de tobs em relação à RC e ser for constatado que tobs pertence à região
crítica rejeita-se H0, caso contrário H0 não será rejeitada.
Para iniciar a simulação será gerada uma amostra de tamanho n a partir
de um modelo normal com média pré-estabelecida. Será utilizado o software R e o
método de Monte Carlo, que consiste em repetir o teste r vezes e verificar em
quantas delas o teste rejeita ou não a hipótese nula. Para contar o número de
rejeições foi construído um contador dentro do programa que atribui δ = 1 para
rejeição de H0 e δ = 0 para não rejeição de H0. Dessa forma a probabilidade do erro
tipo I (α) será obtida através da seguinte expressão (CARRASCO; SILVA, 2009, p.
68):
n
i
*
i 1
r
, i 1,2,...,r.
(3)
A Tabela 1 mostra as combinações a serem feitas na realização do
estudo de Monte Carlo, com 6 diferentes tamanhos de amostra e 3 diferentes níveis
de significância.
Tabela 1: Combinações das amostras
α
α1
α2
α3
Tamanho da Amostra (n)
n1
n2
n3
n4
n5
n6
*
*
*
*
*
α 11 α 12 α 13 α 14 α 15 α*16
α*21 α*22 α*23 α*24 α*25 α*26
α*31 α*32 α*33 α*34 α*35 α*36
3
Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação
UNIVERSIDADE ESTADUAL DE GOIÁS
10 a 12 de novembro de 2010
3
RESULTADOS E DISCUSSÃO
Para realizar o estudo de Monte Carlo foram geradas amostras a partir de
um modelo normal com média µ = 5 e desvio padrão σ = 1. Os tamanhos amostrais
foram 5, 10, 30, 50, 200 e 1000. E os níveis de significância foram α = 0,01; 0,05 e
0,10. Utilizando esses dados repete-se o teste de hipóteses 1000 vezes (r = 1000)
para verificar se o teste foi rejeitado ou não em cada uma das repetições (δi)
utilizando (2).
Para o teste bilateral as hipóteses foram definidas da seguinte maneira:
(4)
No caso do teste unilateral à esquerda as hipóteses foram definidas da
seguinte forma:
(5)
O teste unilateral à direita teve procedimento análogo aos anteriores, e as
hipóteses foram definidas da seguinte maneira:
(6)
4
Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação
UNIVERSIDADE ESTADUAL DE GOIÁS
10 a 12 de novembro de 2010
Figura 1: Resultados da análise do erro tipo I.
A Figura 1 apresenta os resultados obtidos no estudo de simulação de
Monte Carlo, pode-se observar que a probabilidade de se cometer o erro tipo I está
próxima dos níveis de significância fixados, e que só há influência do tamanho da
amostra sobre a probabilidade de se cometer o erro tipo I.
4
CONCLUSÃO
Através do estudo de simulação de Monte Carlo observou-se que a
probabilidade de se cometer o erro tipo I em um teste de hipóteses para a média
com variância desconhecida está próxima do nível de significância (α) do teste,
mesmo para diferentes tamanhos amostrais. Neste caso, não há necessidade de se
preocupar com esse tipo de erro ao realizar o teste de hipóteses para a média com
variância desconhecida.
5
Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação
UNIVERSIDADE ESTADUAL DE GOIÁS
10 a 12 de novembro de 2010
REFERÊNCIAS BIBLIOGRÁFICAS
CARRASCO, C. G.; SILVA, L. A. Avaliação do erro tipo I na aplicação de um teste de
hipóteses para a média. Revista Mosaicum, Bahia, Nº. 9, p. 63-68, 2009.
COSTA NETO, Pedro Luiz. Estatística. 1º edição. São Paulo: Edgard Blucher, 1977.
MUN, JOHNATHAN. Applying Monte Carlo Simulation, Real Options Analysis,
Forecasting, and Optimization Techniques. 1º edição. Wiley, 2006.
PETERNELLI, Luiz Alexandre; MELLO, Márcio Pupin de. Conhecendo o R – Uma Visão
Estatística. 1º edição. Minas Gerais: Editora Ufv, 2007.
TRIOLA, M. F. Estatística. 10º edição. LTC, 2008.
6
Download

Estudo de Simulação do Erro Tipo I Cometido em um Teste de