Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação UNIVERSIDADE ESTADUAL DE GOIÁS 10 a 12 de novembro de 2010 Estudo de Simulação do Erro Tipo I Cometido em um Teste de Hipóteses para a Média com Variância Desconhecida Thiago Santana Lemes Cleber Giugioli Carrasco UEG, 75132-903, Brasil [email protected] [email protected] Palavras-Chave: Erro tipo I, hipótese nula, método de Monte Carlo, t-student. 1 INTRODUÇÃO Existem situações nas quais é necessário conhecer a média de uma determinada população e saber se essa média fornecida é verdadeira. Será introduzido o conceito do teste de hipóteses para a média de uma população quando não se conhece a variância desta, e será avaliado o erro tipo I inerente ao teste. A partir do momento em que há a necessidade de conhecer o valor real de uma média populacional, pode-se utilizar o teste de hipóteses que consiste inicialmente em fixar uma hipótese nula (H0) que usualmente será a própria média em questão e uma hipótese alternativa diferente, menor ou maior do que esta média. No caso em que não se conhece a variância da população, é possível estimá-la através da variância da amostra e então utilizar uma distribuição conhecida como t-student (COSTA NETO, 1977). Em seguida obtém-se uma estatística com base na amostra da população e então será construída a região crítica do teste, que tem caráter de decisão sobre a rejeição ou não de H0. Essa região crítica é construída a partir do nível de significância (α) do teste e caso a estatística encontrada pertença a essa região rejeita-se H0 ao nível de α%, caso contrário não se rejeita. 1 Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação UNIVERSIDADE ESTADUAL DE GOIÁS 10 a 12 de novembro de 2010 No entanto ao realizar um teste de hipóteses estamos sujeitos a cometer erros que atrapalham a análise dos resultados. O 1º denominado erro tipo I, ocorre quando se rejeita H0 e essa hipótese é verdadeira, e o 2º denominado de erro tipo II, ocorre quando não se rejeita H0 e esta é falsa. Porém, esses erros podem ser controlados, principalmente o erro tipo I que recebe uma atenção maior devido à sua importância. Neste trabalho será avaliada a probabilidade de se cometer o erro tipo I na aplicação de um teste de hipóteses para a média com variância desconhecida a partir de um método conhecido como Monte Carlo (MUN, 2006). Nesse método repete-se o mesmo procedimento várias vezes a fim de verificar o que ocorre com essa probabilidade quando são alterados os níveis de significância, os tamanhos amostrais e os desvios padrão. Todo o processo de simulação será realizado no software R (PETERNELLI; MELLO, 2007). 2 MATERIAL E MÉTODOS Ao testar a média de uma determinada população, em geral não se conhece a sua variância, no entanto, é possível estimá-la através da variância amostral dessa população (TRIOLA, 2008). Inicialmente deve-se determinar a hipótese nula (H0) e a hipótese alternativa (HA) e fixar o nível de significância (α) do teste. A partir dessas hipóteses e do problema em questão, o teste poderá ser definido como bilateral ou unilateral. Em seguida estima-se a variância da amostra de tamanho n utilizando a conhecida expressão: n xi S2 i 1 n 1 x 2 (1) Após isso se utiliza a distribuição t-student com n-1 graus de liberdade, para testar a média de interesse. A expressão a seguir calcula um valor denominado como t observado (tobs): (2) 2 Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação UNIVERSIDADE ESTADUAL DE GOIÁS 10 a 12 de novembro de 2010 Para calcular t através dessa expressão é preciso ter a média amostral , a média a ser testada (µ), e o desvio padrão (s) da amostra de n elementos. Consultando a tabela de valores t-student será coletado um valor denominado t crítico (tc) que será usado para construir a região crítica (RC) do teste. Será feita a comparação de tobs em relação à RC e ser for constatado que tobs pertence à região crítica rejeita-se H0, caso contrário H0 não será rejeitada. Para iniciar a simulação será gerada uma amostra de tamanho n a partir de um modelo normal com média pré-estabelecida. Será utilizado o software R e o método de Monte Carlo, que consiste em repetir o teste r vezes e verificar em quantas delas o teste rejeita ou não a hipótese nula. Para contar o número de rejeições foi construído um contador dentro do programa que atribui δ = 1 para rejeição de H0 e δ = 0 para não rejeição de H0. Dessa forma a probabilidade do erro tipo I (α) será obtida através da seguinte expressão (CARRASCO; SILVA, 2009, p. 68): n i * i 1 r , i 1,2,...,r. (3) A Tabela 1 mostra as combinações a serem feitas na realização do estudo de Monte Carlo, com 6 diferentes tamanhos de amostra e 3 diferentes níveis de significância. Tabela 1: Combinações das amostras α α1 α2 α3 Tamanho da Amostra (n) n1 n2 n3 n4 n5 n6 * * * * * α 11 α 12 α 13 α 14 α 15 α*16 α*21 α*22 α*23 α*24 α*25 α*26 α*31 α*32 α*33 α*34 α*35 α*36 3 Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação UNIVERSIDADE ESTADUAL DE GOIÁS 10 a 12 de novembro de 2010 3 RESULTADOS E DISCUSSÃO Para realizar o estudo de Monte Carlo foram geradas amostras a partir de um modelo normal com média µ = 5 e desvio padrão σ = 1. Os tamanhos amostrais foram 5, 10, 30, 50, 200 e 1000. E os níveis de significância foram α = 0,01; 0,05 e 0,10. Utilizando esses dados repete-se o teste de hipóteses 1000 vezes (r = 1000) para verificar se o teste foi rejeitado ou não em cada uma das repetições (δi) utilizando (2). Para o teste bilateral as hipóteses foram definidas da seguinte maneira: (4) No caso do teste unilateral à esquerda as hipóteses foram definidas da seguinte forma: (5) O teste unilateral à direita teve procedimento análogo aos anteriores, e as hipóteses foram definidas da seguinte maneira: (6) 4 Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação UNIVERSIDADE ESTADUAL DE GOIÁS 10 a 12 de novembro de 2010 Figura 1: Resultados da análise do erro tipo I. A Figura 1 apresenta os resultados obtidos no estudo de simulação de Monte Carlo, pode-se observar que a probabilidade de se cometer o erro tipo I está próxima dos níveis de significância fixados, e que só há influência do tamanho da amostra sobre a probabilidade de se cometer o erro tipo I. 4 CONCLUSÃO Através do estudo de simulação de Monte Carlo observou-se que a probabilidade de se cometer o erro tipo I em um teste de hipóteses para a média com variância desconhecida está próxima do nível de significância (α) do teste, mesmo para diferentes tamanhos amostrais. Neste caso, não há necessidade de se preocupar com esse tipo de erro ao realizar o teste de hipóteses para a média com variância desconhecida. 5 Anais do VIII Seminário de Iniciação Científica e V Jornada de Pesquisa e Pós-Graduação UNIVERSIDADE ESTADUAL DE GOIÁS 10 a 12 de novembro de 2010 REFERÊNCIAS BIBLIOGRÁFICAS CARRASCO, C. G.; SILVA, L. A. Avaliação do erro tipo I na aplicação de um teste de hipóteses para a média. Revista Mosaicum, Bahia, Nº. 9, p. 63-68, 2009. COSTA NETO, Pedro Luiz. Estatística. 1º edição. São Paulo: Edgard Blucher, 1977. MUN, JOHNATHAN. Applying Monte Carlo Simulation, Real Options Analysis, Forecasting, and Optimization Techniques. 1º edição. Wiley, 2006. PETERNELLI, Luiz Alexandre; MELLO, Márcio Pupin de. Conhecendo o R – Uma Visão Estatística. 1º edição. Minas Gerais: Editora Ufv, 2007. TRIOLA, M. F. Estatística. 10º edição. LTC, 2008. 6