Luiz Carlos Terra Estimação de valores Nesta aula, você conhecerá a parte mais importante da estatística, que é conhecida como inferência estatística, ou seja, você aprenderá como usar os dados de uma amostra para estimar valores da população e também compreenderá a importância de se fazer estimação por intervalo de confiança. (Luiz Carlos Terra) Estimação de valores 1 Objetivo Nesta aula, você conhecerá a parte mais importante da estatística, que é conhecida como inferência estatística, ou seja, você aprenderá como usar os dados de uma amostra para estimar valores da população e também compreenderá a importância de se fazer estimação por intervalo de confiança. Tópicos 1 – Estimação de valores 2 – Exemplos de estimação 3 – Estimação pontual 4 – Estimação por intervalo 5 – Risco de erro e nível de confiança 6 – Teorema do limite central 7 – Demonstração numérica para as premissas adotadas 8 – Bibliografia 1 – Estimação de valores Uma das principais funções da Estatística é a estimação de valores da população. Em função de limitação de tempo e também devido aos custos elevados de uma pesquisa, envolvendo todos os elementos de uma população, seus parâmetros são frequentemente estimados com base em estatísticas da amostra. Estimação é, portanto, um processo que consiste em utilizar dados extraídos de uma amostra aleatória para estimar os valores de uma população. O estimador, calculado com base em dados amostrais, chama-se estimativa e o valor calculado com os dados da população chama-se parâmetro. Em mercadologia, a estimação é muito aplicada, por exemplo, quando se estima a proporção de consumidores que poderão adquirir determinado produto ou quando se faz estimação das quantidades de produtos que uma empresa poderá colocar no mercado. 2 Estimação de valores 2 – Exemplos de estimação Veja abaixo, as diferentes formas de estimação de valores: • Pontual: utilizada quando você estima para o parâmetro da população o mesmo valor encontrado para a amostra. • Intervalar: utilizada quando você estabelece um intervalo de valores para essa estimação. Parâmetro populacional estimativa pontual estimativa intervalar Média o brasileiro bebe 47 litros de cerveja por ano o brasileiro bebe de 43 a 51 litros de cerveja por ano Proporção 40% dos brasileiros tem carro 37% a 43% dos brasileiros têm carro 3 – Estimação pontual • Se você calcular para uma amostra, extraída aleatoriamente de uma população, um valor para a média e considerar esse único valor como uma estimativa para toda a população, você estará fazendo uma estimação pontual. 4 – Estimação por intervalo • Na estimação do parâmetro, por exemplo, média da população, quando você calcula a média amostral, ela não é exatamente igual à média da população, embora seus valores sejam próximos . Você poderá calcular as médias de várias amostras e, em nenhum caso, a média amostral coincidirá com a média da população. • Dada essa variabilidade das médias, você deverá elaborar uma estimativa intervalar, que seria um intervalo entre os valores possíveis de se encontrar a verdadeira média da população. Esse intervalo é determinado com um certo grau de confiança e por esse motivo ele é denominado intervalo de confiança. Quanto maior o intervalo, maior é a segurança da estimativa. Explicando melhor essa técnica de estimação, suponha que em uma amostra de preços de um determinado produto, você obteve a média de R$ 20,00. Essa média é um dos valores que uma amostra de dados pode gerar. Até que ponto a estimativa obtida para a amostra está próxima da média da população? Estimação de valores 3 Sabe-se pelo TEOREMA DO LIMITE CENTRAL, adiante descrito, que quase sempre as médias de várias amostras extraídas de uma mesma população distribuem-se normalmente. Sendo assim, pode-se afirmar que o valor calculado da média de uma amostra tem 68,3% de probabilidade de estar a mais ou menos um desvio padrão da média da distribuição amostral. Veja o exemplo numérico e certifique-se que a média da distribuição amostral é igual à média da população). Por decorrência, 34,15% das médias amostrais estarão no intervalo entre a média e um desvio padrão para mais e 34,15% entre a média e um desvio padrão para menos. Dessa forma, afirmar que R$ 20,00 está distante, para mais ou para menos de um desvio padrão da média da população envolve um risco de aproximadamente 32%, pois a verdadeira média pode ser muito maior ou menor do que a média da amostra somada a um desvio padrão ou da média da amostra subtraído de um desvio padrão. Como não se conhece a verdadeira média da população, o que vale é a definição de um intervalo de valores, em que seu valor poderia ser encontrado. Se, como nesse exemplo, o intervalo de confiança é de 68,3%, essa é a probabilidade de que a verdadeira média esteja entre a média da amostra menos um desvio padrão e a média da amostra mais um desvio padrão. 5 – Risco de erro e nível de confiança No exemplo acima, existe um risco ao se afirmar que a média da população esteja naquele intervalo, pois a verdadeira média pode estar acima ou abaixo dos valores definidos e isso constitui o risco de erro, que é medido pela diferença entre 100% e o intervalo de confiança. No caso, aproximadamente 68%, gerando um risco de erro de 32%, denominado α . O nível de confiança no caso 68% é denominado da seguinte maneira: 1 - α Você pode deduzir que quanto maior o intervalo de confiança, menor é o risco de erro. Para um intervalo de confiança de 95%, por exemplo, o risco de erro é de 5% e para um intervalo de confiança de 99%, o risco de erro é de apenas 1%. Você não deve confundir risco de erro com margem de erro, que explicaremos mais adiante. Resumindo: um intervalo de confiança para a média é um intervalo de valores, tendo ao centro o valor da média amostral, em que se tem a probabilidade como risco determinado de erro como parâmetro da população. Essa probabilidade é a área sob a curva normal, sendo determinada pela variável Z, que expressa o número de desvios padrão em torno da média amostral. 4 Estimação de valores 6 – Teorema do limite central É importante destacar que o desenvolvimento dessa forma de se definir o intervalo de confiança está amparado no teorema do limite central, assim resumido: 1) Se a população sob amostragem tem distribuição normal, a distribuição das médias amostrais também será normal para todos os tamanhos da amostra. 2) Para grandes amostras, independente da forma de distribuição da população, a distribuição de médias amostrais será aproximadamente normal. 7 – Demonstração numérica das premissas adotadas Você deve observar que todo o raciocínio de construção do intervalo de confiança está desenvolvido sob as premissas abaixo: • a média das médias das amostras é igual à média da população; e • o desvio padrão das médias das amostras é igual ao desvio padrão da população dividido pela raiz quadrada do número de elementos da amostra. Para que você entenda com mais clareza essas premissas, desenvolveremos um exemplo numérico para confirmá-las. Vamos analisar, então, uma população composta pelos números 2 3 e 4. Extraindo todas as amostras possíveis, compostas por dois números e com reposição, serão possíveis nove amostras: Amostras x (média de cada amostra) 2e2 2e3 2e4 3e2 3e3 3e4 4e2 4e3 4e4 2 2,5 3 2,5 3 3,5 3 3,5 4 média das médias das amostras = 2+2,5+3+2,5+3+3,5+3+3,5+4 9 média das médias das amostras = 3 população dos dados : 2, 3 e 4 .... média da população = 3 Estimação de valores 5 Observe que o resultado das médias das amostras (3) é igual à média da população (3). Variância da população 2, 3 e 4 2–3= -1 3–3= 0 4–3= 1 2 2/3 = variância da população variância da média amostral (2 – 3)2 + (2,5 – 3)2 + .............. = 3 3/9 = 1 3 = variância da média amostral • pelos cálculos, você pode observar que a variância da média amostral é igual à variância da população, dividida pelo número de elementos da amostra, ou seja, 2/3/2 = 2/3 x 1/2 = 1/3 (2£3 é a variância da população e 2 é o tamanho da amostra), σ2 ≤ n • conseqüentemente, o desvio padrão da distribuição amostral é igual ao desvio padrão da população, dividido pela raiz quadrada do tamanho da amostra, representado pela fórmula σ ≤ √n. Esse valor também é conhecido como erro padrão da média. E, quando não se conhecer o desvio padrão da população, ele deve ser calculado com base no desvio padrão da amostra (s), que é o estimador de σ. 6 Estimação de valores Anotações: bibliografia _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Básica _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Spiegel, Murray R. _________________________________________________________________________________________________________________________________________________ Estatística – Editora _________________________________________________________________________________________________________________________________________________ McGraw-Hill. _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Lopes, Paulo Afonso. Estatística e _________________________________________________________________________________________________________________________________________________ Probabilidade. _________________________________________________________________________________________________________________________________________________ Reichmann e Affonso _________________________________________________________________________________________________________________________________________________ Editores. _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Complementar _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Kasmier, Leonard J. _________________________________________________________________________________________________________________________________________________ Estatística aplicada à _________________________________________________________________________________________________________________________________________________ economia e _________________________________________________________________________________________________________________________________________________ administração. Editora _________________________________________________________________________________________________________________________________________________ Makron Books. ______________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ Estimação de valores 7