Métodos Quantitativos PROF. DR. Renato Vicente Método Estatístico Amostra População Inferência Estatística Teoria de Probabilidades Estatística Descritiva Aula 4A Inferência Estatística: Um pouco de História Um pouco mais de história: A Física Social No tempo de Quetelet (Início do seculo 19) Probabilidades e Estatística eram utilizadas basicamente para análise de erros experimentais e para cálculo de seguros. Quetelet acreditava ser possível estender seu uso para todo tipo de fenômeno humano no que chamava de “Física Social”. Publicou em 1834 seu Essai de physique sociale. Introduziu a idéia do “homem médio”. Quetelet: 1796-1874 Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando origem ao ramo que levaria à Estatística moderna. Em 1869 Galton publicou Hereditary Genius tentando demonstrar quantitativamente que as características e habilidades humanas seriam hereditárias. Charles Darwin (1809--1882) (1809 Francis Galton (1822--1911) (1822 Quincunx de Galton Galton propôs o aparato ao lado para ilustrar a formação da distribuição normal. http://www.jcu.edu/math/isep/Quincunx/Quincunx.html Karl Pearson: Departamento de Estatística Protegido de Galton, Pearson escreveu sua biografia. Em 1911 foi responsável pela criação do primeiro Departamento de Estatística no mundo no University College London . Carl (Karl) Pearson (1857-1936) Sobre o trabalho de Galton escreveu: “Eu interpretei que... Galton ... quis dizer que há uma categoria mais ampla do que a conexão causal, que é a correlação,... e que este novo conceito de correlação fez da psicologia, da antropologia, da medicina e da sociologia passíveis de tratamento matemático. Foi Galton quem primeiro me libertou do preconceito de que boa matemática poderia apenas ser aplicada a conexões de causa e efeito em fenômenos naturais.” Seu livro a Gramática da Ciência foi a primeira leitura da Academia Olímpica, grupo de estudos liderado por Einstein quando tinha 23 anos. Gosset (Student):Controle de Qualidade William Gosset trabalhava na cervejaria Guinness. Em 1906, assistiu a um curso com Pearson. Juntos tiveram a idéia de aplicar métodos estatísticos no controle de qualidade da cervejaria. Por trabalhar na cervejaria, publicou seus artigos utilizando o pseudônimo Student, pelo qual hoje conhecemos sua principal contribuição : o teste t de Student para testarmos hipóteses sobre a média amostral (veja exemplo dos Shoshoni e a razão áurea na Aula 2). William Gosset (1876-1937) Fisher: Estatística Moderna Em 1913 Fisher enviou uma carta para Gosset Contendo uma justificativa teórica para a distribuição t. Esta seria o início de uma seqüência deu forma a boa parte da Estatística Moderna. Em 1919 Fisher foi contratado pela Estação de Experimentos Agrícolas de Rothamstead , onde desenvolveu um grande número de ferramentas teóricas para exame de impactos agrícolas, entre elas estavam métodos para estimação estatística, planejamento experimental e análise de variância. William Gosset (1876-1937) Aula 4B A Distribuição Normal A Distribuição Normal FUVEST 2007 - Distribuição dos pontos na Primeira Fase (incluindo Bônus e ENEM) Candidatos Inscritos - Total das Carreiras de Exatas A distribuição normal é uma curva em forma de sino que aparece freqüentemente em todo tipo de observações. Os parâmetros da distribuição normal A distribuição Normal é totalmente descrita pela média s m e pelo desvio padrão . Se mudarmos a média apenas deslocamos a curva pela abscissa. Se diminuirmos o desvio padrão tornamos a curva menos dispersa. Probabilidades de ocorrência m A freqüência de ocorrência dos dados em uma distribuição normal é bem definida para cada intervalo em torno da média. Escore z Sua altura é de 1,56 m. Você é alta? Sua nota na FUVEST foi 60. Sua nota foi alta ? O escore z permite que comparemos um valor específico com a população levando-se em conta o valor típico e a dispersão. valor – média desvio padrão A cada valor de z está associado um percentil. Escore z http://techniques.geog.ox.ac.uk/mod_2/tables/z-score.htm Peso de Meninos por Idade Como fui na FUVEST? http://www.fuvest.br/scr/hist1f.asp?anofuv=2007&tipo=1&carreira=HUM Média = 41,1 Desvio Padrão = 15 Z = (60 – 41,1)/15 = 1,26 P(Z<1,26) = 89,6% Sua a nota foi alta. Você é baixinha? Amostra : n=115 (alunos da EACH) MÉDIA = 1,71 m DP = 9 cm Z = (1,56 – 1,71)/0,09 = -1,67 P(Z<-1,67) = 4,7 % Você muito provavelmente não é das mais altas ! Aula 4B Distribuição Amostral e Estimação Estatísticas Uma estatística é uma quantidade calculada a partir de amostras medidas em uma população. Exemplo: A razão áurea e as molduras Shoshoni. 0.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 A média, o desvio padrão, a mediana, os quartis, o máximo e o mínimo são estatísticas. 0.570 0.844 0.576 0.933 Distribuições amostrais Uma distribuição amostral é a distribuição que obtemos quando calculamos uma estatística em várias amostras de uma população Suponhamos que o quadro abaixo represente nossa população. 0.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.933 Distribuições amostrais A média de nossa população é µ = 0,6605 e o desvio padrão populacional é σ=0,09. A distribuição está representada ao lado. 0.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 Coletando 4 amostras com tamanho n=2 obtivemos: =0.721 =0.6435 =(0.628+0.668)/2=0.648 =(0.844+0.576)/2=0.710 0.570 0.844 0.576 0.933 Distribuições amostrais A média amostral (média das médias de amostras) é µa = 0,668 e o desvio padrão amostral é σa=0.066. 0.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 Coletando 4 amostras com tamanho n=2 obtivemos: =0.721 =0.6435 =(0.628+0.668)/2=0.648 =(0.844+0.576)/2=0.710 0.570 0.844 0.576 0.933 Médias amostrais. Repare que esta é mais estreita que a distribuição populacional Distribuições amostrais E se as amostras forem maiores, n=8 por exemplo. 0.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 Aqui temos 2 amostras com tamanho n=8 µa= 0,6606 σa=0,025 0.570 0.844 0.576 0.933 Distribuições amostrais Resumindo Tamanho da Amostra (n) Média das médias de amostra µa 2 0,6680 8 0,6606 20 (população) 0,6605 Desvio padrão amostral σa 0,066 0,025 0,09 Teorema do Limite Central Para uma variedade ampla de distribuições a distribuição das médias amostrais tende a uma distribuição normal quando o número de amostras é grande. http://www.chem.uoa.gr/applets/AppletCentralLimit/Appl_CentralLimit2.html Exemplo: Estimando a altura média da População Amostra : n=115 (alunos da EACH) 1,71 m é um estimador para a média populacional O desvio padrão DP=9cm é um estimador para o desvio padrão populacional. Exemplo: Estimando a altura média da População A distribuição amostral para amostras de tamanho n=115 terá média igual à média populacional e desvio padrão igual ao desvio padrão populacional dividido por √115 , ou seja 0,09/ √115 = 0,01 Nossa estimativa será portanto 1,71 ± 0,01 m O quanto podemos confiar nessa estimativa da média ? Exemplo: Estimando a altura média da População O quanto podemos confiar nessa estimativa para a altura média ? 1,68m 1,70m 1,72m Note que: esta é a distribuição para nosso erro de estimativa da altura média. 1,74m Qualidade de Estimadores: Viés e Eficiência Viés grande eficiência alta Viés grande eficiência baixa Viés pequeno eficiência baixa Viés pequeno eficiência alta Qualidade de Estimadores: Viés e Eficiência Média Amostral= (x1 + x2 + x3 + ... + xn)/n e eficiente (eficiência máxima) é não-viesado Desvio Padrão Amostral = RAIZ{ [(x1-Media)2 + (x2-Media)2 + ... (xn-Media)2]/ (n-1)} é não-viesado.