Métodos Quantitativos
PROF. DR. Renato Vicente
Método Estatístico
Amostra
População
Inferência
Estatística
Teoria de
Probabilidades
Estatística
Descritiva
Aula 4A
Inferência Estatística: Um
pouco de História
Um pouco mais de história: A Física Social
No tempo de Quetelet (Início do seculo 19)
Probabilidades e Estatística eram
utilizadas basicamente para análise de
erros experimentais e para cálculo de
seguros. Quetelet acreditava ser possível
estender seu uso para todo tipo de
fenômeno humano no que chamava de
“Física Social”. Publicou em 1834 seu
Essai de physique sociale. Introduziu a
idéia do “homem médio”.
Quetelet: 1796-1874
Galton e Darwin: Bioestatística
Após ler a Origem das Espécies,
escrito por seu primo mais velho,
Galton passou a se dedicar à
Genética, dando origem ao ramo
que levaria à Estatística moderna.
Em 1869 Galton publicou
Hereditary Genius tentando
demonstrar quantitativamente que
as características e habilidades
humanas seriam hereditárias.
Charles Darwin
(1809--1882)
(1809
Francis Galton
(1822--1911)
(1822
Quincunx de Galton
Galton propôs o aparato
ao lado para ilustrar a
formação da distribuição
normal.
http://www.jcu.edu/math/isep/Quincunx/Quincunx.html
Karl Pearson: Departamento de Estatística
Protegido de Galton, Pearson escreveu sua
biografia. Em 1911 foi responsável pela criação do
primeiro Departamento de Estatística no mundo
no University College London .
Carl (Karl) Pearson
(1857-1936)
Sobre o trabalho de Galton escreveu: “Eu
interpretei que... Galton ... quis dizer que há uma
categoria mais ampla do que a conexão causal,
que é a correlação,... e que este novo conceito
de correlação fez da psicologia, da antropologia,
da medicina e da sociologia passíveis de
tratamento matemático. Foi Galton quem primeiro
me libertou do preconceito de que boa matemática
poderia apenas ser aplicada a conexões de causa
e efeito em fenômenos naturais.”
Seu livro a Gramática da Ciência foi a primeira
leitura da Academia Olímpica, grupo de estudos
liderado por Einstein quando tinha 23 anos.
Gosset (Student):Controle de Qualidade
William Gosset trabalhava na cervejaria Guinness.
Em 1906, assistiu a um curso com Pearson.
Juntos tiveram a idéia de aplicar métodos
estatísticos no controle de qualidade da
cervejaria. Por trabalhar na cervejaria,
publicou seus artigos utilizando o pseudônimo
Student, pelo qual hoje conhecemos sua principal
contribuição : o teste t de Student para testarmos
hipóteses sobre a média amostral (veja exemplo
dos Shoshoni e a razão áurea na Aula 2).
William Gosset
(1876-1937)
Fisher: Estatística Moderna
Em 1913 Fisher enviou uma carta para Gosset
Contendo uma justificativa teórica para a
distribuição t. Esta seria o início de uma seqüência
deu forma a boa parte da Estatística Moderna.
Em 1919 Fisher foi contratado pela Estação de
Experimentos Agrícolas de Rothamstead , onde
desenvolveu um grande número de ferramentas
teóricas para exame de impactos agrícolas, entre
elas estavam métodos para estimação estatística,
planejamento experimental e análise de variância.
William Gosset
(1876-1937)
Aula 4B
A Distribuição Normal
A Distribuição Normal
FUVEST 2007 - Distribuição dos pontos na Primeira Fase (incluindo Bônus e
ENEM) Candidatos Inscritos - Total das Carreiras de Exatas
A distribuição
normal é uma
curva em forma de
sino que aparece
freqüentemente
em todo tipo de
observações.
Os parâmetros da distribuição normal
A distribuição Normal é totalmente descrita pela média
s
m
e pelo desvio
padrão
. Se mudarmos a média apenas deslocamos a curva pela abscissa.
Se diminuirmos o desvio padrão tornamos a curva menos dispersa.
Probabilidades de ocorrência
m
A freqüência de ocorrência dos dados em uma distribuição normal é
bem definida para cada intervalo em torno da média.
Escore z
Sua altura é de 1,56 m. Você é alta?
Sua nota na FUVEST foi 60. Sua nota foi alta ?
O escore z permite que comparemos um valor específico com
a população levando-se em conta o valor típico e a
dispersão.
valor – média
desvio padrão
A cada valor de z está associado um percentil.
Escore z
http://techniques.geog.ox.ac.uk/mod_2/tables/z-score.htm
Peso de Meninos por Idade
Como fui na FUVEST?
http://www.fuvest.br/scr/hist1f.asp?anofuv=2007&tipo=1&carreira=HUM
Média = 41,1
Desvio Padrão = 15
Z = (60 – 41,1)/15 = 1,26
P(Z<1,26) = 89,6%
Sua a nota foi alta.
Você é baixinha?
Amostra : n=115 (alunos da EACH)
MÉDIA = 1,71 m
DP = 9 cm
Z = (1,56 – 1,71)/0,09 = -1,67
P(Z<-1,67) = 4,7 %
Você muito provavelmente não é das
mais altas !
Aula 4B
Distribuição Amostral e
Estimação
Estatísticas
Uma estatística é uma quantidade calculada a partir de
amostras medidas em uma população.
Exemplo: A razão áurea e as molduras Shoshoni.
0.693
0.749
0.654
0.670
0.662
0.672
0.615
0.606
0.690
0.628
0.668
0.611
0.606
0.609
0.601
0.553
A média, o desvio padrão, a mediana, os quartis,
o máximo e o mínimo são estatísticas.
0.570
0.844
0.576
0.933
Distribuições amostrais
Uma distribuição amostral é a distribuição que obtemos
quando calculamos uma estatística em várias amostras de
uma população
Suponhamos que o quadro abaixo represente
nossa população.
0.693
0.749
0.654
0.670
0.662
0.672
0.615
0.606
0.690
0.628
0.668
0.611
0.606
0.609
0.601
0.553
0.570
0.844
0.576
0.933
Distribuições amostrais
A média de nossa população é µ = 0,6605 e o
desvio padrão populacional é σ=0,09. A
distribuição está representada ao lado.
0.693
0.749
0.654
0.670
0.662
0.672
0.615
0.606
0.690
0.628
0.668
0.611
0.606
0.609
0.601
0.553
Coletando 4 amostras com
tamanho n=2 obtivemos:
=0.721
=0.6435
=(0.628+0.668)/2=0.648
=(0.844+0.576)/2=0.710
0.570
0.844
0.576
0.933
Distribuições amostrais
A média amostral (média das médias de
amostras) é µa = 0,668 e o desvio padrão
amostral é σa=0.066.
0.693
0.749
0.654
0.670
0.662
0.672
0.615
0.606
0.690
0.628
0.668
0.611
0.606
0.609
0.601
0.553
Coletando 4 amostras com
tamanho n=2 obtivemos:
=0.721
=0.6435
=(0.628+0.668)/2=0.648
=(0.844+0.576)/2=0.710
0.570
0.844
0.576
0.933
Médias
amostrais.
Repare que
esta é mais
estreita que
a
distribuição
populacional
Distribuições amostrais
E se as amostras forem maiores, n=8 por
exemplo.
0.693
0.749
0.654
0.670
0.662
0.672
0.615
0.606
0.690
0.628
0.668
0.611
0.606
0.609
0.601
0.553
Aqui temos 2 amostras com
tamanho n=8
µa= 0,6606
σa=0,025
0.570
0.844
0.576
0.933
Distribuições amostrais
Resumindo
Tamanho da
Amostra (n)
Média das
médias de
amostra
µa
2
0,6680
8
0,6606
20 (população) 0,6605
Desvio padrão
amostral
σa
0,066
0,025
0,09
Teorema do Limite Central
Para uma
variedade ampla de
distribuições a
distribuição das
médias amostrais
tende a uma
distribuição normal
quando o número
de amostras é
grande.
http://www.chem.uoa.gr/applets/AppletCentralLimit/Appl_CentralLimit2.html
Exemplo: Estimando a altura média da
População
Amostra : n=115 (alunos da EACH)
1,71 m é um estimador para a
média populacional
O desvio padrão DP=9cm é um estimador
para o desvio padrão populacional.
Exemplo: Estimando a altura média da
População
A distribuição amostral para amostras de tamanho
n=115 terá média igual à média populacional e
desvio padrão igual ao desvio padrão populacional
dividido por √115 , ou seja
0,09/ √115 = 0,01
Nossa estimativa será portanto
1,71 ± 0,01 m
O quanto podemos confiar nessa estimativa da
média ?
Exemplo: Estimando a altura média da
População
O quanto podemos confiar nessa estimativa para a
altura média ?
1,68m
1,70m
1,72m
Note que: esta é a distribuição para
nosso erro de estimativa da altura
média.
1,74m
Qualidade de Estimadores: Viés e Eficiência
Viés grande eficiência alta
Viés grande eficiência baixa
Viés pequeno eficiência baixa
Viés pequeno eficiência alta
Qualidade de Estimadores: Viés e Eficiência
Média Amostral= (x1 + x2 + x3 + ... + xn)/n
e eficiente (eficiência máxima)
é não-viesado
Desvio Padrão Amostral =
RAIZ{ [(x1-Media)2 + (x2-Media)2 + ... (xn-Media)2]/ (n-1)}
é não-viesado.
Download

Aula 4 Prof. Renato Vicente