MOQ-13 PROBABILIDADE
E ESTATÍSTICA
Professor: Rodrigo A. Scarpel
[email protected]
www.mec.ita.br/~rodrigo
Programa do curso:
Semanas
Conteúdo
1
Introdução à probabilidade (eventos, espaço amostral, axiomas, propriedades, probabilidade condicional e independência).
2
Teorema da probabilidade total e teorema de Bayes. Variáveis aleatórias. Distribuições de probabilidade. Funções massa,
densidade, e distribuição acumulada. Funções de variáveis aleatórias.
3
Valor esperado e variância. Momentos de uma variável aleatória. Função geradora de momentos. Principais distribuições de
probabilidade discretas (Bernoulli, Binomial e Poisson).
4
Principais distribuições de probabilidade contínuas (Exponencial negativa e Normal).
5
Feriado (2/4)
6
Variáveis aleatórias conjuntas, função distribuição conjunta e marginal. Independência estatística. Covariância e Coeficiente
de Correlação.
7
Prova
8
Princípios de estatística. Estimadores e estimativas. Estimação pontual de parâmetros (Métodos dos momentos e da máxima
verossimilhança). Estatística Descritiva.
9
Amostras aleatórias. Distribuições amostrais. Teorema do limite central.
10
Propriedades dos estimadores. Intervalos de confiança (estimação por intervalo). Tamanho da amostra. Princípios de testes
de hipóteses.
11
Testes de Hipóteses. Inferência baseada em 2 amostras (entre parâmetros de populações distintas).
12
Testes não-paramétricos (associação, independência e de aderência).
13
Feriado (4/6)
14
Prova
15 e 16
Regressão linear simples e correlação.
Aplicações de modelos de regressão linear.
PRINCÍPIOS DA
ESTATÍSTICA
Professor: Rodrigo A. Scarpel
[email protected]
www.mec.ita.br/~rodrigo
Probabilidade x Estatística:
PROBABILIDADE
POPULAÇÃO
AMOSTRA
ESTATÍSTICA
Em probabilidade assume-se que população em estudo é conhecida
Em estatística, amostras são utilizadas para se chegar a conclusões
Princípios da Estatística:
Em probabilidade estudamos os modelos probabilísticos que auxiliam na
redução da realidade:
TESTAR
ADERÊNCIA
REALIDADE
MODELO
HIPÓTESES
ESTIMAÇÃO
DOS
PARÂMETROS
FAZER INFERÊNCIAS
EM RELAÇÃO À
REALIDADE
Princípios da Estatística:
No procedimento descrito:
A REALIDADE é a POPULAÇÃO (totalidade das observações na qual
estamos interessados)
Na redução da realidade a HIPÓTESE é que cada observação em uma
população é um valor de uma variável aleatória X, com distribuição de
probabilidade f(x). Assim,
Quando nos referirmos a uma população f(x) queremos dizer uma
população cujas observações são valores de uma variável aleatória que
tem uma distribuição de probabilidade f(x)
O valor esperado e a variância da variável aleatória é o valor esperado e
a variância da população correspondente
Princípios da Estatística:
Objetivo: Fazer inferências em relação à população (caracterizar e
eventualmente definir regras de decisão sobre uma população conhecendo
apenas parte dela)
TESTAR
ADERÊNCIA
POPULAÇÃO
AMOSTRA
HIPÓTESES
ESTIMAÇÃO DOS
PARÂMETROS
FAZER INFERÊNCIAS EM
RELAÇÃO A POPULAÇÃO
Princípios da Estatística:
Def: Amostra é um subconjunto da população.
O processo de amostragem deve assegurar a representatividade da amostra
em relação à população de onde foi retirada.
Métodos de amostragem:
Amostragem aleatória: iid
Amostragem estratificada
Amostragem por agrupamentos
Princípios da Estatística:
Def: Ao selecionar uma amostra de tamanho n de uma população f(x),
define-se a variável aleatória Xi, i =1,…,n, para representar o i-ésimo valor
amostral. As variáveis aleatórias X1, X2, …, Xn serão uma amostra aleatória
da população f(x), com valores numéricos x1, x2, …, xn se os valores
amostrais foram obtidos repetindo-se o experimento n vezes
independentemente, sob as mesmas condições. Portanto:
Os Xi’s são independentes
Todas Xi tem a mesma distribuição de probabilidade
Quando as amostras são feitas com reposição ou de uma população
“infinita”, essas condições são satisfeitas (as amostras são iid).
Princípios da Estatística:
Distribuição de probabilidade de uma amostra aleatória:
Como X1, X2, …, Xn é uma amostra aleatória da população f(x), sua
distribuição de probabilidade conjunta é
f (x1 , x 2 ,...x n ) = f (x1 ). f (x 2 )... f (x n )
POPULAÇÃO
AMOSTRA
HIPÓTESES:
f(x) e
independência
ESTIMAÇÃO DOS
PARÂMETROS
Portanto, essa distribuição é caracterizada pelos parâmetros populacionais
E[X] e Var[X] que são constantes não afetadas ou influenciadas pelas
observações da amostra aleatória.
MÉTODOS DE
ESTIMAÇÃO DE
PARÂMETROS
Professor: Rodrigo A. Scarpel
[email protected]
www.mec.ita.br/~rodrigo
Métodos de estimação pontual de parâmetros:
Um método de estimação de parâmetros sugere como obter estimadores
em casos específicos (quando faz-se alguma hipótese sobre a distribuição
da população, por exemplo).
Dois dos métodos mais utilizados em estimação de parâmetros são:
Método da máxima verossimilhança
Método dos momentos
Método da máxima verossimilhança:
O MLE é um método para estimação dos parâmetros a partir de uma
amostra aleatória proposto por Fisher em 1912.
Def: Função de Verossimilhança: seja X1,…,Xn uma amostra aleatória com
f.d.p. conjunta f(x1,…,xn ; θ1,…, θm) em que θ1,…, θm tem valores
desconhecidos. Quando x1,…,xn são os valores observados e a f.d.p.
conjunta é vista como em função de θ1,…, θm esta é chamada de função de
verossimilhança.
^
^
Procedimento: a estimativa de máxima verossimilhança de θ1,…, θm são os
^
valores de θi que maximizam a função de verossimilhança.
Por esse método obtém-se os valores de θ1,…, θm que maximizam o valor
que torna a amostra observada a “mais provável”.
Método dos momentos:
A idéia básica deste método é igualar os parâmetros obtidas a partir das
amostras aos parâmetros esperados da população (por exemplo, a média
amostral ao valor esperado populacional).
Def: Momento populacional: seja X1,…,Xn uma amostra aleatória de uma
população com f.d.p. f(x). Para k=1,2,3,… o k-ésimo momento populacional
(ou seja, da distribuição f(x)) é E[Xk].
Def: Momento amostral: seja X1,…,Xn uma amostra aleatória de uma
população com f.d.p. f(x). Para k=1,2,3,… o k-ésimo momento amostral é
N
∑
Mk =
X ik
i =1
N
Método dos momentos:
Procedimento:
Seja X1,X2,…,Xn uma amostra aleatória de uma distribuição com
f.d.p. f(x;θ
θ1,…, θm), em que θ1,…, θm são parâmetros cujos valores são
desconhecidos.
^
Os estimadores de momento θ1,…, θ^m são obtidos igualando-se os
primeiros m momentos amostrais aos m momentos populacionais
correspondentes e resolvendo para θ1,…, θm.
DISTRIBUIÇÃO
E[X]
VAR[X]
Binomial [X~Bin(n,p)]
n.p
n.p.(1-p)
Poisson [X~Poi( λ )]
λ
λ
2
µ
σ2
Normal [X~N(µ ,σ )]
Uniforme [X~Uni(a , b )] (a +b)/2 (b-a )2/12
Exponencial [X~Exp( λ )]
1/λ
λ
1/λ
λ2
Gamma [X~Gamma(a ,b)] a .b
a .b2
m
1
1
2
2
1
2
Obs: n é conhecido
ESTATÍSTICA
DESCRITIVA
Professor: Rodrigo A. Scarpel
[email protected]
www.mec.ita.br/~rodrigo
Análise exploratória de dados:
Uma vez coletados, é necessário fazer sua análise exploratória com
o objetivo de:
Checar sua qualidade (presença de outliers). Formas:
Estatísticas de sumarização (de posição e de dispersão)
Análise gráfica (histograma, box-plot)
A análise exploratória de dados é importante pois além de
proporcionar o maior entendimento do problema e dos dados
coletados, previne contra erros (conclusões equivocadas).
Histograma:
- Gráfico de barras contíguas;
- Base é proporcional ao intervalo da classe;
- Área é proporcional a frequência da classe;
- Pode-se usar tanto a frequência (ni) como a frequência relativa (fi)
Histograma:
Detecção de outliers
Medidas de posição:
São utilizadas quando se quer resumir os dados apresentando
apenas um ou alguns valores que sejam representativos de toda
série.
Média (aritmética): é a soma das observações divididas pelo número
delas, ou seja,
k
n
X =
njX j
∑ Xi ∑
j =1
i =1
n
=
n
em que n é o número de obsevações,
x1,...,xn são as observações,
k
=∑ fjX
j =1
j
nj é o número de informações iguais a xj,
fj é a frequência relativa da observação xj.
Mediana: realização que ocupa a posição central da série de
observações, quando estão ordenadas em ordem crescente.
Medidas de posição:
Média
Mediana
A comparação entre a
média e a mediana indica
a assimetria da
distribuição.
MEDIANA: Muito interessante para grande massa de dados.
Menos suscetível a valores extremos (mais indicada que
a média em casos de grande dispersão)
Medidas de dispersão:
São utilizadas quando se quer dar informação sobre a variabilidade
do conjunto de observações.
n
2
(
)
∑ Xi − X
Variância:
s2 ( X ) =
i =1
n −1
n
2
(
)
X
−
X
∑ i
Desvio padrão: s ( X ) =
i =1
n −1
= s2 ( X )
Quantis e box-plot:
QUARTIS: Q1, Q2, Q3 – Dividem os valores ordenados em quatro
subconjuntos com iguais números de elementos.
DECIS: D1, D2, …, D10 – Dividem os valores em 10 subconjuntos.
PERCENTIS:P1,P2, …,P100–Dividem os valores em 100 subconjuntos.
Para casa:
• Lista de Exercícios 6 (site: www.mec.ita.br/~rodrigo/)
• Leitura: Devore – caps. 1 e 6.2 (Métodos de Estimativa Pontual)
ou Walpole et al. – caps. 1 e 9.14 (Estimação de MV)
Download

Slides