Estatística para Negócios
Gerson Bronstein, M.Sc.
Mônica Barros, D.Sc.
Julho de 2002
Quem somos nós?
‰ Mônica Barros
ƒ Doutora em Séries Temporais – PUC-Rio
ƒ Mestre em Estatística – University of Texas at Austin,
EUA
ƒ Bacharel em Matemática – University of Washington,
Seattle, EUA
ƒ Professora da PUC-Rio (Depto. De Eng. Elétrica) e
IBMEC, Consultora, ex-gerente de risco da EL Paso
Merchant e ex-assistente do Presidente da PETROS.
ƒ E-mail: [email protected], [email protected]
ƒ Home page: http://www.mbarros.com
2
Quem somos nós?
‰ Gerson Bronstein
Mestre em Administração, COPPEAD/UFRJ
Mestre em Engenharia Elétrica, COPPE/UFRJ
Engenheiro Eletrônico, UFRJ
Coordenador Acadêmico e Professor das disciplinas Métodos
Quantitativos e Gestão Financeira dos Programas In-Company do
Ibmec
ƒ Possui mais de 15 anos de experiência como pesquisador do
Núcleo de Computação Eletrônica da UFRJ na área de
Engenharia de Computação
ƒ Atuou por mais de 5 anos como professor da Escola de
Engenharia e Instituto de Matemática da UFRJ, em disciplinas
relacionadas à Engenharia de Computação e Sistemas
ƒ Atuou também como consultor em empresas como Booz, Allen e
Hamilton e K2 Achievements
ƒ
ƒ
ƒ
ƒ
3
Sumário
‰ Apresentação do curso
‰ Estatística descritiva
‰ Análise multivariada
‰ Introdução à probabilidade
‰ Distribuições discretas de probabilidade
‰ Distribuições contínuas de probabilidade
‰ Distribuições amostrais e Intervalos de Confiança
‰ Testes de hipóteses
‰ Regressão Linear
4
Apresentação do curso
‰3 aulas expositivas (16hs)
‰Objetivos
‰ Apresentar os conceitos básicos de probabilidade
e estatística
‰ Fornecer instrumentos quantitativos de suporte
às demais disciplinas do curso
‰ Disponibilizar ferramentas de apoio – HP-12C e
Excel
5
Apresentação do curso
‰Bibliografia de apoio
‰ Zentgraf, Roberto – Estatística Objetiva, 1a ed., ZTG
Editora ([email protected]) – livro texto
‰ Barros, M – Probabilidade: um curso introdutório –
Editora Papel Virtual, Rio de Janeiro
‰ Anderson, Sweeney e Williams – Statistics for
Business and Economics, 8a ed., South-Western
College Publishing
‰ Levine, Berenson e Stephan - Estatística: Teoria e
Aplicações usando Microsoft Excel em Português –
LTC Editora, Rio de Janeiro
6
Estatística Descritiva
‰ É um um conjunto de técnicas e procedimentos
destinados à apresentação e descrição sumária de
um conjunto de dados (amostra)
‰ Os elementos da amostra são apresentados em
tabelas ou gráficos, sendo que estes últimos
permitem observar algumas características
particulares do conjunto de dados
‰ Os dois principais conjuntos de informações
descritivas acerca de uma amostra são as medidas
de posição / tendência central e as medidas de
dispersão
7
Organizando e apresentando
os dados
‰ Distribuição de freqüências – agrupamento de
dados em classes (ou categorias) e suas respectivas
freqüências ( ou número de ocorrências)
‰ Cada categoria é definida pelos seus limites inferior e
superior
‰ O número de classes deve ser tal que permita a obtenção
de informações a respeito da amostra – evite um número
muito grande ou muito pequeno de classes
‰ Sempre que possível, utilize classes de mesma amplitude
‰ Histogramas – Uma forma de representação gráfica
da distribuição de freqüências
‰ Outras formas de representação gráfica: gráfico de
torta, gráficos de ogiva (polígono de freqüências)
8
Organizando e apresentando
os dados – exemplo – velocidade de
carros na BR 101
63
78
87
91
101
107
69
80
87
96
102
110
69
81
88
98
103
111
75
83
89
98
103
111
75
83
90
98
104
114
76
84
90
99
105
115
76
84
90
100
105
115
77
85
90
101
107
116
78
86
90
101
107
117
78
86
91
101
107
118
9
Organizando e apresentando
os dados – exemplo – velocidade
dos carros – distrib. de freqüência e histograma
‰ Distribuição de freqüências (10 classes) e histograma
Limite Inferior
60
66
72
78
84
90
96
102
108
114
Limite Superior
66
72
78
84
90
96
102
108
114
120
Ocorrências
1
2
5
7
9
7
10
10
3
6
10
9
8
7
6
5
4
3
2
1
0
1
2
3
4
5
6
7
8
9
10
10
Medidas de posição ou tendência
central
‰ As medidas de posição, também chamadas de
percentis, definem um determinado valor dentro do
conjunto de dados. As mais comuns são:
‰ Máximo
‰ Mínimo
‰ Quartis
‰ Decis
‰ As medidas de tendência central definem o centro da
distribuição, segundo um determinado critério. As
mais comuns são:
‰ Média (ou média aritmética)
‰ Mediana
‰ Moda
11
Medidas de tendência central
‰ Média – valor médio dos elementos da amostra
‰ Fórmula da média para dados não agrupados
(tratados individualmente)
‰ Para o exemplo anterior, a média é 93.65
n
x1+ x2 + L + xn
1
Média = x =
xi =
n i =1
n
∑
12
Medidas de tendência central
‰
‰
Fórmula da média para dados agrupados (diagrama
de freqüência, onde xi é o valor médio do intervalo i e fi
é a freqüência do intervalo i)
Para o exemplo anterior, a média é 94,20
n
Média = x =
∑ fi xi
i =1
n
∑ fi
=
f1 x1+ f 2 x2 + L + f n xn
f1 + f 2 + L + f n
i =1
13
Medidas de tendência central
‰ Mediana – divide os elementos da amostra em duas
partes iguais (o conjunto deve estar ordenado)
‰ Se o número de elementos (n) do conjunto for ímpar, a
mediana é o elemento de ordem (n+1)/2
‰ Se o número de elementos for par, a mediana é a média entre
os elementos de ordem n/2 e (n+2)/2
‰ Para o exemplo anterior, a mediana é (91+91)/2 = 91
‰ Moda – valor que ocorre com maior freqüência
‰ Pode haver mais de uma moda
‰ Para o exemplo anterior, a moda é 90 (5 ocorrências)
‰ Embora a mediana e a moda também possam ser
calculadas para dados agrupados, nós não
abordaremos esse assunto aqui
14
Medidas de posição
‰ Quartis – dividem a amostra em 4 partes iguais
(atenção: existem 3 quartis!)
‰ Para uma amostra com n elementos, o primeiro quartil (Q1) será
o elemento de ordem n/4, o segundo (Q2) o elemento 2n/4 e o
terceiro (Q3) o elemento 3n/4
‰ Se as ordens dos elementos referentes aos quartis resultarem
em números fracionários, arredonde-os para cima
‰ Se as ordens resultarem em números inteiros, tome a média
aritmética deste com o seguinte
‰ No exemplo anterior, as ordens dos quartis são 15, 30 e 45.
Portanto, os quartis são (x15+x16)/2, (x30+x31)/2 e (x45+x46)/2
‰ Os quartis são 83,5, 91 e 104,5
‰ Observe que Q2 é sempre igual à mediana
15
Medidas de posição
‰ Máximo – maior valor da amostra
‰ Para o exemplo anterior, o máximo é 118
‰ Mínimo – menor valor da amostra
‰ Para o exemplo anterior, o mínimo é 63
‰ Decis – semelhante aos quartis, só que dividem a
amostra em 10 partes iguais
‰ A forma de cálculo é semelhante a dos quartis
‰ Embora os quartis e decis (ou qualquer outro percentil)
também possam ser calculados para tados agrupados,
nós não abordaremos esse assunto aqui
16
Algumas observações sobre as
medidas de posição e tendência
‰ Como as medidas de posição (mediana, moda, quartis e
decis) são calculadas em função da posição relativa dos
elementos de uma amostra, elas são insensíveis a
valores extremos
‰ Essas medidas são chamadas de robustas
‰ Ao contrário, a média leva em conta o valor dos
elementos de uma amostra, portanto é afetada por
valores extremos da amostra
17
Medidas de dispersão
‰ Como o próprio nome diz, as medidas de dispersão
medem a dispersão ou espalhamento (absoluto ou
relativo) dos elementos de uma amostra
‰ As principais medidas de dispersão são:
‰ Amplitude
‰ Variância
‰ Desvio-padrão
‰ Amplitude interquartílica
‰ Coeficiente de variação
18
Medidas de dispersão
‰ Amplitude – é a diferença entre os valores máximo e
mínimo
‰ Para o exemplo anterior, a amplitude é 55
‰ Amplitude interquartílica – é a diferença entre o
terceiro e primeiro quartis (Q3 – Q1)
‰ Para o exemplo anterior, a amplitude interquartílica é 21
19
Medidas de dispersão
‰ Variância – mede o desvio quadrado médio em relação
à média dos elementos de uma amostra
‰ Fórmula da variância para dados não agrupados
‰ Para o exemplo anterior, a variância é 189,18
1 n
s =
( xi − x ) 2
n − 1 i =1
2
∑
ou
1  n 2
2
s =
 x − nx 
n − 1  i =1

2
∑
Atenção: a variância é sempre ≥ 0 !!!!!
20
Medidas de dispersão
‰
Fórmula da variância para dados agrupados (xi é o
valor médio do intervalo i e fi é a freqüência do
intervalo i)
‰ Para o exemplo anterior, a variância é 185,76
n
2
s =
∑
i =1
( xi − x ) 2 f i
n
∑ fi
i =1
ou
s2 =
n
n
i =1
i =1
∑ xi2 fi − x 2 ∑ fi
n
∑ fi
i =1
21
Medidas de dispersão
‰ Desvio-padrão – é a raiz quadrada da variância
‰ Para o exemplo anterior com dados não agrupados, o desviopadrão é 13,75
‰ Para o exemplo anterior com dados agrupados, o desvio-padrão
é 13,63
‰ Coeficiente de variação – mede a dispersão dos
elementos da amostra em relação à média. Sua fórmula
é: CV = s
x
‰ Para o exemplo anterior com dados não agrupados, o
coeficiente de variação é 0,19
22
Interpretando o desvio-padrão
‰ O desvio-padrão é expresso na mesma unidade que
os valores da amostra, ao contrário da variância, que é
expressa em unidades2. Daí, pela definição anterior,
segue que o coeficiente de variação é adimensional.
‰ Em geral, devemos esperar que valores mais
afastados da média (em desvios-padrão) tenham
menor chance de ocorrer.
‰ Para uma amostra com distribuição simétrica e em
formato de sino, encontraremos aproximadamente
‰ 68% dos valores estarão no intervalo x ± 1.s
‰ 95% dos valores estarão no intervalo x ± 2.s
‰ 100% dos valores estarão no intervalo x ± 3.s
23
O desvio-padrão como medida de
risco
‰ Exemplo – considere dois fundos de investimento, A e
B, e seus respectivos retornos nos últimos 12 meses
(em %)
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Nov
Dez
Fundo A
5,25
4,37
5,36
5,64
4,77
4,51
4,82
4,93
5,39
5,29
4,68
5,04
Fundo B
1,23
2,28
3,40
7,00
6,75
7,47
7,28
5,29
10,7
5,37
-0,2
3,45
Em qual dos dois fundos você colocaria o seu dinheiro?
24
O desvio-padrão como medida de
risco
‰ Para ambos os fundos, R$100 aplicados em janeiro
equivaleriam a aproximadamente R$180 em dezembro
‰ No entanto o desvio-padrão dos retornos do Fundo A é de
0,39% enquanto que para o Fundo B o desvio-padrão é de
3,10%, ou seja, o padrão de retornos do Fundo A oscilou
muito menos em torno da média (foi mais homogêneo)
que no Fundo B
25
O desvio-padrão como medida de
risco
‰ Em Finanças, associamos a dispersão ao risco de um
investimento
‰ E a teoria financeira diz também que um investidor
racional exige retornos mais elevados para assumir riscos
maiores
‰ Portanto, admitindo que você é um investidor racional, o
Fundo A é mais atrativo que o Fundo B, pois para o
mesmo retorno esperado em ambos os fundos você corre
menos risco no Fundo A!
26
Algumas palavras sobre amostra e
população
‰ População – conjunto de todos os possíveis elementos
pertencentem a uma mesma classe, sujeitos a uma
análise, pesquisa etc.
‰ População de votantes do Brasil – todos os brasileiros que
possuem título de eleitor
‰ Um brasileiro que não possua título de eleitor ou um polonês
não pertencem à população de votantes do Brasil
‰ Amostra – um subconjunto de uma população
27
Algumas palavras sobre amostra e
população
‰ Até o momento, estamos calculando os parâmetros de
amostras
‰ O termo n – 1 presente no denominador da fórmula da
variância (e do desvio-padrão) é utilizado para torná-lo
um estimador não tendencioso
‰ Normalmente, os parâmetros de uma amostra (média,
desvio-padrão), serão denotados por x e s
‰ Para os parâmetros da população, utilizamos µ e σ
28
Utilizando a HP-12C e o Excel®
‰ Com a HP-12C, você consegue calcular a média e
desvio-padrão para a população e amostra
‰ As teclas utilizadas são < x >, <s>, <Σ+> e < Σ->
‰ Exemplo: considere o seguinte conjunto de dados: 4, 2,
5, 9, 3, 6 e 1
‰ A média é 3,57 e o desvio-padrão é 1,99
‰ Vejamos como utilizar a HP-12C
29
Utilizando a HP-12C e o Excel®
Tecla
Visor
Descrição
<f><Σ>
0,00 Limpa os registros estatísticos
4<Σ+>
1,00 Primeiro dado inserido
2<Σ+>
2,00 Segundo dado inserido
5<Σ+>
3,00 Terceiro dado inserido
8<Σ+>
4,00 Ops! Dado incorreto
8<g><Σ–>
3,00 Corrijo o dado incorreto
9<Σ+>
4,00 Quarto dado inserido
3<Σ+>
5,00 Quinto dado inserido
6<Σ+>
6,00 Sexto dado inserido
1<Σ+>
7,00 Último dado inserido
<g>x
4,29 Média
<g>s
2,69 Desvio-padrão da amostra
30
Utilizando a HP-12C e o Excel®
‰ O Excel possui diversas funções que permitem o cálculo das
estatísticas descritivas
Função
Descrição
maximo(lista)
Máximo (maior valor) da lista
minimo(lista)
Mínimo (menor valor) da lista
media(lista)
Média (aritmética) dos valores da lista
med(lista)
Mediana da lista
modo(lista)
Moda da lista
quartil(lista;k)
k-ésimo quartil da lista
var(lista)
Variância amostral da lista (n-1)
varp(lista)
Variância populacional da lista
desvpad(lista)
Desvio-padrão amostral da lista
desvpadp(lista)
Desvio-padrão populacional da lista
percentil(lista;k)
k-ésimo percentil da lista
cont.num(lista)
Número de elementos da lista
31
Exemplo – para casa
‰ Os dados do gráfico a seguir representam a
temperatura máxima na estação Santa Cruz, na
cidade do Rio de Janeiro, entre Janeiro de 1982
e Dezembro de 1991.
‰ Os dados estão no arquivo stat_case1.xls.
‰ Use o Excel para:
‰ Calcular a média, mediana, moda, máximo,
mínimo, variância, desvio padrão, quartis,
percentis 10%, 20%,..., 90% dos dados.
‰ Fazer um histograma dos dados.
32
n/
m 82
ai
/8
se 2
t/8
ja 2
n/
m 83
ai
/8
se 3
t/8
ja 3
n/
m 84
ai
/8
se 4
t/8
ja 4
n/
m 85
ai
/8
se 5
t/8
ja 5
n/
m 86
ai
/8
se 6
t/8
ja 6
n/
m 87
ai
/8
se 7
t/8
ja 7
n/
m 88
ai
/8
se 8
t/8
ja 8
n/
m 89
ai
/8
se 9
t/8
ja 9
n/
m 90
ai
/9
se 0
t/9
ja 0
n/
m 91
ai
/9
se 1
t/9
1
ja
Exemplo – para casa
Temperaturas Máximas - 1982 a 1991
37
35
33
31
29
27
25
23
33
Análise Multivariada
‰ Até agora, nós estudamos medidas númericas que
caracterizam uma única variável por vez
‰ Muitas vezes precisamos analisar a relação existente
entre duas ou mais variáveis
‰ Nós veremos a seguir duas dessas medidas
‰ Covariância
‰ Coeficiente de correlação
34
Covariância
‰ A covariância é uma medida da força da relação
linear entre duas variáveis
‰ A fórmula da covariância de uma amostra é dada por
n
∑ ( xi − x )( yi − y )
s xy = cov xy = i =1
n −1
Observe que para o cálculo da covariância, os valores
relativos às duas variáveis devem estar emparelhados
35
Covariância
‰ Exemplo: uma grande loja de varejo deseja investigar a relação
entre o número de comerciais (x) apresentados na TV e o
volume de vendas na semana seguinte ao comercial (y). A
tabela abaixo resume os dados
Semana
# de
comerciais
Vendas (R$
000)
65
1
2
50
60
2
5
57
55
3
1
41
4
3
54
5
4
54
45
6
1
38
40
7
5
63
8
3
48
9
4
59
10
2
46
50
35
30
0
2
4
36
6
Covariância
‰ Pela análise do gráfico do volume de vendas x e
número de comerciais, aparentemente existe uma
relação linear forte entre as duas variáveis
‰ Calculando a covariância, obtemos:
x =3
y = 51
s xy = 11
37
Covariância – interpretação gráfica
‰ Observe que a variância é obtida pelo produto dos
desvios das variáveis em relação às suas médias
‰ Considere o gráfico abaixo
‰ Para os quadrantes I e III este produto é positivo,
enquano que para os quadrantes II e IV, é negativo
65
x=3
60
II
I
55
50
y = 51
45
III
40
IV
35
30
0
2
4
6
38
Covariância – interpretação gráfica
‰ Se sxy é positivo, os pontos que exercem maior
influência estão localizados nos quadrantes I e III,
indicando uma relação linear positiva entre x e y
‰ Se sxy é negativo, os pontos que exercem maior
influencia estão localizados nos quadrantes II e IV,
indicando uma relação linear negativa entre x e y
‰ Finalmente, se sxy é nulo ou próximo de zero, os
pontos se encontram distribuidos uniformemente ao
longo dos 4 quadrantes, não indicando nenhuma
relação linear entre x e y
39
Problemas com a covariância
‰ Voltando ao exemplo anterior, parece haver uma
forte relação linear positiva entre x e y, levando a um
valor alto para sxy
‰ Mas, o que é um valor alto???
‰ A covariância possui dois grandes problemas:
‰ Depende da unidade utilizada nos valores de x e y – se as
vendas fossem expressas em R$ (e não R$000), a variância
seria 11.000 e não 11
‰ É difícil dizer, a princípio, se sxy é grande ou não – é
expressa em uma base absoluta.
40
Coeficiente de correlação
‰ Como a covariância, o coeficiente de correlação
mede a força da relação linear entre duas variáveis
emparelhadas
‰ Sua fórmula é dada por:
rxy =
s xy
sx s y
‰ Ou seja, o coef. de correlação é apenas a
covariância “padronizada” pelos desvios-padrões
das duas variáveis (x e y)
41
Coeficiente de correlação
‰
Ao contrário da covariância, -1 ≤ rxy ≤ +1, e rxy é
ADIMENSIONAL!
‰ Quanto mais próximo de +1, mais forte é a relação linear
positiva entre x e y
‰ Quanto mais próximo de –1, mais forte é a relação linear
negativa entre x e y
‰ Valores próximos de zero indicam ausência de
relação linear entre x e y
42
Coeficiente de correlação
‰ No exemplo anterior, temos:
s xy = 11
s x = 1,49
s y = 7,93
rxy =
s xy
sx s y
=
11
= 0,93
1,49.7,93
Realmente, as variáveis x e y apresentam uma forte
relação linear!
Note que A COVARIÂNCIA E O COEFICIENTE DE
CORRELAÇÃO MEDEM APENAS A INTENSIDADE DA
RELAÇÃO LINEAR ENTRE AS DUAS VARIÁVEIS!!!!
43
Exemplo – Risco de um Portfolio
‰ A teoria moderna de Finanças diz que devemos
diversificar o nossa carteira de investimento a fim de
diminuir o risco.
‰ Como já vimos anteriormente, a principal medida de
risco utilizada é o desvio-padrão do retorno dos
ativos.
‰ A partir da tabela a seguir com os retornos mensais
de 2 ativos A e B, calcule:
‰ (a) a média e o desvio-padrão dos retornos de cada um
deles;
‰ (b) a média e o desvio-padrão dos retornos de uma carteira
composta de 50% do ativo A e 50% do ativo B;
‰ (c) idem, com 75% de A e 25% de B. Que conclusões você
44
pode tirar?
Exemplo – Risco de um Portfolio
Mês
Ativo A
Ativo B
1
-11,5%
0,6%
2
10,0%
11,9%
3
1,6%
-14,5%
4
-9,2%
-0,4%
5
1,0%
-6,0%
6
-8,9%
7,9%
7
20,4%
17,3%
8
3,0%
-10,3%
9
-9,3%
-17,8%
10
11,3%
6,5%
11
1,3%
-4,6%
12
0,0%
-4,4%
‰As fórmulas para o
cálculo da média e
desvio-padrão de uma
carteira são dadas a
seguir:
x port = wA x A + wB xB
2
s 2port = wA2 s A2 + wB2 s B2 + 2 wA wB s AB
wA = peso de A no portfolio
wB = peso de B no portfolio
45
Exemplo – Risco de um Portfolio
‰ Solução:
‰ xA = 0,806%, xB = -1,156%; sA = 9,274%; sB = 10,168%
‰ Portfolio A: x = -0,175%; s = 8,459%
‰ Portfolio B: x = 0,316%; s = 8,544%
‰ Nos dois portfolios, o risco apresentado foi menor do
que os riscos dos ativos individuais
‰ O retorno médio para ambos os portfolios ficou
situado entre os retornos médios dos ativos
individuais
‰ Conclusão – conseguimos diversificar parte do risco,
46
mas à custa de parte do retorno
Análise multivariada –
considerações finais
‰ Como na seção anterior, as fórmulas para variância e
coeficiente de correlação aqui apresentadas referemse a amostras
‰ Para a população, as fórmulas são as seguintes:
n
σ xy = cov xy =
ρ xy =
∑ ( xi − µ X )( yi − µY )
i =1
n
σ xy
σ xσ y
47
Utilizando o Excel®
‰Funções do Excel para análise multivariada
Função
Descrição
covar(x;y)
Calcula a covariância populacional entre x e y. Para calcular
a covariância amostral, multiplique o resultado obtido por n e
divida por n – 1 (n = número de pontos da amostra)
correl(x;y)
Calcula o coeficiente de correlação populacional entre x e
y.Para calcular o coeficiente de correlação amostral,
multiplique o resultado obtido por n e divida por n – 1 (onde n
é o número de pontos da amostra)
48
Exemplo – para casa
‰ O arquivo stat_case2.xls contém as vendas
mensais de automóveis (no mercado interno),
aparelhos de TV e videocassete no período entre
Janeiro de 1995 e Dezembro de 1997.
‰ Use o Excel para:
‰ Fazer o gráfico da evolução de cada variável ao longo do
tempo
‰ Fazer o gráfico de dispersão das vendas de cada variável
versus cada uma das outras (auto x TV, auto x video, TV x
video)
‰ Calcular as covariâncias entre todos os pares de variáveis
‰ Calcular os coeficientes de correlação entre todos os pares
de variáveis
49
Probabilidades – Introdução
‰ Probabilidade faz parte do nosso dia a dia, por
exemplo:
‰ “A previsão da meteorologia é de (grande chance de) chuvas
ao final do dia”
‰ “O Flamengo possui (MUITAS!!!) chances matemáticas de
chegar à final”
‰ A probabilidade do candidato XYZ chegar ao 2o. Turno das
eleições presidenciais é pequena...
‰ A probabilidade da taxa SELIC cair na próxima reunião do
COPOM é alta...
50
Probabilidades – Introdução
‰ Em resumo: estamos SEMPRE falando sobre
probabilidades no nosso dia a dia, resta saber como
quantificá-las, e quais os MODELOS mais comuns
na prática.
‰ Na terminologia usual, a probabilidade reflete a
chance de um determinado evento ocorrer
‰ Quanto maior a probabilidade, maiores as chances
de ocorrência
‰ IMPORTANTE: probabilidade é um número entre
0 e 1 sempre!
51
Probabilidades – Introdução
‰ E por que é necessário estudar probabilidades?
‰ Sempre que lidamos com experiências aleatórias, ou seja,
toda vez em que o “mundo” não é determinístico (quase
sempre...)
‰ Experiência aleatória
‰ Aquela cujo resultado não pode ser conhecido antes da
realização da mesma, por exemplo:
ƒ O resultado da jogada de um dado;
ƒ O número de carros que passam num posto de pedágio num
intervalo de meia hora;
ƒ A cotação do dólar em 02/03/2005;
ƒ Os números que vão “sair” no concurso da Mega-Sena da
próxima semana.
52
Probabilidades – Introdução
‰Mas... note que, embora você não saiba
exatamente qual o resultado da experiência
aleatória, também não existe ignorância
completa sobre o assunto!!!
‰ No exemplo do dado, é claro que os resultados
possíveis são {1, 2, 3, 4, 5, 6}, as faces do dado;
no caso da Mega-Sena, o conjunto de valores
possíveis são os 6 números sorteados no
conjunto {0, ..., 50} e nos outros exemplos
podemos estabelecer um intervalo de valores
máximos e mínimos!
53
Probabilidades – algumas definições
‰ Experimento ou Experiência Aleatória – atividade
objeto do estudo
‰Jogar um dado 5 vezes consecutivas
‰Escolher ao acaso um nome da lista telefônica
‰A cotação do dólar em 02/03/2002
54
Probabilidades – algumas definições
‰ Espaço Amostral ou Universo – conjunto de todos
os possíveis resultados que podem ocorrer em um
experimento
‰ Todas as possíveis combinações de 5 arremessos
consecutivos de um dado (7.776)
‰ Total de nomes da lista telefônica do Rio de Janeiro (???)
‰ Valores entre R$ 1.50 e 150 reais (cotação do dólar em
02/03/2005)
‰ Evento – um conjunto de possíveis resultados de um
experimento
ƒ Seqüências de 5 valores diferentes
ƒ Nomes que comecem com P e tenham 5 letras
ƒ Cotação do dólar entre 3.8 e 8.5 reais em 02/03/2005
55
Probabilidades – algumas definições
‰ Complemento de um evento A ou Ac – todos os
elementos do espaço amostral que não pertencem a A
‰ Se a probabilidade de um evento A for p (decimal), a
probabilidade de Ac será 1 – p
‰ Eventos mutuamente exclusivos A e B – os
elementos de A não pertencem a B e vice-versa
‰ A ocorrência do evento A implica na não ocorrência do evento B
e vice-versa
‰ Eventos coletivamente exaustivos A e B – a união
dos elementos de A e B formam o espaço amostral
56
Probabilidades – métodos de cálculo
‰ Existem dois métodos quantitativos para a determinação
de probabilidades de ocorrência de eventos.
‰ O primeiro, chamado de Método Clássico, assume que
todos os elementos do espaço amostral são
equiprováveis e a probabilidade de ocorrência de um
determinado evento A, P(A), é definida como o número de
resultados favoráveis (pertencentes ao evento), N(A), dividido
pelo número total de resultados possíveis (espaço amostral),
N(U).
N ( A)
P ( A) =
N (U )
57
Probabilidades – métodos de cálculo
‰ Exemplo: Considere o lançamento de dois dados não
viciados. Qual é a probabilidade da soma dos valores obtidos
ser 5?
‰ Solução:
‰ O espaço amostral contém 36 elementos (6 possibilidades para
o primeiro dado e 6 possibilidades para o segundo dado)
‰ O evento considerado possui 4 elementos – os pares (1,4),
(4,1), (2,3) e (3,2)
‰ A probabilidade de A, P(A), é dada por:
P ( A) =
N ( A) 4
=
= 0,11
N (U ) 36
58
Probabilidades – métodos de cálculo
‰ No segundo método, chamado de Método da Freqüência
Relativa, não podemos assumir que todos os elementos
do espaço amostral são equiprováveis
‰ Desta
forma,
devemos
obter
alguma
amostra
representativa do espaço amostral e utilizar a proporção de
elementos favoráveis da amostra em relação ao tamanho total
da amostra como estimativa da probabilidade do evento A
‰ As conclusões obtidas por esse método somente serão
válidas se as amostras utilizadas mantiverem as mesmas
características e condições da população (espaço amostral)
59
Probabilidades – definição
freqüência relativa
‰ Seja E uma experiência aleatória, e supomos que a
experiência pode ser repetida n vezes, sempre nas
mesmas condições. Sejam A e B eventos quaisquer, e
na e nb representam o número de ocorrências dos eventos
A e B nas n repetições da experiência E.
‰ Por exemplo, suponha que E é a experiência: jogar um
dado e observar o número que saiu. Seja A o evento:
saiu um número par, e B o evento: saiu o número 6.
‰ Joga-se o dado 20 vezes, e observa-se as seguintes
freqüências para cada face do dado:
60
Probabilidades – definição
freqüência relativa
face do dado
freqüência
1
4
2
4
3
3
4
5
5
2
6
2
‰ Então : na = 11 e nb = 2, e n = 20 (número de repetições
da experiência).
‰ Intuitivamente, se tivéssemos jogado o dado um número
bem maior de vezes, nós nos sentiríamos mais confiantes
em afirmar que a probabilidade de uma das faces do
dado seria igual ao número de vezes em que aquela face
"saiu" dividido pelo número de repetições da experiência.
61
Probabilidades – definição
freqüência relativa
‰ Definição - Freqüência relativa
‰ A freqüência relativa de um evento A, denotada por fA
é definida por:
fA = na / n
‰ onde na indica o número de ocorrências do evento A
dentre as n repetições da experiência.
‰ A partir da definição vemos que as freqüências relativas
dos eventos A e B são, respectivamente, 11/20 = 0.55 e
2/20 =0.10 .
62
Probabilidades – métodos de cálculo
‰ Exemplo: De um total de 5.000 nascimentos, 394 foram
de gêmeos, trigêmeos ou mais. Qual a probabilidade de
ocorrer o nascimento de uma única criança (não
gêmeo)?
‰ Solução:
‰ A amostra é composta por 5.000 elementos
‰ O evento considerado possui 5.000 – 394 = 4.606 elementos
‰ A probabilidade de A, P(A), é dada por:
N ( A) 4606
=
= 0,9212
P ( A) =
N (U ) 5000
63
Probabilidades – algumas definições
‰ Espaço amostral e eventos – representação gráfica
(Diagrama de Venn)
Espaço Amostral
Evento A
Interseção entre os eventos A e B
Evento B
64
Probabilidades – algumas definições
‰ Eventos complementares – o complemento de A (Ac) é
composto por todos os elementos do espaço amostral
que não pertencem a A
Espaço Amostral
Ac
A
65
Probabilidades – algumas definições
‰ Eventos mutuamente exclusivos – os elementos de A
não pertencem a B e vice-versa
‰ Obseve que dois eventos complementares são mutuamente
exclusivos
Espaço Amostral
A
B
66
Probabilidades – algumas definições
‰ Eventos coletivamente exaustivos – a união de todos os
elementos pertencentes a esses eventos forma o
espaço amostral
‰ Eventos coletivamente exaustivos podem ser mutuamente
exclusivos (quando não há interseção entre eles) ou não
Espaço Amostral
A
B
C
67
Leis da Adição
‰ As leis da adição são úteis quando quando temos dois
ou mais eventos e desejamos calcular a probabilidade
de que pelo menos um deles ocorra
‰ Antes, vamos discutir dois conceitos importantes: a
união e a interseção de eventos
‰ A união de dois eventos A e B é um evento C composto
por todos os elementos pertencentes a A, B ou ambos,
denotada por A ∪ B
‰ A interseção de dois eventos A e B é um evento C
composto por todos os elementos pertencentes
simultaneamente a A e B, denotada por A ∩ B
68
Leis da adição – caso geral
P(A+B) = P(A ou B) = P(A ∪ B) = P(A) + P(B) – P(A ∩ B)
‰ A razão do último termo da fórmula e que quando somamos
P(A) e P(B) estamos contando duas vezes P(A ∩ B)
A∩B
Espaço Amostral
A
B
69
Leis da Adição – casos particulares
‰ Eventos mutuamente exclusivos
‰ P(A+B) = p(A) + p(B), já que P(A ∩ B) = 0
‰ Eventos complementares
‰ P(A+B) = P(A) + P(B) = 1, já que P(A ∩ B) = 0
‰ Eventos coletivamente exaustivos
‰ P(A+B) = P(A) + P(B) – P(A ∩ B) = 1
‰ Eventos coletivamente exaustivos e mutuamente exclusivos
‰ P(A+B) = P(A) + P(B) = 1, já que P(A ∩ B) = 0
70
Leis da Adição - exemplo
‰ Um banco possui 10 fundos de investimento. Desses, 6 são
de renda fixa, 4 são corporativos e 2 são de renda fixa e
corporativos. Se escolhermos um fundo ao acaso, qual é a
probabilidade dele ser de renda fixa ou corporativo?
‰ Solução (evento A: renda fixa evento B: corporativo)
‰ Universo = 10 elementos
‰ P(A+B) = P(A) + P(B) – P(A ∩ B)
‰ P(A) = 6/10 = 0,6
‰ P(B) = 4/10 = 0,4
‰ P(A ∩ B) = 2/10 = 0,2
‰ P(A U B) = 0,6 + 0,4 – 0,2 = 0,8 ou 80%
71
Exemplo - para casa
‰ Uma empresa de TV a cabo possui 10000 clientes.
Destes, 3500 assinam o pacote de programação
premium, e 6000 possuem mais de um “ponto”
instalado
em
casa.
2000
clientes
são,
simultaneamente, assinantes premium com mais de
um “ponto” instalado. Escolhe-se um cliente ao acaso.
Qual a probabilidade dele ser assinante premium ou
ter mais de um “ponto” instalado em casa?
72
Leis da Multiplicação
‰ Eventos independentes – a ocorrência de A não influencia B e
vice-versa
‰ Dois arremessos consecutivos de uma moeda
‰ As idades das próximas duas pessoas a entrar em um banco
‰ Probabilidade de ocorrência de dois eventos independentes
‰ P(A x B) = P(A e B) = P(A ∩ B) = P(A) x P(B)
‰ Exemplo: qual a probabilidade de ocorrência de exatamente 3 caras
em três arremessos consecutivos de uma moeda?
‰ P(cara) = 0,5
‰ P(3 caras) = 0,5 x 0,5 x 0,5 = 0,125
73
Leis da Multiplicação
‰ Exemplo: qual a probabilidade de ocorrência de pelo
menos uma cara em três arremessos consecutivos de
uma moeda?
‰ Método A: (c – cara o – coroa)
1o
2o
3o
c
c
c
c
c
o
c
o
c
c
o
o
o
c
c
o
c
o
o
o
c
o
o
o
Universo: 8
Elementos favoráveis: 7
P(A): 7/8 = 0,875
74
Leis da Multiplicação
‰ Método B:
‰ Observe que o evento A: “obter pelo menos 1 cara” é
complementar ao evento B:“não obter nenhuma cara”
‰ Conseqüentemente P(A) + P(B) = 1
‰ P(B) = 0,5 x 0,5 x 0,5 = 0,125
‰ Logo, P(B) = 1 – P(A) = 0,875
75
Independência e Dependência
‰Exemplo
‰Tomou-se uma amostra com 1000 pessoas
num shopping-center com o objetivo de
investigar a relação entre renda familiar e
posse de cartões de crédito.
‰A partir dos dados da próxima tabela
pergunta-se: existe independência entre
“renda” e “número de cartões”?
76
Independência e Dependência
Renda Familiar
Núm. Cartões
0
1
2 ou mais
< R$ 500 R$ 501 a R$1000
R$ 1001 a R$ 2000
> R$ 2001
260
50
20
170
100
25
80
110
45
20
60
60
530
320
150
330
295
235
140
1000
‰ Se existe independência entre as duas variáveis, então
Pr(Ai ∩Bj) = Pr(Ai).Pr(Bj) para todos i e j, onde Ai indica o
nível de renda e Bj o número de cartões de crédito. Logo,
basta provar que a igualdade acima não é válida para
ALGUMA célula na tabela para concluir que as duas
variáveis são dependentes. Se olharmos para a célula
superior esquerda vemos que:
77
Independência e Dependência
‰ Pr(renda abaixo de R$ 500 E 0 cartões) = 0.26
‰ Mas:
‰ Pr(renda abaixo de R$ 500) = 330/1000 = 0.33
‰ Pr( 0 cartões de crédito) = 530/1000 = 0.53
‰ E como 0.26 ≠(0.33)(0.53), segue que as variáveis
“renda familiar” e “número de cartões de crédito” são
dependentes.
78
Probabilidade Condicional
‰ Probabilidade condicional – probabilidade de ocorrência
de um evento A dado que o evento B ocorreu
‰ Escrevemos P(A | B)
‰ Para eventos independentes, P(A | B) = P(A) x P(B)
‰ Exemplo: qual a probabilidade de ocorrência de uma
cara em um segundo arremesso de uma moeda, dado
que o primeiro arremesso deu cara?
79
Probabilidade Condicional
‰ Para eventos dependentes, P(A | B) = P(A ∩ B)/P(B)
desde que P(B) seja diferente de zero.
‰ Exemplo: em uma amostra de 100 funcionários de uma
empresa, 35 são homens e fumantes, 28 são homens e
não fumantes, 17 são mulheres fumantes e 20 são
mulheres e não fumantes. Qual a probabilidade de um
funcionário escolhido ao acaso ser fumante, dado que
ele é homem?
80
Probabilidade Condicional
Fumantes
Mulheres
Fumantes
Homens
Não
fumantes
Total
Homens
35
28
63
Mulheres
17
20
37
Total
52
48
100
Não
fumantes
81
Probabilidade Condicional
‰ Observe que quando definimos que o evento B ocorreu (o
funcionário é homem), restringimos o universo para a
ocorrência do evento A (o funcionário é fumante)
‰ O novo universo passa a ser o próprio evento B
Fumantes
Mulheres
Homens
Não
fumantes
Fumant
es
Não
fumantes
Homens
35
28
63
Mulheres
17
20
37
Total
52
48
100
Total
Novo universo
P(A ∩ B)
82
Probabilidade Condicional
‰ Utilizando o número de elementos de cada evento,
temos:
‰ P(A | B) = 35/63 = 0,556
‰ Ou utilizando as probabilidades:
‰ P(B) = 63/100 = 0,63
‰ P(A ∩ B) = 35/100 = 0,35
‰ P(A | B) = P(A ∩ B)/P(B) = 0,35/0,63 = 0,556
83
Exemplo - para casa
‰Um grupo de 100 pessoas inclui 40 com
diploma
de
curso
superior,
20
microempresários e 10 que são, ao mesmo
tempo, portadores de diploma do curso
superior e microempresários.
‰Calcule a probabilidade de alguém ser
microempresário sabendo que ele tem
diploma de curso superior.
84
Distribuições de probabilidade –
algumas definições
‰ Variável aleatória – é aquela cujo valor pode assumir
qualquer um dos possíveis resultados de um experimento
‰ Variáveis aleatórias discretas – são aquelas que podem
assumir apenas valores definidos, por exemplo, número
inteiros ou inteiros positivos. Exemplos: número de
expectadores em uma sessão de cinema, resultado do
lançamento de um dado, número de pessoas numa fila de
banco, número de assaltos numa esquina.
85
Distribuições de probabilidade –
algumas definições
‰ Variáveis aleatórias contínuas – são aquelas que
podem assumir quaisquer valores dentro de um
intervalo. Exemplo: tempo de atendimento em um
caixa de banco, peso real de um pacote de 1 Kg de
açúcar, custo de construção de uma fábrica, custo de
lançamento de uma campanha publicitária de um
novo produto.
‰ Distribuição discreta de probabilidade ou função
de probabilidade – função que associa a cada
possível valor de uma variável aleatória discreta a
sua probabilidade de ocorrência
86
Distribuições discretas de
probabilidade - exemplo
‰ Considere a variável aleatória discreta x que representa o
número de caras em quatro lançamentos de uma moeda.
Determine a sua distribuição de probabilidades
Tabela de Ocorrências
1
c
c
c
c
c
c
c
c
2
c
c
c
c
o
o
o
o
3
c
c
o
o
c
c
o
o
4
c
o
c
o
c
o
c
o
x
4
3
3
2
3
2
2
1
1
o
o
o
o
o
o
o
o
2
c
c
c
c
o
o
o
o
3
c
c
o
o
c
c
o
o
4
c
o
c
o
c
o
c
o
Distribuição de Probabilidades
x
3
2
2
1
2
1
1
0
x
Freq.
Prob.
0
1
0,0
6
1
4
0,2
5
2
6
0,3
8
3
4
0,2
5
4
1
0,0
6
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
4
87
Distribuições de probabilidade –
mais definições
‰ Para qualquer distribuição discreta de probabilidades,
duas condições devem ser satisfeitas:
‰ 0 < pi ≤ 1
‰ Σpi = 1
‰ Valor esperado, média ou esperança matemática E(X) ou µ - de uma distribuição discreta de probabilidades
– é o valor médio obtido para a variável aleatória se o
experimento fosse repetido um número infinito de vezes
‰ Normalmente esse valor é obtido analiticamente ou através de um
número grande de observações
‰ Variância de uma distribuição de probabilidades (σ2) –
mede a dispersão dos valores da distribuição
88
Distribuições de probabilidade –
mais definições
‰ Desvio-padrão de uma distribuição de probabilidades (σ)
– também mede a dispersão dos valores da distribuição.
É igual à raiz quadrada da variância.
‰ Fórmulas (a seguir pi indica a prob. do valor xi)
n
µ = ∑ xi . pi
i =1
n
σ = ∑ ( xi − µ ) 2 pi
2
i =1
σ=
n
∑ (x − µ)
i =1
i
2
pi
89
Distribuições de probabilidade –
mais definições
‰ Função de distribuição ou Função de Distribuição
Acumulada (F(x0))
ƒ Para cada valor x0 da variável aleatória, é a probabilidade de estar
naquele valor, ou abaixo dele, isto é:
ƒ F(x0) = Pr( X ≤ x0) para todo x0
ƒ Note que, como F(x0) é uma probabilidade, ela está limitada ao
intervalo (0,1).
ƒ Algumas funções de distribuição são tabeladas, por exemplo, a da
distribuição Normal (0,1).
ƒ O Excel normalmente fornece a opção de calcular a função de
probabilidade (ou a densidade) ou a função de distribuição
acumulada, através de um argumento lógico nas suas diversas
funções estatísticas – por exemplo, vide o help da função dist.binom
90
Distribuição Uniforme Discreta
‰ Cada ocorrência da variável X tem igual probabilidade de
acontecer
‰ Logo, cada ocorrência tem probabilidade 1/n onde n é o
número de possíveis ocorrências de X
‰ Exemplo: x = valor obtido no lançamento de um dado não
viciado
Distribuição Uniforme
x
Freq.
Prob.
0.20
1
1
0,167
0.15
2
1
0,167
3
1
0,167
4
1
0,167
0.05
5
1
0,167
0.00
6
1
0,167
0.10
1
2
3
4
5
6
91
Distribuição Binomial
‰ A distribuição binomial está associada a experimentos
binomiais, que têm as seguintes características:
‰ Consistem de n tentativas (repetições) idênticas
‰ Em cada tentativa, existem apenas dois resultados possíveis, que
são chamados genericamente de sucesso e fracasso
‰ A probabilidade de um sucesso, representada por p, é constante
ao longo das n tentativas
‰ Conseqüentemente, a probabilidade de um fracasso, 1 – p,
também é constante ao longo das n tentativas
‰ As tentativas são independentes, ou seja, o resultado de uma
tentativa não influencia os resultados das demais
92
Distribuição Binomial
‰ A variável aleatória de interesse corresponde ao número
de sucessos de um experimento, por exemplo:
‰ Número de caras em 4 lançamentos consecutivos de uma
moeda
‰ Número de “6” em dois lançamentos consecutivos de um
dado
‰ Número de questões “chutadas” corretamente numa prova
de múltipla escolha com 10 questões, em que cada questão
tem 5 alternativas (imagine que a prova é em Chinês, e aí
você realmente tem a mesma probabilidade de acerto em
cada questão... Desde que você não saiba falar Chinês, é
claro....)
93
Distribuição Binomial
‰ O número de tentativas em um experimento (com n
tentativas) que proporcionam exatamente x sucessos é
dado por
n
n!
, onde x!= x.( x − 1).( x − 2)L 2.1
 =
 x  x!( n − x)!
Exemplo: considere 4 arremessos de uma bola de basquete
ao cesto. O número de tentativas com 2 bolas certas
(sucesso) é dado por:
 4
4!
4.3.2.1 24
=
=
=6
 =
 2  2!(4 − 2)! 2.1.(2.1) 4
94
Distribuição Binomial
‰ Dado um experimento binomial com n repetições, a
probabilidade de encontrar exatamente x sucessos (com
probabilidade p para cada sucesso) é:
n x
n!
n− x
f ( x) =   p (1 − p )
=
p x (1 − p ) n− x
x!(n − x)!
 x
Exemplo: em uma loja, a probabilidade de um cliente realizar
uma compra é de 15%. Qual a probabilidade de, entre 5
clientes que entram na loja, exatamente 3 realizarem uma
compra?
n = 5; x = 3; p = 0,15
f (3) =
5!
0,153.0,852 = 0,024
3!.2!
95
Distribuição Binomial
‰ Exemplo: considere 10 lançamentos consecutivos de um
dado não viciado. Qual a probabilidade de obtermos
exatamente 5 vezes o número 2?
‰ Embora o lançamento de um dado tenha 6 possíveis
resultados, podemos utilizar a distribuição binomial da
seguinte forma:
‰ Sucesso: obter o número 2
‰ Fracasso: não obter o número 2 (obter 1, 3, 4, 5 ou 6)
n = 10; x = 5; p =
f (3) =
1
= 0,167
6
10!
0,167 5.0,8335 = 0,013
5!.5!
96
Distribuição Binomial
‰A média para a distribuição Binomial é:
E ( x ) = µ = np
‰
E a variância:
σ 2 = np (1 − p )
No exemplo anterior temos:
– Valor esperado: 6.0,167 = 1
– Variância: 6.0,167.(1 – 0,167) = 0,833
97
Distribuição Binomial
‰ Exemplo
‰ No jogo de roleta existem 37 resultados possíveis em cada
rodada (0 a 36). Calcule a probabilidade de obtermos pelo
menos 3 ocorrências do número 16 em 30 tentativas
(experimento A).
‰ Calcule também o valor esperado da variável e a sua variância.
‰ Solução
‰ Podemos considerar um experimento binomial com sucesso =
{ocorrência do número 16} e fracasso = {não ocorrência do
número 16}
98
Distribuição Binomial
‰ Solução (cont.)
‰ Obtermos pelo menos 3 sucessos = obtermos 3, 4, 5, ..., 29
ou 30 sucessos – dá muito trabalho para calcular!
‰ Porém, se considerarmos o experimento B: obtermos 0, 1
ou 2 sucessos vemos que ele é complementar ao
experimento original.
‰ Logo Prob(A) + Prob(B) = 1 ou Prob(A) = 1 – Prob(B)
‰ Para o experimento B, temos n = 30, x = 0, 1 ou 2 e p = 1/37
= 0,027
‰ Calculando, obtemos Prob(B) = f(0) + f(1) + f(2) = 0,44 +
0,37 + 0,15 = 0,96
99
Distribuição Binomial
‰ Solução (cont.)
‰ Então, Prob(A) = 1 – Prob(B) = 1 – 0,96 = 0,04
‰ O valor esperado é n.p = 30.(1/37)= 0,811
‰ A variância é n.p.(1-p)= 30(1/37).(36/37)= 0,788
100
Distribuição Binomial
‰ Exemplo
‰ Numa eleição supõe-se que 30% dos eleitores são
favoráveis a uma certa proposta. Toma-se uma amostra
de tamanho 20 de eleitores da cidade do Rio de Janeiro.
Calcular as probabilidades de 4, 5, 6, 7, 8, 9 ou 10 dos
eleitores na amostra serem favoráveis à proposta.
‰ Solução
‰ Seja X o número de eleitores na amostra que são a favor da
proposta. Então os valores possíveis de X são 0, 1, 2, ....,
20, e X tem distribuição Binomial com parâmetros n = 20 e
p = 0.30.
101
Distribuição Binomial
‰ As probabilidades para os diversos valores de X são
calculadas através da fórmula:
 20 
20!
Pr( X = x) =  .(0.30) x .(0.70) 20− x =
.(0.30) x .(0.70) 20− x
x!(20 − x)!
x 
‰ A tabela a seguir foi produzida usando a função dist.binom
do Excel para x = 4, 5, ..., 10.
x
4
5
6
7
8
9
10
Pr(X =x)
13.04%
17.89%
19.16%
16.43%
11.44%
6.50%
3.08%
102
Distribuição Binomial – Quadro
Resumo - Exemplos
experiência
aleatória
"sucesso"
acertar a
"chutar" a resposta
resposta
numa prova de
da questão
múltipla escolha
onde cada
questão tem 5
opções
nascimento de
menina
uma criança
numa família
jogada de um
sair o número
dado
6
verificar se uma
peça produzida
numa fábrica
tem defeito
peça tem
defeito
"falha"
errar a
resposta
p=
probabilida
de de
"sucesso"
1/5
menino
1/2
sair
qualquer
outro
número
1/6
peça não
tem
defeito
proporção de
peças com
defeito na
população
de peças
n = número de
repetições da
experiência
X = variável
aleatória
Binomial
número de
questões da
prova
número de
respostas
certas na
prova
número de
crianças na
família
número de jogadas
do dado
tamanho da
amostra
número de
meninas na
família
número de
vezes em
que saiu o
número 6 nas
n jogadas do
dado
número de
peças com
defeito na
amostra
103
Exemplo (para casa – use o Excel)
‰ Um exame vestibular consiste em 100 questões de
múltipla escolha, cada uma com 5 respostas possíveis.
Em cada questão, apenas uma resposta é correta.
a) Qual a probabilidade de que uma pessoa que “chute”
todas as questões acerte 35 ou mais questões?
b) Qual a probabilidade desta pessoa acertar entre 17 e
25 (incluindo 17 e 25) questões?
c) Qual o número esperado de questões certas para uma
pessoa que “chute” todas as questões?
104
Exemplo (para casa – use o Excel)
‰ Uma empresa aérea sabe que 20% das pessoas que
fazem reservas aéreas cancelam suas reservas.
‰ A empresa vende 50 passagens para um vôo que
contém apenas 46 lugares. Supondo que as pessoas
cancelam suas reservas de maneira independente,
calcule a probabilidade de que haverá assentos para
todos os passageiros.
105
Exemplo (para casa – use o Excel)
‰ Você arranjou um emprego numa pizzaria que funciona no
sistema de entrega a domicílio. Apenas 5% dos pedidos são de
pizza de lombinho com abacaxi.
‰ Você recebe exatamente 9 pedidos pelo telefone, qual a
probabilidade de, no máximo, 1 pizza de lombinho com
abacaxi ser pedida?
‰ Você recebe exatamente 30 pedidos pelo telefone num dia de
bastante movimento, qual a probabilidade de receber mais de 3
pedidos de pizza de lombinho com abacaxi? Dica: pare e pense
antes de fazer contas desnecessárias!!!!!!
106
Distribuição de Poisson
‰ A distribuição de Poisson está associada a experimentos
de Poisson, que geralmente modelam o número de
ocorrências de um evento dentro de um determinado
intervalo de tempo (ou espaço), por exemplo:
‰ Número de carros que passam por uma estrada no intervalo de
uma hora
‰ Número de buracos por km de uma rodovia
‰ Número de assassinatos num final de semana
‰ Um experimento de Poisson possui as seguintes
características
‰ A probabilidade de uma ocorrência é a mesma para intervalos
iguais
‰ As ocorrências são independentes
107
Distribuição de Poisson
‰ Dado um experimento de Poisson com média de
ocorrências por intervalo igual a µ, a probabilidade de
obtenção de exatamente x ocorrências é dada por
f ( x) = Pr( X = x) =
µ xe− µ
x!
Exemplo: o número médio de clientes que entram em um
banco num período de 15 minutos é 10. Qual a probabilidade
de entrarem extamente 5 clientes em 15 minutos?
µ = 10; x = 5
105 e −10
= 0,0378
f (5) =
5!
108
Distribuição de Poisson
‰ Exemplo
‰ Em uma fábrica de cabos elétricos, o número médio de
defeitos por quilômetro de cabo é 4.
(a) Qual a probabilidade de encontrarmos exatamente 15 defeitos
em 5 quilômetros de cabo?
(b) E qual a probabilidade de encontrarmos mais do que 20 defeitos
por 5 quilômetros de cabo?
109
Distribuição de Poisson
‰ Solução
‰ Observe que a média de defeitos é dada por quilômetro e o item
(a) se refere ao número de defeitos em 5 quilômetros
‰ Podemos assumir que o processo de fabricação é uniforme, logo o
número médio de defeitos independe de qual quilômetro de cabo
estamos nos referindo e a ocorrência de um defeito não interfere
na ocorrência dos demais defeitos – condições necessárias para
um experimento de Poisson
‰ Como a probabilidade de ocorrência de um defeito é a mesma,
independente do km de cabo observado, a média de defeitos em 5
km de cabo = 5 x média de defeitos por km
‰ Então, µ = 5 x 4 = 20 defeitos e x = 15 defeitos
2015 e −20
f ( 4) =
= 0,052
15!
110
Distribuição de Poisson
‰ Solução (cont.)
‰ p(x ≥ 20) = 1 – p(0) + p(1) + ... + p(18) + p(19) ´ muito trabalho!
‰ Uma solução mais prática é utilizarmos a distribuição de Poisson
acumulada (veremos logo a seguir a função do Excel
correspondente)
‰ A função acumulada nos dá a soma das probabilidades desde 0
até x
‰ p(x ≥ 20) = 1 – pacum(19) = 1 – 0,47 – 0,53
111
Distribuição de Poisson
‰ Exemplo
Numa campanha de caridade feita por um programa
de TV em todo o Brasil, o número de pessoas que
contribuem mais de 500 reais é uma variável
aleatória com média de 5 pessoas por programa.
a) Calcule a probabilidade de que, num certo programa, o
número de pessoas que contribuem mais de 500 reais
exceda 8.
b) Faça o gráfico da função de probabilidade.
c) Faça um gráfico da função de distribuição acumulada.
112
Distribuição de Poisson
‰ Solução
Seja X o número de pessoas que contribuem com mais de 500
reais a cada programa. Desejamos calcular Pr{ X > 8}.
Pr{ X > 8} = 1 - Pr{ X ≤ 8} = 1 - F(8)
onde F(.) denota a função de distribuição acumulada.
A tabela a seguir apresenta a função de probabilidade,
a função de distribuição acumulada e seu complemento.
Da tabela segue que Pr( X > 8 ) = 6.81%.
113
Distribuição de Poisson
x
Pr(X = x)
Pr( X <= x)
1- F(x) = Pr(X > x)
0
0.67%
0.67%
99.33%
1
3.37%
4.04%
95.96%
2
8.42%
12.47%
87.53%
3
14.04%
26.50%
73.50%
4
17.55%
44.05%
55.95%
5
17.55%
61.60%
38.40%
6
14.62%
76.22%
23.78%
7
10.44%
86.66%
13.34%
8
6.53%
93.19%
6.81%
9
3.63%
96.82%
3.18%
10
1.81%
98.63%
1.37%
11
0.82%
99.45%
0.55%
12
0.34%
99.80%
0.20%
114
Distribuição de Poisson
b) A função de probabilidade é dada no gráfico abaixo
Função de Probabilidade Poisson(5)
20%
15%
10%
Pr(X = x)
5%
12
10
8
6
4
2
0
0%
115
Distribuição de Poisson
c) A função de distribuição acumulada é mostrada a
seguir.
Função de Distribuição Acumulada - Poisson(5)
100%
80%
60%
Pr( X <= x)
40%
20%
12
11
10
9
8
7
6
5
4
3
2
1
0
0%
116
Exemplo (para casa – use o Excel)
‰O número de enchentes em cada verão no
Rio de Janeiro é uma variável aleatória
Poisson com média de 2 enchentes por
verão.
‰ Calcule
a
probabilidade
de
ocorrerem
exatamente 3 enchentes em um verão qualquer.
‰ Calcule a probabilidade de ocorrerem menos de
10 enchentes em 30 verões.
117
Exemplo (para casa – use o Excel)
‰O número de carros que chegam num posto
de pedágio é uma variável Poisson com
média de 3 carros por minuto.
‰Use o Excel para calcular:
‰ A probabilidade de passarem mais de 4 carros
num minuto.
‰ A probabilidade de passarem menos de 25 carros
em 10 minutos.
118
Utilizando o Excel®
‰ Funções do Excel para distribuições discretas de
probabilidades
Função
Descrição
dist.binom(s;n;p;a)
Utilizando a distribuição binomial, calcula a
probabilidade de s sucessos em n tentativas,
com probabilidade de sucesso p. Se a =
VERDADEIRO, retorna a probabilidade
acumulada (de 0 a s sucessos)
poisson(x;µ;a)
Utilizando a distribuição de Poisson, calcula a
probabilidade de x ocorrências para um número
médio de ocorrências µ. Se a = VERDADEIRO,
retorna a probabilidade acumulada (de 0 a x
ocorrências)
119
Distribuições contínuas de
probabilidades
‰ Como já foi dito antes, variáveis aleatórias contínuas
são aquelas que podem assumir quaisquer valores dentro
de um intervalo
‰ Para variáveis aleatórias discretas, nós podiamos atribuir
uma probabilidade a uma determinada ocorrência da
variável
‰ Para variáveis aleatórias continuas a situação é bem
diferente
‰ Como uma variável contínua assumir qualquer valor em
um intervalo, na realidade ela pode assumir infinitos
valores
120
Distribuições contínuas de
probabilidades
‰ Portanto, não podemos falar da probabilidade de
ocorrência de um valor em particular
‰ Ao invés disso, devemos pensar na probabilidade
de ocorrência associada a um intervalo
‰ Na discussão anterior sobre distribuições discretas
de probabilidades introduzimos o conceito de função
de probabilidade – f(x)
‰ No caso contínuo, nós utilizaremos a função
densidade de probabilidade, também representada
por f(x)
121
Distribuições contínuas de
probabilidades
‰ Nesse caso, a função densidade de probabilidade fornece
um valor para cada possível valor (infinitos) da variável x
‰ No entanto, os valores de f(x) não representam as
probabilidades associadas a x
‰ Ao invés disso, a área (isto é, a integral!) sob a função
de densidade de probabilidade em um determinado
intervalo de x fornece a probabilidade de ocorrência de
um valor dentro desse intervalo
122
Distribuições contínuas de
probabilidades
‰ Analogamente ao caso discreto, uma função de
densidade de probabilidade contínua deve obedecer à
seguinte condição de +“normalização”:
∞
∫ f ( x)dx = 1
−∞
Valor esperado ou esperança matemática - E(x) ou µ - de
uma distribuição contínua de probabilidades – é o valor
médio obtido para a variável aleatória se o experimento fosse
repetido um número infinito de vezes
– Normalmente esse valor é obtido analiticamente ou através de
um número grande de observações
Variância de uma distribuição de probabilidades (σ2) – mede
a dispersão dos valores da distribuição
123
Distribuições contínuas de
probabilidade - exemplo
‰ Considere a seguinte função de densidade de probabilidade:
f(x) = (x + 1)/4 para 0≤ x ≤ 2. (a) Verifique se esta é uma função
de densidade de probabilidade válida para o intervalo
considerado. (b) Calcule a probabilidade de x ≥ 1
f(x)
(x + 1)/4
3/4
1/4
0
2
x
124
Distribuições contínuas de
probabilidade - exemplo
‰ Solução: (a) Para que f(x) seja uma função de densidade
de probabilidade válida, devemos ter a sua área = 1 para
todos os intervalos de validade de x
‰ Neste caso, devemos calcular a área sob a função no
intervalo de 0 a 2
‰ A área dessa região é dada por
f ( 2) + f (0)
3 / 4 + 1/ 4
Área =
2 =1
(2 − 0) =
2
2
Logo, f(x) representa
probabilidade válida
uma
função
de
densidade
125
de
Distribuições contínuas de
probabilidade - exemplo
‰ Solução: (b) A probabilidade para um determinado
intervalo de x é dada pela área sob a função de
densidade de probabilidade nesse intervalo
‰ P(x ≥ 1) corresponde à área sob a função para 1 ≤ x ≤ 2
3/ 4 + 2 / 4
f (2) + f (1)
Área =
(2 − 1) =
1 = 0,625
2
2
126
Distribuição Uniforme
‰ A probabilidade de ocorrência em dois intervalos quaisquer de
mesmo tamanho é a mesma – a função de densidade de
probabilidade é uma reta paralela ao eixo horizontal.
‰ Se considerarmos os limites de ocorrência de x como sendo a
e b (a ≤ b) devemos ter necessáriamente f(x) = 1/(b – a) para
que a probabilidade total seja 1
‰ Exemplo: um vôo da ponte aérea RJ-SP leva entre 40 e 50
minutos, com igual probabilidade de ocorrência dentro desse
intervalo
‰ A distribuição é uniforme
‰ f(x) = 1/(50 – 40)
f(x)
0,1
0
40
50
x
127
Distribuição Uniforme
‰ Exemplo: O peso mínimo de um pacote de 1Kg de café é de
0,98Kg. O fabricante garante que a distribuição de pesos é
uniforme e que a função de densidade de probabilidade, f(x), é
igual a 9,75. Se o fabricante disse a verdade, qual é o peso
máximo que um pacote de café pode ter?
‰ Solução:
‰ Chamemos o peso máximo de b
‰ Se a distribuição é uniforme, a área sob f(x) no intervalo de
validade de x deve ser igual a 1
‰ A área é dada por f(x).(b – a), onde f(x) = 9,75 e a = 0,98
‰ Logo, b = a + 1/f(x) = 0,98 + 1/9,75 = 1,0826
128
Distribuição Uniforme
‰ O valor esperado para a distribuição contínua Uniforme é:
E( X ) = µ =
( a + b)
2
‰ E a variância:
2
(
)
b
−
a
σ2 =
12
No exemplo anterior temos:
– Valor esperado: 1,0313
– Variância: 0,00088
129
Distribuição Uniforme
‰ Exemplo (para casa)
O retorno de uma aplicação financeira de risco num
intervalo de uma semana é uma variável com
distribuição Uniforme no intervalo –2% a 1.8%.
Calcule:
a) A probabilidade do retorno do investimento nesta
semana ser positivo.
b) A probabilidade do retorno estar entre –1% e +1%.
c) A probabilidade do retorno exceder 0.5%.
d) Qual o retorno médio esperado numa semana
qualquer? E o risco associado a este investimento?
130
A distribuição Normal
‰ É a mais importante distribuição contínua
‰ É utilizada para descrever inúmeras aplicações práticas
‰ Altura e peso de pessoas
‰ Nível de chuvas
‰ Altura de árvores em uma floresta
‰ A função de densidade de probabilidade é simétrica em torno
da média e possui a forma de um sino. f(x) é dada por
1
f ( x) =
σ 2π
− ( x −µ ) 2
2
2
σ
e
µ indica a média da
distribuição e σ2 a sua
variância
131
A distribuição Normal
‰ A distribuição normal é totalmente caracterizada por sua média
µ e seu desvio-padrão σ
‰ A média define o deslocamento horizontal da curva, enquanto
que o desvio-padrão define o seu achatamento
0.30
µ=10
µ=12
0.30
0.25
0.25
0.20
0.20
0.15
0.15
0.10
0.10
0.05
0.05
0.00
0.00
5
10
15
σ =1,5
σ =2,5
2
7
12
17
132
A distribuição Normal
‰Normal com média µ e variância σ2
‰ Densidade
(
f x, µ ,σ
2
)=
1
2πσ
2
 − ( x − µ )2 
exp 

2
2
σ


‰ Função de Distribuição: Pr( X ≤ x)
F ( u ) = Pr ( X ≤ u ) =
1
2 πσ 2
 − ( x − µ ) 2 
∫− ∞exp  2σ 2  dx


u
‰ Não é possível resolver analiticamente esta
integral - precisamos de uma tabela!
‰Tabela: distribuição N(0,1)
133
A distribuição Normal
‰ Problema:
‰ Não é possível criar uma tabela para cada uma das (infinitas)
densidades Normais existentes.
‰ Solução:
‰ Trabalha-se com a densidade Normal com média 0 e
variância 1, e converte-se todas as outras Normais para esta,
chamada de Normal padrão ou Normal standard.
‰ A maioria dos livros de estatística fornece tabelas de
probabilidade para a distribuição normal padronizada
‰ A distribuição normal padronizada possui média 0 e desviopadrão 1
134
A distribuição Normal
‰ Se X pertence a uma distribuição normal com
média µ e desvio-padrão σ, seu valor normalizado é
dado por:
X −µ
Z=
σ
‰ Existem dois tipos de tabela, que fornecem
basicamente a mesma coisa:
1) Pr(0≤ Z ≤ z0), ou seja, a probabilidade do lado direito da
curva normal a partir da média até o valor z0
2) Φ(z0) = Pr ( Z ≤ z0) = 0.5 + Pr (0≤ Z ≤ z0) (por que?)
135
A Distribuição Normal
‰ Toda variável Normal pode ser transformada numa
Normal com média 0 e variância 1.
‰ Logo, só existe a necessidade de criar uma única
tabela para a função de distribuição acumulada.
‰ Se X é N( µ , σ2 ) . Então a variável Z = ( X - µ ) /σ
tem distribuição Normal com média zero e variância
um, isto é, Z é N(0,1).
136
A Distribuição Normal
‰ Cálculo de probabilidades
‰ Se X é uma variável Normal com média µ e desvio
padrão σ então:
b−µ 
a−µ
a−µ X −µ b−µ 
Pr(a ≤ X ≤ b) = Pr
Pr
Z
=
≤
≤
≤
≤
=


σ
σ 
σ 
 σ
 σ
a−µ
b−µ 
= Φ

 − Φ
 σ 
 σ 
‰ onde Φ é a função de distribuição da N(0,1), que é
tabelada. Alguns valores importantes são:
Φ(1.645) = 0.95 , Φ (1.96) = 0.975 e Φ (2.326) = 0.99
137
A distribuição Normal
‰ Eu pessoalmente prefiro usar a tabela contendo
Φ(z0) , mas no final das contas ... dá no mesmo,
desde que você saiba qual tabela está usando!
‰ O Excel fornece diretamente o valor de Φ(z0) através
da função dist.normp. O único argumento para
esta função é o valor z0 para o qual você quer
calcular a probabilidade de estar abaixo, pois a
função pressupõe que a distribuição usada é a
Normal padrão (média 0 e variância 1)
138
Tabela da N(0,1) usando Φ(z00)
0.4
0.4
0.3
Φ(z)
0.3
0.2
0.2
0.1
0.1
z
-
139
Tabela da N(0,1) - Φ(z00)
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
z
.0
.0
.0
.0
.0
.1
.1
.1
.1
.1
.2
.2
.2
.2
.2
.3
.3
.3
.3
.3
.4
.4
.4
.4
.4
.5
.5
.5
.5
.5
.6
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
φ(z)
.5 0 0
.5 0 8
.5 1 6
.5 2 3
.5 3 1
.5 3 9
.5 4 7
.5 5 5
.5 6 3
.5 7 1
.5 7 9
.5 8 7
.5 9 4
.6 0 2
.6 1 0
.6 1 7
.6 2 5
.6 3 3
.6 4 0
.6 4 8
.6 5 5
.6 6 2
.6 7 0
.6 7 7
.6 8 4
.6 9 1
.6 9 8
.7 0 5
.7 1 2
.7 1 9
.7 2 5
0
0
0
9
9
8
8
7
6
4
3
1
8
6
3
9
5
1
6
0
4
8
0
2
4
5
5
4
3
0
7
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
z
.6
.6
.6
.6
.7
.7
.7
.7
.7
.8
.8
.8
.8
.8
.9
.9
.9
.9
.9
.0
.0
.0
.0
.0
.1
.1
.1
.1
.1
.2
.2
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
φ(z)
.7 3 2
.7 3 8
.7 4 5
.7 5 1
.7 5 8
.7 6 4
.7 7 0
.7 7 6
.7 8 2
.7 8 8
.7 9 3
.7 9 9
.8 0 5
.8 1 0
.8 1 5
.8 2 1
.8 2 6
.8 3 1
.8 3 6
.8 4 1
.8 4 6
.8 5 0
.8 5 5
.8 5 9
.8 6 4
.8 6 8
.8 7 2
.8 7 7
.8 8 1
.8 8 4
.8 8 8
4
9
4
7
0
2
4
4
3
1
9
5
1
6
9
2
4
5
5
3
1
8
4
9
3
6
9
0
0
9
8
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
z
.2
.2
.2
.3
.3
.3
.3
.3
.4
.4
.4
.4
.4
.5
.5
.5
.5
.5
.6
.6
.6
.6
.6
.7
.7
.7
.7
.7
.8
.8
.8
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
φ(z)
.8 9 2
.8 9 6
.8 9 9
.9 0 3
.9 0 6
.9 0 9
.9 1 3
.9 1 6
.9 1 9
.9 2 2
.9 2 5
.9 2 7
.9 3 0
.9 3 3
.9 3 5
.9 3 8
.9 4 0
.9 4 2
.9 4 5
.9 4 7
.9 4 9
.9 5 1
.9 5 3
.9 5 5
.9 5 7
.9 5 9
.9 6 0
.9 6 2
.9 6 4
.9 6 5
.9 6 7
5
2
7
2
6
9
1
2
2
2
1
9
6
2
7
2
6
9
2
4
5
5
5
4
3
1
8
5
1
6
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
z
.8
.8
.9
.9
.9
.9
.9
.0
.0
.0
.0
.0
.1
.1
.1
.1
.1
.2
.2
.2
.2
.2
.3
.3
.3
.3
.3
.4
.4
.4
.4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
0
2
4
6
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
φ(z)
.9 6 8 6
.9 6 9 9
.9 7 1 3
.9 7 2 6
.9 7 3 8
.9 7 5 0
.9 7 6 1
.9 7 7 2
.9 7 8 3
.9 7 9 3
.9 8 0 3
.9 8 1 2
.9 8 2 1
.9 8 3 0
.9 8 3 8
.9 8 4 6
.9 8 5 4
.9 8 6 1
.9 8 6 8
.9 8 7 5
.9 8 8 1
.9 8 8 7
.9 8 9 3
.9 8 9 8
.9 9 0 4
.9 9 0 9
.9 9 1 3
.9 9 1 8
.9 9 2 2
. 9140
927
.9 9 3 1
A distribuição Normal
Algumas propriedades da distribuição normal
‰ Ela é simétrica em relação à média
‰ p(0 ≤ z ≤ z0) = p(-z0 ≤ z ≤ 0)
‰ p(z0 ≤ z ≤ z1) = p(-z1 ≤ z ≤ z0)
‰ p(-∞ ≤ z ≤ 0) = p(0 ≤ z ≤ +∞) = 0,5
‰ A probabilidade associada a um intervalo equivale à área
sob a curva
‰ p(z0 ≤ z ≤ z1) = p(0 ≤ z ≤ z1) - p(0 ≤ z ≤ z0)
‰ p(-z1 ≤ z ≤ z0) = p(-z1 ≤ z ≤ 0) - p(-z0 ≤ z ≤ 0) =
= p(0 ≤ z ≤ z1) - p(0 ≤ z ≤ z0)
141
A distribuição Normal
‰ Exemplo: para uma distribuição normal com µ = 10 e σ = 1,5, a
probabilidade de 10 ≤ x ≤ 12 é dada por:
‰ z0 = (10 – 10)/1,5 = 0 e z1 = (12 – 10)/1,5 = 1,33
‰ p(10 ≤ x ≤ 12) = p(0 ≤ x ≤ 1,33) = 0,4082
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-4,00
-2,00
0,00
1,33
2,00
4,00
0,00
0,10
0,20
0,30
0,40
0,00
0,0000
0,0398
0,0793
0,1179
0,1554
0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,03
0,0120
0,0517
0,0910
0,1293
0,1664
0,04
0,0160
0,0557
0,0948
0,1331
0,1700
0,50
0,60
0,70
0,80
0,90
0,1915
0,2257
0,2580
0,2881
0,3159
0,1950
0,2291
0,2611
0,2910
0,3186
0,1985
0,2324
0,2642
0,2939
0,3212
0,2019
0,2357
0,2673
0,2967
0,3238
0,2054
0,2389
0,2704
0,2995
0,3264
1,00
1,10
1,20
1,30
1,40
0,3413
0,3643
0,3849
0,4032
0,4192
0,3438
0,3665
0,3869
0,4049
0,4207
0,3461
0,3686
0,3888
0,4066
0,4222
0,3485
0,3708
0,3907
0,4082
0,4236
0,3508
0,3729
0,3925
0,4099
0,4251
142
A distribuição Normal
‰ Exemplo: para uma distribuição normal com µ = 10 e σ = 1,5, a
probabilidade de 10,95 ≤ x ≤ 12 é dada por
‰ z0 = (12 – 10)/1,5 = 1,33 e z1 = (10,95 – 10)/1,5 = 0,63
‰ p(10,95 ≤ x ≤ 12) = p(0,63 ≤ z ≤ 1,33) = p(0 ≤ z ≤ 1,33) - p(0 ≤ z ≤ 0,63) =
0,4082 – 0,2357 = 0,1725
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-4,00
-2,00
0,63 1,33
0,00
2,00
4,00
0,00
0,10
0,20
0,30
0,40
0,00
0,0000
0,0398
0,0793
0,1179
0,1554
0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,03
0,0120
0,0517
0,0910
0,1293
0,1664
0,04
0,0160
0,0557
0,0948
0,1331
0,1700
0,50
0,60
0,70
0,80
0,90
0,1915
0,2257
0,2580
0,2881
0,3159
0,1950
0,2291
0,2611
0,2910
0,3186
0,1985
0,2324
0,2642
0,2939
0,3212
0,2019
0,2357
0,2673
0,2967
0,3238
0,2054
0,2389
0,2704
0,2995
0,3264
1,00
1,10
1,20
1,30
1,40
0,3413
0,3643
0,3849
0,4032
0,4192
0,3438
0,3665
0,3869
0,4049
0,4207
0,3461
0,3686
0,3888
0,4066
0,4222
0,3485
0,3708
0,3907
0,4082
0,4236
0,3508
0,3729
0,3925
0,4099
0,4251
143
A distribuição Normal
‰ Exemplo: dada uma variável X normalmente distribuída com
média 6 e desvio-padrão 2, calcule:
‰ (a) p(6 ≤ X)
‰ (b) p(6 ≤ X ≤ 10)
‰ (c) p(8 ≤ X),
‰ (d) p(2 ≤ X)
‰ (e) p(1 ≤ X ≤ 4)
144
A distribuição Normal
‰ Solução:
‰ (a) Inicialmente devemos observar que
ƒ p(6 ≤ X) = p(6 ≤ X ≤ ∞)
ƒ Normalizando, temos: p(6 ≤ X) = p(0 ≤ Z ≤ ∞) = 0,5
‰ (b) p(6 ≤ X ≤ 10)
ƒ Normalizando, z0 = (6 – 6)/2 = 0 e z1 = (10 – 6)/2 = 2
ƒ p(0 ≤ Z ≤ 2) = 0,4772
‰ (c) p(8 ≤ X)
ƒ Normalizando, z0 = (8 – 6)/2 = 1
ƒ p(1 ≤ Z) = p(1 ≤ Z ≤ ∞) = p(0 ≤ Z ≤ ∞) - p(0 ≤ Z ≤ 1) = 0,5 – 0,3413 =
0,1587
145
A distribuição Normal
‰ Solução (cont):
‰ (d) p(2 ≤ X)
ƒ Normalizando: z0 = (2 – 6)/2 = -2
ƒ p(-2 ≤ Z) = p(-2 ≤ Z ≤ 0) + p(0 ≤ Z ≤ ∞)
ƒ Lembrando que p(0 ≤ Z ≤ z1) = p(-z1 ≤ Z ≤ 0), temos
ƒ p(-2 ≤ Z) = p(0 ≤ Z ≤ 2) + p(0 ≤ Z ≤ ∞) = 0,4772 + 0,5 = 0,9772
‰ (e) p(1 ≤ X ≤ 4)
ƒ Normalizando, z0 = (1 – 6)/2 = -2,5 e z1 = (4 – 6)/2 = -1
ƒ p(-2,5 ≤ Z ≤ -1) = p(1 ≤ Z ≤ 2,5)
ƒ p(1 ≤ Z ≤ 2,5) = p(0 ≤ Z ≤ 2,5) - p(0 ≤ Z ≤ 1) = 0,4938 – 0,3413 =
0,1525
146
A distribuição Normal
‰ Exemplo
‰ Numa agência bancária localizada numa grande cidade
brasileira, verificou-se que um cliente pessoa física mantém, em
média, um volume de R$ 4800,00 aplicados no banco. A
dispersão entre os volumes de recursos, medida pelo desvio
padrão, é R$ 1600,00. Além disso, pode-se encarar os saldos
dos correntistas como independentes entre si e Normalmente
distribuídos.
‰ O banco pretende abrir uma nova agência e seus executivos
imaginam que o poder aquisitivo nesta nova área é semelhante
ao dos clientes da agência descrita acima.
147
A distribuição Normal
a) Um cliente é VIP se está entre os 5% com maior volume de
recursos. Quanto uma pessoa deveria manter no banco para
ser considerada cliente VIP?
b) O banco pretende cobrar tarifas mais altas dos clientes que têm
um baixo volume de recursos aplicados na instituição. Os
clientes cujos volumes de recursos estão entre os 10% mais
baixos terão de pagar esta tarifa mais alta. Abaixo de qual
volume um cliente será alvo desta tarifa diferenciada?
148
A distribuição Normal
‰ Solução
Seja X a variável que mede o volume de
recursos de um cliente típico da agência. Então X é Normal (4800,
(1600)2). Daí:
Z=
X − 4800
1600
tem densidade Normal padrão.
a)
Para estar entre os 5% mais “ricos”, precisamos encontrar z0
tal que Φ(z0) = 95%. Usando a função INV.NORMP do Excel,
encontramos z0 = 1.645. Logo,
X − 4800
= 1.645 ⇒ X = 4800 + 1.645(1600) = 7432
1600
149
A distribuição Normal
‰ Solução (cont.)
b) Para estar entre os 10% mais “pobres” precisamos encontrar z0
tal que Φ(z0) = 10%. A função INV.NORMP do Excel fornece
z0 = -1.281. Logo,
X − 4800
= −1.281 ⇒ X = 4800 − 1.281(1600) = 2750.40
1600
Ou seja, clientes com volume de recursos abaixo de R$ 2750
estarão sujeitos a uma tarifa mais alta, e aqueles com volume de
aplicações acima de R$ 7432 terão tratamento VIP.
150
A distribuição Normal
‰ Exemplo
O saldo devedor dos usuários de um certo cartão de crédito
é uma variável aleatória Normal com média R$ 200 e desvio
padrão R$ 75.
a) Qual a probabilidade do saldo devedor de um usuário
estar entre R$ 100 e R$ 300?
b) Qual deve ser o seu saldo devedor para que você esteja
entre os 5% mais endividados?
Solução
X é Normal com média 200 e desvio padrão 75 e assim
Z =(X- 200)/75 é N(0,1).
151
A distribuição Normal
‰ Solução (cont.)
Pr(100 < X < 300) =
300 − 200 
 100 − 200
Pr 
<Z<
 = Pr(−1.333 < Z < +1.333) = Φ (1.333) − Φ (− 1.333) = 2.Φ (1.333) − 1 =
75
75


= 0.8176
b) Para que você esteja entre os 5% mais endividados, o saldo
devedor padronizado deve ser igual a 1.645 (veja tabela da
Normal). Daí:
X − 200
Z=
= 1.645 ⇒ X = 200 + 1.645(75) = 323.38
75
‰ é o saldo para estar entre os 5% com maior saldo devedor.
152
A distribuição Normal
‰Exemplo (para casa)
O consumo médio residencial de energia elétrica
nos meses de verão numa certa cidade é uma
variável Normal com média 210 kWh e desvio
padrão 18 kWh.
a) Qual a probabilidade de que o consumo no verão
exceda 225 kWh?
b) Calcule a probabilidade de que o consumo no
verão seja inferior a 190 kWh.
153
Aproximação Normal da distribuição
Binomial
‰ Na seção anterior nós estudamos a distribuição binomial
‰ A probabilidade de em um experimento binomial com n
tentativas ocorrerem exatamente x sucesso, sendo p a
probabilidade de um sucesso é dada por:
n
n!
f ( x) =   p x (1 − p ) n− x =
p x (1 − p ) n− x
x!(n − x)!
 x
Quando n é grande, o cálculo de f(x) se torna muito
trabalhoso
Além disso, as tabelas para a distribuição binomial
contemplam apenas alguns valores de n e p
Nos casos onde n ≥ 20 e n(1 – p) ≥ 5, a distribuição normal
fornece uma boa aproximação da distribuição binomial, com
154
µ = np e σ = √np(1 – p)
Aproximação Normal da distribuição
Binomial
‰ Exemplo: qual é a probabilidade de obtermos exatamente 20
caras em 50 lançamentos consecutivos de uma moeda?
‰ Solução:
‰ Experimento binomial com n = 50, x = 20 e p = 0,5
‰ n(1 – p) = 50(1 – 0,5) = 25 ≥ 5 e n = 50 ≥ 20, podemos utilizar a
aproximação normal com µ = 25 e σ = 3,54
‰ Como queremos calcular a probabilidade para um ponto (x = 20) e
em distribuições contínuas só podemos calcular a probabilidade
para intervalos, devemos utilizar um artifício: calcular a
probabilidade de ocorrência de 19,5 a 20,5 caras – p(19,5 ≤ x ≤
20,5)
155
Aproximação normal da distribuição
binomial
‰ Solução (cont.):
‰ Normalizando, temos z0 = (19,5 – 25)/3,54 = -1,55 e
z1 = (20,5 – 25)/3,54 = -1,27
‰ Logo, devemos calcular Pr(-1,55 ≤ z ≤ -1,27) = 0,4394
– 0,3980 = 0,0414
‰ Calculando diretamente pela fórmula da distribuição
binomial obteríamos p = 0,0419
156
Aproximação normal da distribuição
binomial
‰Exemplo (para casa)
Seja Y uma variável Binomial com n = 20 e p =1/2.
Use o Excel para calcular:
a) Pr( Y ≥ 15) exatamente
b) Pr( Y ≥ 15) aproximadamente pela distribuição
Normal
157
A distribuição Exponencial
‰ A distribuição exponencial é útil na descrição de variáveis
aleatórias tais como tempo entre ocorrências consecutivas
de um evento, tempo necessário para realização de uma
tarefa etc.
‰ Tempo entre chegadas consecutivas de carros em um posto de
pedágio
‰ Tempo de atendimento em um caixa de banco
‰ A função de densidade de probabilidade é definida para
x ≥ 0 e é dada por:
0.08
1
f ( x) = e
µ
−
x
µ
0.06
µ = 15
0.04
0.02
0
0
10
20
30
40
50
60
158
A distribuição Exponencial
‰ Como em qualquer distribuição contínua de
probabilidades, a área sob a curva da função
densidade de probabilidade para um determinado
intervalo fornece a probabilidade de ocorrência de
valores dentro desse intervalo
p ( x ≤ x0 ) = 1 − e − x0
µ
p ( x0 ≤ x ≤ x1 ) = e − x0
µ
− e − x1
µ
159
A distribuição Exponencial
‰ Exemplo
O tempo médio de atendimento em um caixa de um
banco é de 1m30s. Supondo que o tempo de
atendimento obedece a uma distribuição exponencial,
calcule:
(a) a probabilidade de um atendimento durar menos de
1m30s e
(b) durar entre 1m45s e 3m00s
160
A distribuição Exponencial
‰ Solução: temos uma distribuição exponencial com µ =
1,5 (1m30s).
(a) para x0 = 1,5, temos:
1
p ( x ≤ 1,5) = 1 − e −1,5 1,5 = 1 − = 0,632
e
(b) Devemos calcular a probabilidade para o intervalo (x0, x1)
onde x0 = 1,75 e x1 = 3,00
p (1,75 ≤ x ≤ 3,00) = e −1,75 1,5 − e −3,00 1,5 = 0,311 − 0,135 = 0,176
161
Relação entre Distribuições Poisson
e Exponencial
‰ Se a distribuição de Poisson fornece uma descrição
apropriada do número de ocorrências de um evento
dentro de um intervalo, a distribuição Exponencial
fornece o tempo médio entre ocorrências
(“chegadas”)
‰ Suponha que o número médio de clientes que entram
em uma loja no intervalo de uma hora seja 10 e que
essa variável seja descrita por uma distribuição de
Poisson
‰ O tempo médio entre chegadas de clientes é descrito
por uma distribuição exponencial com µ = 1h/10 = 0,1
hora/cliente
162
Relação entre Distribuições Poisson
e Exponencial
‰ Exemplo
A chegada de uma mensagem de e-mail num servidor segue
uma distribuição de Poisson com taxa λ= 5 mensagens por
minuto. Qual a probabilidade de que o primeiro e-mail
demore mais que 20 segundos para chegar?
‰ Solução
O instante de chegada da 1a. mensagem é uma variável
Exponencial com média 1/λ = 1/5 de um minuto = 12
segundos. Denote por T esta variável. Desejamos encontrar
Pr( T ≥ 20 segundos) = Pr{ T ≥ 1/3 minuto} = exp{ -5(1/3)} =
18.9%.
163
Exemplo – distribuição Exponencial
(para casa)
‰ Uma empresa aérea precisa revisar os motores de seus
aviões em intervalos regulares de tempo. Existem 2
opções - a revisão rápida e uma revisão mais detalhada
e cara.
‰ O técnico encarregado da manutenção garante que na
revisão rápida o funcionamento perfeito dos motores é
uma variável Exponencial com média 400 horas.
‰ Após a revisão detalhada o funcionamento perfeito dos
motores é uma variável Exponencial com média 600
horas. A revisão detalhada custa R$ 25.000,00 e a
revisão rápida R$ 18.000,00.
164
Exemplo – distribuição Exponencial
(para casa)
‰ O avião precisa funcionar por 500 horas sem
problemas de motor para que a operação da
companhia seja economicamente viável. Do contrário,
se o avião apresentar defeito antes das 500 horas,
existe um custo adicional de R$ 20.000,00 devido ao
tempo necessário para uma nova manutenção.
‰ Qual o custo esperado das duas revisões?
‰ Qual procedimento é mais vantajoso, isto é, qual
deles tem o menor custo médio?
165
Utilizando o Excel®
‰ Funções do Excel para as distribuições Normal e
Exponencial
Função
Descrição
dist.normal(x;µ;σ;a)
Calcula a função densidade de probabilidade da distribuição
normal com média µ e desvio-padrão σ correspondente ao ponto
x. Se a = VERDADEIRO, retorna a probabilidade acumulada (de
-∞ a x)
dist.exp(x;lambda;a)
Calcula a função densidade de probabilidade da distribuição
exponencial com média 1/lambda correspondente ao ponto x. Se
a = VERDADEIRO, retorna a probabilidade acumulada (de 0 a x)
166
Probabilidade e Estatística – Qual a
Diferença?
‰ Até agora tivemos dois grandes “focos” de
atuação:
1) Estatística descritiva – resumir de maneira
eficiente uma massa de dados, sem maiores
preocupações sobre qual a distribuição de
probabilidade que estava “por trás”
2) Probabilidade – apresentar alguns dos modelos
probabilísticos mais usuais e as situações em
que eles surgem na prática.
167
Probabilidade e Estatística – Qual a
Diferença?
‰ Mas...
‰ Até agora, quando falávamos das diversas
distribuições de probabilidade, os seus
parâmetros eram CONHECIDOS!!!!!
‰ Na prática isso não acontece, e devemos estimar
(“chutar educadamente”) os parâmetros da
distribuição a partir dos dados observados numa
amostra.
‰ Isso nos leva ao terreno da “Estatística” (ou
“Estatística Inferencial”), em que o nosso objetivo é,
a partir de uma amostra, concluir algo sobre os
parâmetros das distribuições de probabilidade da
população que gerou a amostra.
168
Probabilidade e Estatística – Qual a
Diferença?
‰O que se faz em Estatística?
‰ Pega-se uma amostra e usa-se esta amostra
para concluir algo sobre a população que gerou a
amostra.
‰ Existem três grandes classes de técnicas
estatísticas:
ƒ Estimação pontual
ƒ Estimação por intervalos (intervalos de confiança)
ƒ Testes de hipóteses
169
Estimação pontual
‰ Na estimação pontual, utilizamos os dados da amostra
para calcular parâmetros que servem como estimativas
(“chutes”) dos reais parâmetros da população
‰ X é o estimador pontual da média da população µ
‰ S é o estimador pontual do desvio-padrão da população
σ
‰ Pode-se provar que estes estimadores tem propriedades
“ótimas” e por isso faz sentido usá-los
170
Distribuição amostral
‰Note que X e S são variáveis aleatórias
também, e portanto têm as suas próprias
distribuições de probabilidade, caracterizadas
por parâmetros como a média e a variância.
‰Estas distribuições de probabilidade dos
estimadores X e S são chamadas de
distribuições amostrais (“sampling distributions”
em inglês)
‰Vamos nos concentrar aqui na distribuição
amostral para a média amostral X
171
Distribuição da média
amostral X
‰ O valor esperado da média amostral é a média da população,
isto é:
E( X ) = µ
‰ O desvio-padrão da distribuição amostral da média é o
desvio-padrão da população dividido pela raiz quadrada do
número de elementos da amostra
σ
E (sx ) =
n
172
Distribuição da média
amostral X
‰Por que isso é importante?
‰ Note que, à medida que o tamanho da amostra (n)
cresce, o desvio padrão de X diminui, indicando
que X vai se tornando uma estimativa cada vez
mais precisa da média (desconhecida) da população
(que é o µ)
‰ Também...
‰ O Teorema Central do Limite garante que a distribuição
de X se torna APROXIMADAMENTE Normal quando n
é grande – em geral usamos a aproximação se n ≥ 30
173
Intervalos de Confiança para a
Média
‰Objetivo
‰ A partir de uma amostra, encontrar um intervalo
(L, U), onde L e U dependem dos valores
observados na amostra, tal que a média
desconhecida (µ) esteja dentro deste intervalo
com uma probabilidade especificada 1 – α, ou
seja:
ƒ Pr( L < µ < U) = 1 - α
174
Intervalos de Confiança para a
Média
‰ Os limites do intervalo (L e U) dependerão dos valores
efetivamente observados em cada amostra.
‰ O número 1- α é chamado de coeficiente de confiança
do intervalo. Dizemos que o intervalo (L, U) é um
intervalo de confiança 100.(1-α)%
‰ Suponha que X1, X2, ..., Xn são independentes Normais
com média µ e variância σ2.
‰ O caso mais simples consiste em encontrar um intervalo
para a média quando a variância é conhecida.
175
Intervalo de Confiança para a Média
‰ O intervalo de confiança para a média representa uma
faixa de valores dentro da qual existe uma probabilidade
da real média da população se encontrar
‰ A essa probabilidade damos o nome de nível de confiança
‰ α = 1 – nível de confiança
‰ Definiremos o intervalo de confiança para 4 situações:
‰ O desvio-padrão da população (σ) é conhecido e a amostra é
grande (n ≥ 30)
‰ O desvio-padrão da população (σ) é conhecido e a amostra é
pequena (n < 30)
‰ O desvio-padrão da população (σ) não é conhecido e a amostra
é grande (n ≥ 30)
‰ O desvio-padrão da população (σ) não é conhecido e a amostra
176
é pequena (n < 30)
Caso I - IC para a média:
n ≥ 30 e σ conhecido
‰O IC 100(1-α)% é dado por:

σ
σ 

, X + zα .
X ± zα .
=  X − zα .

n
n
n
2
2
2


σ
onde zα/2 é o ponto da distribuição Normal padrão tal
que Pr(Z < zα/2) = 1- α/2 e Z é uma variável N(0,1).
Aqui X é a média amostral, σ é o desvio-padrão da
população (conhecido) e n é o tamanho da amostra.
177
Caso I - IC para a média:
n ≥ 30 e σ conhecido
‰ Exemplo
‰ Considere a população de alunos do Ibmec. Para uma
amostra de 50 alunos obtivemos uma altura média de
1,68m.
‰ Sabe-se que o desvio-padrão da altura da população
de alunos do Ibmec é o mesmo que o da população de
jovens cariocas com menos de 25 anos: 0,11m.
‰ Determine, com um nível de confiança de 95%, o
intervalo onde a real altura média da população de
alunos do Ibmec deve estar localizada.
178
Caso I - IC para a média:
n ≥ 30 e σ conhecido
‰ Solução
‰n ≥ 30 – a distribuição amostral da média é
normal (pelo teorema central do limite)
‰σ é conhecido
‰Da tabela da Normal, ou usando a função
INV.NORMP do Excel, procuramos um valor z0
tal que Pr(Z < z0) = 1- α/2 = 97.5% , isto é, Φ(z0)
= 97.5%. A função INV.NORMP fornece z0 =
1.96.
179
Caso I - IC para a média:
n ≥ 30 e σ conhecido
‰ Solução (cont.)
‰ O IC 95% é então:

σ
σ  
11
11 
 X − zα .

X
+
z
=
−
+
,
.
168
1
.
96
,
168
1
.
96


α


n
n 
50
50 
2
2

= (164.95 cm, 171.05 cm )
180
Caso I - IC para a média:
n ≥ 30 e σ conhecido
‰Receita de bolo – qual valor de zα/2 usar?
Coeficiente de Confiança
80.0%
90.0%
95.0%
97.0%
97.5%
99.0%
valor tabelado de z
1.282
1.645
1.960
2.170
2.241
2.576
181
Caso I - IC para a média:
n ≥ 30 e σ conhecido
‰ Exemplo: calcule o intervalo de confiança, com um nível
de confiança de 80%, para uma amostra com 49
elementos com média igual a 4 e desvio-padrão da
população igual a 0,8
‰ Solução:
‰ X = 4; n = 49; σ = 0,3 e α/2 = 0,1
‰ da tabela da normal temos z = 1,28
0,8
x = 4 ± 1,28.
= 4 ± 0,146
49
182
Caso I - IC para a média:
n ≥ 30 e σ conhecido
‰Exemplo
‰ Numa amostra de 36 postos de gasolina no Rio de
Janeiro, o preço médio do litro da gasolina aditivada
foi de R$ 1.78. Sabe-se, por experiências anteriores,
que o desvio padrão é R$ 0.20. Encontre intervalos
de confiança 90%, 95% e 99% para o preço médio
da gasolina aditivada no Rio de Janeiro.
‰ Solução
‰ Aqui estamos supondo que o desvio padrão é
conhecido, e também o tamanho da amostra excede
30, e assim podemos usar a densidade Normal.
183
Caso I - IC para a média:
n ≥ 30 e σ conhecido
‰ Os IC têm a forma geral:  X − z . σ , X + z . σ 
α
α


‰ O IC 90% é:

2
n
2
n
(
(
0.20)
0.20) 

,1.78 + 1.645
 = (R$ 1.725, R$ 1.835)
1.78 − 1.645
6
6 

‰ O IC 95% é:
(
(
0.20)
0.20) 

,1.78 + 1.96
1.78 − 1.96
 = (R$ 1.715, R$ 1.845)
6
6 

‰ O IC 99% é:
(0.20) ,1.78 + 2.576 (0.20)  = (R$ 1.694, R$ 1.866)

1
.
78
−
2
.
576


6
6 

Note que, à medida que o coeficiente de confiança aumenta,
a largura do intervalo também aumenta!
184
Caso II - IC para a média:
n ≥ 30 e σ desconhecido
‰ Quando nós não conhecemos o desvio-padrão da população,
utilizamos o desvio-padrão da amostra, s, como estimador
‰ O intervalo de confiança para a média é definido por:

s 
s
s


=  X − zα .
X ± zα .
, X + zα .
n 
n
n 
2
2
2
‰
onde X é a média amostral, s é o desvio-padrão da amostra,
n é o tamanho da amostra, α/2 = (1 – nível de confiança)/2 e
zα/2 é obtido da tabela da curva normal da mesma maneira
que no caso I, isto é Φ(zα/2)= Pr(Z < zα/2) = 1- α/2 .
A única diferença entre este caso e o anterior é a
substituição do desvio padrão amostral s pelo desvio
185
padrão da população.
Caso II - IC para a média:
n ≥ 30 e σ desconhecido
‰ Exemplo: calcule o intervalo de confiança, com 90% de
chance, para uma amostra com 64 elementos, média
igual a 10 e desvio-padrão igual a 3
‰ Solução:
‰ x = 10; n = 64; σ = 3 e α/2 = 0,05
‰ da tabela da normal temos z = 1,645
3
IC = 10 ± 1,645.
= 10 ± 0,617 = (9.383, 10.617 )
64
186
Caso III - IC para a média:
n < 30 e σ conhecido
‰ Nesse caso (n < 30), a distribuição amostral da média
depende da distribuição da população
‰ Se a população for normal (ou aproximadamente
normal), a distribuição amostral da média será normal,
independente de n
‰ Podemos então utilizar os procedimentos descritos para
n ≥ 30 e σ conhecido:
IC = X ± zα .
2
σ
n
Se a distribuição da população não for normal, a única
solução é aumentar o tamanho da amostra (n ≥ 30 ) para
que a distribuição de X possa ser aproximada por uma
187
normal
Caso IV - IC para a média:
n < 30 e σ desconhecido
‰ Assumindo que a população é normalmente distribuída,
nós podemos utilizar o desvio-padrão da amostra como
estimador do desvio-padrão da população
‰ Como o desvio-padrão da população é desconhecido, ao
invés de utilizarmos distribuição normal para o cálculo do
intervalo de confiança, nós utilizamos a distribuição t de
Student:

s
s
s 


IC = X ± tα .
=  X − tα .
, X + tα .
n 
n
n 
2
2
2
‰ A distribuição t é semelhante à normal – simétrica com forma
de sino – e possui um parâmetro a mais: o número de graus
de liberdade = n – 1
188
Caso IV - IC para a média:
n < 30 e σ desconhecido
‰ O valor tα/2 é obtido de uma tabela da distribuição t
com n-1 graus de liberdade, de tal forma que Pr(T <
tα/2 ) = α/2. Pode-se, alternativamente, usar a função
INVT do Excel.
189
Caso IV - IC para a média:
n < 30 e σ desconhecido
‰Exemplo
‰ Numa amostra de 16 postos de gasolina no Rio de
Janeiro, o preço médio do litro da gasolina aditivada
foi de R$ 1.78. O desvio padrão dos preços estimado
na amostra é R$ 0.20. Encontre intervalos de
confiança 90%, 95% e 99% para o preço médio da
gasolina aditivada no Rio de Janeiro e compare-os
com os encontrados no exemplo da página 179.
190
Caso IV - IC para a média:
n < 30 e σ desconhecido
‰ Solução
‰ A situação aqui é exatamente a descrita no caso IV, pois o
tamanho da amostra é “pequeno” e o desvio padrão é
desconhecido, e então devemos usar um IC baseado na
distribuição t. A forma do intervalo é:
IC = X ± tα .
2
s 
s
s 

=  X − tα .
, X + tα .
n 
n
n 
2
2
‰ Pela função INVT do Excel com 15 graus de liberdade obtemos
os pontos percentuais para os IC 90, 95 e 99%, que são,
respectivamente: 1.753, 2.131 e 2.947.
191
Caso IV - IC para a média:
n < 30 e σ desconhecido
‰ O IC 90% é:
(0.20) ,1.78 + 1.753 (0.20)  = (R$ 1.692, R$ 1.868)

−
1
.
78
1
.
753


4 
4

‰ O IC 95% é:
(
(
0.20) 
0.20)

,1.78 + 2.131
1.78 − 2.131
 = (R$ 1.673, R$ 1.887 )
4 
4

‰ O IC 99% é:
(0.20) ,1.78 + 2.947 (0.20)  = (R$ 1.633, R$ 1.927 )

1
.
78
−
2
.
947


4
4


Note que os intervalos de confiança são
maiores que os correspondentes para a Normal
192
Caso IV - IC para a média:
n < 30 e σ desconhecido
‰Nota IMPORTANTE – uso de INVT no Excel
‰ Suponha que você quer encontrar um intervalo
de confiança 100*(1 – α)%.
‰ Então para obter o ponto tα/2 que entra no cálculo
do IC, use a função INVT com os argumentos:
ƒα e
ƒ n – 1 graus de liberdade
‰ Isso se deve ao fato do primeiro argumento da
função no Excel ser, na verdade, o valor para o
intervalo bilateral
193
Distribuição t de Student
Quando n (número de graus de liberdade) cresce, a
densidade se torna cada vez mais parecida com uma
N(0,1)
Densidades t de Student e N(0,1)
0.5
0.4
0.4
0.3
N(0,1)
0.3
t(2)
t(5)
0.2
t(10)
0.2
0.1
0.1
2.
3
2
1.
7
1.
4
1.
1
0.
8
0.
5
0.
2
-0
.1
-0
.4
-0
.7
-1
-1
.3
-1
.6
-1
.9
-2
.2
-2
.5
-
194
A distribuição t de Student
‰ Exemplo: para uma amostra com 15 elementos (14 graus de
liberdade) e para um nível de confiança de 5% (α/2 = 0,025), t
é igual a 2,1448
G.L
0,45
0,40
1
2
3
4
0,100
3,0777
1,8856
1,6377
1,5332
0,075
4,1653
2,2819
1,9243
1,7782
0,050
6,3137
2,9200
2,3534
2,1318
0,025
12,7062
4,3027
3,1824
2,7765
0,020
15,8945
4,8487
3,4819
2,9985
5
6
7
8
9
1,4759
1,4398
1,4149
1,3968
1,3830
1,6994
1,6502
1,6166
1,5922
1,5737
2,0150
1,9432
1,8946
1,8595
1,8331
2,5706
2,4469
2,3646
2,3060
2,2622
2,7565
2,6122
2,5168
2,4490
2,3984
10
11
12
13
14
1,3722
1,3634
1,3562
1,3502
1,3450
1,5592
1,5476
1,5380
1,5299
1,5231
1,8125
1,7959
1,7823
1,7709
1,7613
2,2281
2,2010
2,1788
2,1604
2,1448
2,3593
2,3281
2,3027
2,2816
2,2638
15
16
1,3406
1,3368
1,5172
1,5121
1,7531
1,7459
2,1315
2,1199
2,2354
195
0,35
0,30
0,25
0,20
0,15
α/2
0,10
0,05
0,00
-4,00
-2,00
0,00
2,1448
2,00
4,00
2,2485
Comparação: IC Normais x IC t de
Student
‰ A distribuição t nos fornece intervalos de
comprimento maior que os intervalos Normais com
a mesma probabilidade.
‰À medida que o número de graus de liberdade da
densidade t cresce, a densidade se torna mais e
mais
parecida
com
uma
N(0,1),
e
consequentemente, os intervalos se tornam mais
próximos dos encontrados através da distribuição
N(0,1).
196
Determinando o tamanho da
amostra para um dado nível de
confiança
‰ Até o momento, o tamanho da amostra era um dado do
problema
‰ Muitas vezes nós temos a flexibilidade de determinar o
tamanho da amostra
‰ Nesse caso, a margem de erro é um dado do problema
‰ Podemos então, dado o nível de confiança desejado e
os parâmetros descritivos da amostra, obter a margem
de erro desejada ajustando o tamanho da amostra
197
Determinando o tamanho da
amostra para um dado nível de
confiança
‰ A margem de erro E é dada por (σ conhecido):
E = zα .
2
σ
n
Resolvendo para n, temos:
zα2 / 2 σ 2
n=
E2
A fórmula acima exige o conhecimento do desvio-padrão da
população, σ. Na maioria dos casos isso não ocorre. Na
prática, podemos utilizar o desvio-padrão de uma outra
amostra da mesma população como estimador de σ
198
Determinando o tamanho da
amostra para um dado nível de
confiança
‰ Exemplo: uma amostra de funcionários de uma
subsidiária de uma grande empresa multinacional
mostrou que eles gastam, em média, 25 dias de trabalho
por ano em treinamento.
‰ Sabe-se, através de estudos anteriores, que o desviopadrão dessa medida é de 5 dias.
‰ O diretor de RH da empresa quer saber com um nível de
confiança de 95% e um erro máximo de 1 dia, o tempo
médio de treinamento de seus funcionários. Que
tamanho a nova amostra deve ter?
199
Determinando o tamanho da
amostra para um dado nível de
confiança
‰ Solução:
‰ σ = 5, α/2 = 0,025, E = 1
‰ Da tabela da normal temos que zα/2 = 1,96
‰ Utilizando a fórmula, temos:
zα2 / 2σ 2 (1,96) 2 52
n=
=
= 96
2
2
E
1
200
Utilizando o Excel®
‰Funções do Excel para a distribuição t
Função
invt(p; gl)
Descrição
Para a distribuição t de Student, calcula o valor t para
p = 2 x α, com gl graus de liberdade
201
Utilizando o Excel®
‰ O Excel também pode ser utilizado para o cálculo do
intervalo de confiança para σ desconhecido (para
qualquer tamanho de amostra)
‰ Selecione no menu Ferramentas a opção Análise de Dados
‰ Selecione a opção Estatística Descritiva
‰ Na caixa Intervalo de Entrada, selecione os dados da amostra
‰ Selecione a opção Intervalo de Confiança para a Média e
coloque o intervalo de consiança desejado
‰ Na caixa Intervalo de Saída, selecione o local da planilha onde
os resultados serão colocados
‰ Clique em Ok
202
Utilizando o Excel®
‰ A saída Erro padrão fornece o valor de σ/√n para n
grande
‰ Para obter o intervalo de confiança, calcule zα/2
utilizando a função apropriada, multiplique pelo Erro
padrão, subtraia e some à média
‰ A saída Intervalo de Confiança já fornece o valor de
tα/2σ/√n para n pequeno, bastando apenas subtrair e
somar à média
203
Testes de Hipóteses
‰Objetivo geral
‰ Inferir sobre os parâmetros desconhecidos de uma
população usando uma amostra (de tamanho
possivelmente reduzido).
‰ Testar hipóteses é um problema que envolve a
tomada de uma decisão. Eventualmente, após
“recolhermos” (ou processarmos) a informação
contida numa amostra, devemos chegar a uma
conclusão sobre parâmetros não observáveis
relacionados à população que gerou aquela amostra
204
Testes de Hipóteses
‰Qual o teste ideal?
‰ É aquele que sempre toma a decisão correta. É
claro que isso é uma abstração, e não existe na
realidade.
‰Na prática ...
‰ Procuraremos limitar a probabilidade de um certo
tipo de erro, mas não se pode descartá-lo
totalmente.
205
Testes de Hipóteses
‰ O Teste de Hipóteses é um procedimento em que
procuramos testar uma hipótese inicial contra uma
alternativa.
‰ A primeira hipótese (hipótese inicial) é denominada
hipótese nula e representada por H0 .
‰A segunda hipótese é chamada hipótese alternativa e
representada por Ha .
‰Em geral a hipótese alternativa representa uma
conjectura nova a ser testada, e a hipótese nula
representa a situação usual, o "status quo".
206
Testes de Hipóteses
‰A partir dos dados observados, como podemos
decidir sobre qual hipótese (nula ou alternativa)
deverá ser rejeitada?
‰A rejeição da hipótese nula implica na
aceitação da hipótese alternativa e vice-versa.
‰Não é possível aceitar (ou rejeitar) ambas as
hipóteses simultaneamente.
207
Testes de Hipóteses
‰ O que é um teste de hipóteses?
‰ É qualquer regra usada para nos levar à decisão sobre
qual hipótese devemos aceitar.
‰ Podemos criar um número infinito de testes de hipóteses, o
problema é identificar quais são os bons testes, e tentar
obter um "algoritmo" para criar bons testes em diversas
situações.
‰ Aqui nós estaremos concentrados em obter
testes de hipóteses para a média de
distribuições.
208
48
Testes de Hipóteses
‰ Inicialmente devemos formular a hipótese a ser
testada (hipótese nula ou H0) e da hipótese
alternativa (Ha)
‰ Existem três possibilidades:
H 0 : µ ≥ µ0
H 0 : µ ≤ µ0
H 0 : µ = µ0
H a : µ < µ0
H a : µ > µ0
H a : µ ≠ µ0
Em seguida, a partir de informações da amostra e do
nível de significância desejado, vamos procurar
evidências que indiquem se a hipótese nula pode ou não
ser rejeitada
209
Construção de um Teste de
Hipóteses
‰Teste
‰ Rejeitar H0 se T(x), uma função apropriada dos Xi’s
da amostra, está numa região especificada R.
‰ Do contrário, se T(x) não está na região R, não
rejeitamos a hipótese nula.
‰ A região R é chamada de região de rejeição ou
região crítica.
210
Erros do Tipo I e II
‰A partir do que foi observado na amostra
podemos tomar a decisão de aceitar ou rejeitar H0
e esta decisão não é necessariamente correta,
como mostra a tabela a seguir.
Aceitar H0 (Rejeitar H1)
Decisão tomada →
Estado da realidade ↓
H0 é verdadeira
DECISÃO CORRETA
(H1 é falsa)
H1 é verdadeira
Erro do tipo II
(H0 é falsa)
Rejeitar H0 (Aceitar H1)
Erro do tipo I
DECISÃO CORRETA
211
Erros do Tipo I e II
‰A eficiência do teste pode ser medida através das
probabilidades dos erros de tipo I e II.
‰ Idealmente gostaríamos que a probabilidade
de incorrermos em qualquer tipo de erro fosse
zero, mas isto não é possível .
‰Para um tamanho de amostra fixo também não
é possível fixarmos ambos os erros de tipo I e
II.
212
Erros do Tipo I e II
‰α = Probabilidade de erro do tipo I
α = Pr{ rejeitar H0 | H0 é verdadeira }
α = Pr{ T(x) na região crítica | H0 é verdadeira }
α é chamado de tamanho do teste ou nível de
significância do teste.
‰β = Probabilidade de erro do tipo II
β = Pr{ aceitar H0 | H0 é falsa }
β = Pr{ T(x) fora da região crítica| H0 é falsa }
213
Potência de um Teste
‰Potência do teste (ou poder do teste)
1− β = 1- Probabilidade de erro do tipo II
1− β = Pr{ rejeitar H0 | H0 é falsa }
‰Ou seja, a potência do teste é a probabilidade
de uma decisão correta!
‰Idealmente, a potência de um teste seria
sempre alta, mas isso não é sempre verdade.
214
Teste de hipótese uni-caudal
‰ Vamos começar desenvolvendo o teste de hipótese para
o caso abaixo com uma amostra grande (n ≥ 30) e σ da
população conhecido
H 0 : µ ≥ µ0
H a : µ < µ0
Definimos o nível de significância α tal que, sendo a
hipótese nula falsa, queremos ter uma probabilidade
máxima α de aceitá-la
Podemos utilizar os conceitos desenvolvidos na seção
anterior (intervalos de confiança) para definir a regra de
rejeição da hipótese nula
215
Teste de hipótese uni-caudal
‰ Vamos assumir inicialmente que a hipótese nula seja
verdadeira
‰ Para uma amostra grande, podemos considerar a
distribuição amostral da média praticamente normal
‰ Dado um nível de significância α, o valor de z abaixo do
qual há uma probabilidade α da média de uma amostra
estar localizada (zα) é obtido diretamente da tabela da
normal
‰ Calculando o valor de z para a média da amostra, temos
a seguinte regra de rejeição:
Rejeitar
H 0 se
z =
x − µ0
< − zα
σ
n
216
Teste de hipótese uni-caudal
‰ Para o caso de uma amostra grande com σ da população
desconhecido, o procedimento é o mesmo, bastando
utilizar o desvio-padrão amostral s como estimador de σ
Rejeita H 0 se z =
x − µ0
< − zα
s n
Os testes apresentados são conhecidos como testes unicaudais ou unilaterais, pois a hipótese é formulada
como “maior ou igual a” ou “menor ou igual a”
217
Teste de hipótese uni-caudal
‰ Exemplo:
‰ Uma empresa produz café em pó em embalagens de
1Kg. O gerente de produção deseja saber se as
embalagens realmente possuem em média 1Kg do
produto e decidiu realizar um teste.
‰ Ele retirou uma amostra de 50 embalagens e obteve uma
um peso médio de 0,985Kg de produto.
‰ Informações anteriores a respeito da quantidade de
produto por embalagem indicaram um desvio-padrão de
0,075Kg. O gerente deseja saber, com um nível de
significância de 1% se o conteúdo de cada embalagem é
de, no mínimo, 1Kg.
218
Teste de hipótese uni-caudal
‰ Solução: As hipóteses nula e alternativa para o teste são:
H0 : µ ≥ 1
Ha : µ < 1
O valor de zα para o teste é (a partir da tabela normal)
de 2,33
A regra de rejeição é:
x − µ0
0,985 − 1
=
= −1,41 < − zα = −2,33
Rejeita H 0 se z =
σ n 0,075 50
Como z > zα, a hipótese nula não pode ser rejeitada
Se σ não fosse conhecido, deveríamos utilizar o desviopadrão da amostra s
219
VALOR de p (“p value”)
‰ Muitos softwares estatísticos calculam e exibem o “pvalue”, que é a probabilidade de que a estatística de
teste tenha pelo menos tão extremo (muito grande ou
muito pequeno) quanto o valor encontrado na amostra.
‰ O “valor-p” (p-value) indica o menor nível de
significância que levaria à rejeição da hipótese nula.
‰ Por exemplo, se o p-value é 0.04, a hipótese H0 seria
rejeitada com nível 5%, mas não com nível 1%.
220
Teste de hipótese uni-caudal
‰ Uma outra abordagem para realizarmos o teste de
hipótese é utilizarmos o “valor-p”
‰ Supondo que a hipótese nula seja verdadeira, o
“valor-p” nos dá a probabilidade de obtermos um
valor menor ou igual a média amostral
‰ A hipótese nula é rejeitada se essa probabilidade
(valor-p) for menor que o nível de significância
definido para o teste
Rejeitar H 0 se " valor - p" < α
221
Teste de hipótese uni-caudal
‰ Utilizando os dados do exemplo anterior, temos que
z = -1,41 corresponde a uma probabilidade de
0,0793 da média amostral (0,985Kg) ser menor que
µ0 (1Kg)
‰ Logo,
" valor - p" = 0,0793 > α = 0,01
Portanto não podemos rejeitar a hipótese nula
Independente da abordagem utilizada (zα ou “valor-p”),
devemos sempre obter o mesmo resultado para o teste
de hipótese (aceitação ou rejeição de H0)
222
Teste de hipótese uni-caudal
‰ Outra forma de teste uni-caudal é mostrado abaixo
H 0 : µ ≤ µ0
H a : µ > µ0
Este teste é semelhante ao anterior, só que nesse caso
consideramos a cauda superior da curva normal
A regra de rejeição é dada por:
x − µ0
Rejeita H 0 se z =
> zα , se σ for conhecido
σ n
Rejeita H 0 se z =
x − µ0
> zα , se σ for desconheci do
s n
O valor-p é calculado de forma análoga, só que nesse
caso ele representa a probabilidade de obtermos um
valor maior ou igual à média amostral
223
Teste de hipótese bi-caudal
‰ Agora vamos analisar um teste de hipótese bi-caudal,
para uma amostra grande (n ≥ 30) e σ da população
conhecido
H 0 : µ = µ0
H a : µ ≠ µ0
Definimos o nível de significância α tal que, sendo a
hipótese nula falsa, queremos ter uma probabilidade
máxima α de aceitá-la
Este teste difere do anterior (uni-caudal) pois a região
de rejeição situa-se tanto acima (cauda direita) quanto
abaixo de µ0 (cauda esquerda)
224
Teste de hipótese bi-caudal
‰ Vamos assumir inicialmente que a hipótese nula seja
verdadeira
‰ Para uma amostra grande, podemos considerar a
distribuição amostral da média praticamente normal
‰ Agora, dado um nível de significância α, devemos
considerar dois valores de z
‰ Um, abaixo do qual há uma probabilidade α/2 da média de
uma amostra estar localizada (– zα/2)
‰ Outro, acima do qual há uma probabilidade α/2 da média de
uma amostra estar localizada (zα/2)
‰ A regra de rejeição é:
Rejeita H 0 se z =
x − µ0
< − zα / 2 ou z > zα / 2
σ n
225
Teste de hipótese bi-caudal
‰ Para o cálculo do valor-p, devemos levar em conta
que o teste em questão é bi-caudal
‰ A probabilidade obtida a partir do cálculo de z deve
ser multiplicada por 2 para que possa ser comparada
com α
‰ Desta forma, podemos utilizar a mesma regra de
rejeição que para o caso do teste uni-caudal
Rejeitar H 0 se " valor - p" < α
226
Teste de hipótese bi-caudal
‰ Exemplo
‰ Um fabricante de autopeças utiliza esferas de aço na
fabricação de rolamentos. Essas esferas devem ter um
diâmetro de 12mm, caso contrário os rolamentos não
atingem as especificações exigidas.
‰ Uma amostra de 30 rolamentos escolhidos ao acaso
forneceu um diâmetro médio de 11,45mm e um
desvio-padrão de 1mm.
‰ Pode-se dizer que o diâmetro médio dos rolamentos
utilizados é igual a 12mm com um nível de
significância de 5%?
227
Teste de hipótese bi-caudal
‰ Solução: Trata-se de um teste de hipótese bi-caudal, com α
= 0,05, onde:
H 0 : µ = 12
H a : µ ≠ 12
Para α
_ = 0,05, z α/2 = 1,96
Para x = 11,45mm, temos z = -3,01 < - z
podemos rejeitar a H0
α/2,
portanto
_
Valor-p: calculando a probabilidade de x < x (z < -3,01),
encontramos 0,0003
Logo, o valor-p = 0,0006 < α/2 = 0,025, portanto
podemos rejeitar H0
228
Teste de hipótese – amostra
pequena
‰ Até o momento, consideramos o caso de uma amostra
grande (n ≥ 30)
‰ Para n < 30, podemos ter as seguintes possibilidades
‰ A população é normalmente distribuída e σ é conhecido:
utilizamos o mesmo procedimento que para o caso de n ≥ 30,
com σ conhecido
‰ A população é normalmente distribuída e σ não é conhecido:
utilizamos o mesmo procedimento que para o caso de n ≥ 30,
utilizando s como estimador de σ e utilizando a distribuição t
ao invés da normal
‰ A população não é normalmente distribuída : aumentamos o
tamanho da amostra
229
Teste de hipótese – amostra
pequena
‰ Exemplo
‰ Uma revista especializada decidiu realizar uma pesquisa
sobre a qualidade de serviço em grandes aeroportos ao
redor do mundo.
‰ O nível de serviço de um aeroporto é considerado superior
se a nota obtida é igual ou superior a 7. Para o aeroporto
de Heatrow, em Londres, foram entrevistadas 12 pessoas
que atribuiram as seguintes notas: 7, 8, 10, 8, 6, 9, 6, 7, 7,
8, 9, e 8.
‰ Determine, com un nível de significância de 5%, se o
serviço do aeroporto de Heatrow pode ser considerado
superior. Suponha que a população é normalmente
distribuída.
230
Teste de hipótese – amostra
pequena
‰ Solução: As hipóteses nula e alternativa para o teste são:
H0 : µ ≤ 7
Ha : µ > 7
Com uma população normal, n < 30 e σ desconhecido,
utilizaremos s e a distribuição t com 11 graus de
liberdade para o teste
A média da amostra é 7,75 e s = 1,215
O valor de tα para o teste é 1,796
A regra de rejeição é
x − µ0
7,75 − 7
Rejeita H 0 se t =
> tα ⇒ t =
= 2,14 > tα = 1,796
1,215 12
s n
Portanto, temos evidências para rejeitar a hipótese nula
231
Teste de hipótese – tamanho da
amostra
‰ O nível de significância de um teste de hipótese define
a probabilidade de Erro Tipo I
‰ Controlando o temanho da amostra, podemos também
controlar a probabilidade de Erro Tipo II
232
Teste de hipótese – tamanho da
amostra
‰ Vamos considerar inicialmente o teste abaixo:
H 0 : µ ≥ µ0
H a : µ < µ0
O limite inferior de aceitação de H0 é:
σ
xmin = µ 0 − zα
n
Se desejarmos uma probabilidade β para o Erro Tipo II se
a verdadeira média da população for µ1, devemos ter:
x − µ1
zβ = min
σ n
Resolvendo para n as duas equações acima, obtemos:
(
zα + zβ )2 σ 2
n=
(µ 0 − µ1 )2
233
Teste de hipótese – tamanho da
amostra
‰ Exemplo: Considerando os dados do exemplo anterior,
o gerente de qualidade fez duas afirmativas acerca do
teste em questão
‰ Se a duração média das baterias do lote for igual ou superior
a 120 hs, estou disposto a correr um risco de 5% de rejeitá-lo
‰ Se a duração média das baterias do lote for igual ou inferior a
115 hs, estou disposto a correr um risco de 10% de aceitá-lo
‰ Quantas baterias ele deve testar?
234
Teste de hipótese – tamanho da
amostra
‰ Solução: α = 0,05, β = 0,1, µ0 = 12 e µ1 = 115. Da
tabela normal temos:
zα = 1,645
zβ = 1,28
Calculando n obtemos:
(
zα + zβ )2 σ 2 (1,645 + 1,28)212 2
n=
=
= 49,28
(µ 0 − µ1 )2
(120 − 115)2
Logo, devemos retirar uma amostra de 50 baterias
235
Teste de hipótese – tamanho da
amostra
‰ Considerando o teste abaixo:
H 0 : µ ≥ µ0
¾
H a : µ < µ0
O limite superior de aceitação de H0 é:
σ
xmax = µ 0 + zα
n
Se desejarmos uma probabilidade β para o Erro Tipo II se
a verdadeira média da população for µ1, devemos ter:
µ −x
zβ = 1 max
σ n
Resolvendo para n as duas equações acima, obtemos:
(
zα + zβ )2 σ 2
n=
(µ1 − µ 0 )2
236
Exemplo (para casa)
‰Toma-se uma amostra dos preços de um certo
carro popular anunciados no jornal. Consideramos
apenas carros com 1 ano de uso. A amostra
contém 10 carros, o preço médio é R$9500 e o
desvio padrão dos preços é R$ 1200. O mesmo
carro, novo, custa R$ 12500 na concessionária.
Investigue a hipótese de que a depreciação no
primeiro ano seja maior que 20%.
237
Regressão Linear
‰ Modelos de regressão linear relacionam uma variável
dependente ou variável de resposta, Y, a uma ou mais
variáveis explicativas (também chamadas covariáveis ou
variáveis independentes), X.
‰ O modelo é linear nos parâmetros que relacionam Y aos X’s.
‰ A estimação destes modelos é geralmente feita por mínimos
quadrados ordinários, e os estimadores obtidos por este
algoritmo são ótimos sob certas condições, dadas pelo
teorema de Gauss e Markov.
238
Objetivos dos Modelos de
Regressão Linear
‰ Estudar a relação entre variáveis, para se testar
causalidade (linear) entre as variáveis
(ECONOMETRIA).
‰ (ii) Possibilitar análises de cenários ("What if
analysis")
‰ (iii) Permitir eventualmente a previsão da variável
dependente. (SÉRIES TEMPORAIS, REGRESSÃO
DINÂMICA)
239
REGRESSÃO LINEAR SIMPLES
‰Dependência Linear entre X e Y
‰O diagrama de dispersão tem o seguinte aspecto:
240
Regressão Linear Simples
‰Só uma variável explicativa
Y = β 0 + β1.x + ε
‰Modelo:
‰ Estão disponíveis n pares de observações (xi, yi)
‰ ε é um erro aleatório com média zero e variância
constante σ2 . Em muitas situações supomos que o
erro é Normal, o que nos permite obter intervalos de
confiança e realizar testes de hipóteses.
2
‰ Parâmetros desconhecidos: β 0 , β 1 e σ
‰A equação que descreve a forma como y está
relacionada a x é chamada de modelo de regressão
241
Regressão Linear Simples
‰ No caso de regressão linear simples, temos:
y = β0 + β1x + ε
‰ ε é uma variável aleatória chamada de erro da
regressão e representa a variação de y que não pode
ser explicada por sua relação linear com x – por
definição, seu valor esperado é zero
‰ Portanto, o valor esperado ou valor médio de y está
relacionado com x através de E(y) = β0 + β1x
‰ O gráfico da relação entre x e y é uma reta (reta de
regressão)
‰ β0 é chamado de intercepto
‰ β1 é chamado de inclinação
242
Estimação do modelo de regressão
linear simples
‰ Se os parâmetros β0 e β1 fossem conhecidos, nós
poderíamos utilizar o modelo de regressão linear
simples para determinar o valor esperado de y para um
dado valor de x
‰ Na prática, esses valores não são conhecidos e
necessitam ser estimados
‰ Utilizamos observações emparelhadas de x e y para
determinar os estimadores de β0 e β1 – b0 e b1
respectivamente, obtendo a seguinte equação de
regressão
yˆ = b + b x
0
1
243
Estimação do modelo de regressão
linear simples
‰ Para determinação de b0 e b1 utilizamos o método dos
mínimos quadrados
‰ Nesse método, os valores de b0 e b1 são tais que a
soma dos quadrados das diferenças entre os valores de
^ respectivos valores estimados
y observados (yi) e seus
pela equação de regressão
(yi) é mínima:
n
min
∑ ( yi − yˆi )2
i =1
Os valores de b0 e b1 são dados por:
b1 =
xi ∑ yi
∑
∑ xi yi −
n
2
xi )
(
∑
−
∑
n
xi2
b0 = y − b1 x
244
Estimação do modelo de regressão
linear simples
‰ Exemplo: o diretor de uma cadeia de restaurantes de fast-food
acredita que o volume de vendas de suas lojas seja positivamente
relacionado à população situada em um raio de 3 km. Determine
essa relação.
Loja
População
Vendas
(mil)
(R$ mil)
1
2
58
2
6
105
3
8
88
4
8
118
5
12
117
6
16
137
7
20
157
8
20
169
9
22
149
10
26
202
245
Estimação do modelo de regressão
linear simples
‰ Solução: calculando os termos parciais obtemos:
n = 10
∑ xi = 140
∑ yi = 1.300
∑ xi yi = 21.040
2
∑ xi = 2.528
Logo,
21.040 − (140)(1.300) / 10
=5
2
2.528 − (140) / 10
140 1.300
b0 =
−5
= 60
10
10
yˆ = 60 + 5 x
b1 =
246
Estimação do modelo de regressão
linear simples
‰ A reta de regressão juntamente com as observações
200
150
100
50
0
5
10
15
20
25
30
247
Estimação do modelo de regressão
linear simples
‰ Se nós acreditamos que a equação de regressão obtida
reflete a relação de y com x, podemos realizar algumas
previsões
‰ Por exemplo, se o diretor resolvesse instalar uma loja
em uma região cuja população em um raio de 3 km
fosse de 16.000 pessoas, as vendas projetadas seriam
de:
yˆ = 60 + 5.16 = 140
248
Ajuste do modelo de regressão aos
dados utilizados
‰ O modelo de regressão desenvolvido aproxima a
relação linear entre as variáveis x e y
‰ Uma pergunta importante: quão bem o modelo de
regressão representa essa relação linear?
‰ O coeficiente de determinação da regressão nos dá uma
medida do ajuste do modelo de regressão aos dados
utilizados
249
Ajuste do modelo de regressão aos
dados utilizados
‰ O i-ésimo resíduo é a diferença entre o valor
observado yi e o valor estimado pela equação de
regressão, e representa o erro obtido ao estimarmos yi.
‰ Ou seja: ei = yi − yˆ i = yi − b0 − b1 xi
‰ O método de mínimos quadrados encontra os
coeficientes b0 e b1 que minimizam a soma dos
quadrados
desses
resíduos.
Chamamos
essa
quantidade de soma dos quadrados devido ao erro,
SSE (do inglês sum of squares due to error)
SSE = ∑ ( yi − yˆ i )
2
250
Ajuste do modelo de regressão aos
dados utilizados
‰ Agora suponha que nos tenha sido pedido que
realizassemos estimativas para a variável dependente y
a partir apenas de seus valores observados, yi
‰ Sem o conhecimento de nenhuma variável explicativa,
ou seja, sem o modelo de regressão, a nossa melhor _
estimativa seria o valor médio das observações de y, y
_
‰ Para a i-ésima observação de y, yi, a diferença yi – y nos
fornece uma
_ medida do erro cometido ao estimarmos y
a partir de y
‰ Definimos como soma total dos quadrados, SST (do
inglês total sum of squares), a soma do quadrado
dessas diferenças
2
SST = ∑ ( yi − y )
251
Ajuste do modelo de regressão aos
dados utilizados
‰ Agora suponha que tenhamos conhecimento do modelo
de regressão
‰ O poder de explicação da relação linear entre x e y a
partir do modelo de regressão, para cada yi obervado,
em relação ao caso
_ anterior (conhecimento apenas dos
yi e utilização de y como estimativa) pode ser medido
pela
_ diferença entre os valores previstos pela regressão
ey
‰ Definimos como soma dos quadrados devido à
regressão, SSR (do inglês sum of squares due to
regression), a soma dos quadrados dessas diferenças
2
(
)
SSR = ∑ yˆ i − y
252
Ajuste do modelo de regressão aos
dados utilizados
‰ Abaixo, a visualização gráfica dessas três diferenças
yi − yˆ i
200
yˆ i − y
yˆ = 60 + 5 x
150
yi − yi
y
100
50
0
5
10
15
20
25
30
253
Ajuste do modelo de regressão aos
dados utilizados
‰ Embora não seja intuitivo, SSE, SSR e SST estão
relacionados da seguinte forma:
SST = SSR + SSE
O valor de SST é o mesmo independente do grau de ajuste
do modelo de regressão
Devemos esperar que, quanto melhor o ajuste do modelo
de regressão aos dados utilizados, menor a relação
SSE/SST e maior a relação SSR/SST
No limite, com um ajuste perfeito (a reta de regressão
passa exatamente sobre todos os pontos da amostra),
teremos SSE = 0 e SST = SSR
254
Ajuste do modelo e regressão aos
dados utilizados
‰ Definimos o coeficiente de determinação (r2) como:
r2 =
SSR ∑ ( yˆ i − y )
=
SST ∑ ( yi − y )
Quanto mais próximo de 1, melhor o ajuste do modelo de
regressão aos dados da amostra. Para o exemplo anterior,
SSR = 14.200, SST = 15.730 e r2 = 0.9027
O coeficiente de determinação também pode ser calculado
a partir do coeficiente de correlação entre x e y: r2 = (rxy)2
255
Teste de significância dos
parâmetros da regressão
‰ No modelo de regressão linear simples, a relação de
dependência entre y e x é expressa pelo parâmetro β1, que
por sua vez é estimado a partir de b1
‰ E como ocorre em qualquer estimação, cometemos um erro
ao utilizarmos b1 ao invés de β1
‰ O teste de significância de b1 é feito a partir do intervalo de
confiança de b1 para um determinado nível de confiança
escolhido
‰ Se o intervalo contiver o valor 0, significa que, para o nível
de significância escolhido, nós não podemos descartar a
hipótese de β1 (o parâmetro desconhecido) ser igual a zero
‰ Caso contrário, podemos concluir que, para o nível de
significância escolhido, β1 é diferente de zero
256
Teste de significância dos
parâmetros da regressão
‰ Para definirmos o intervalo de confiança de β1 devemos
ter algumas informações sobre a sua distribuição
amostral
‰ O valor esperado de b1, E(b1), é o próprio parâmetro β1
‰ O desvio-padrão de b1, σb1, pode ser estimado por sb1,
que é dado por:
sb1 =
SSE
n−2
2
(
)
∑ − ∑ xi
xi2
A distribuição de b1 é Normal
n
257
Teste de significância dos
parâmetros da regressão
‰ O intervalo de confiança é dado por:
b1 ± t α sb1
2
O valor de tα/2 é baseado em uma distribuição t de Student
com n – 2 graus de liberdade
Para o exemplo anterior, com um nível de significância de
5%, temos tα/2 = 2,3060 e um intervalo de confiança igual a:
5 ± 2,3060
13,83
= 5 ± 1,338
23,83
258
Intervalo de confiança para
previsões a partir do modelo de
regressão
‰ Se o valor obtido para b1 é significativamente diferente de
zero, podemos utilizar o modelo de regressão para efetuar
previsões da variável dependente y a partir de valores de x
‰ Inicialmente veremos como estimar o valor esperado (ou
valor médio) de y para um determinado x
‰ Esta estimativa nos fornece, por exemplo, o valor esperado de
faturamento para todas as lojas com uma determinada
população x ao redor
‰ O erro associado a esta previsão, para um determinado nível
de significância, é dado pelo intervalo de confiança
construído em torno deste valor esperado
259
Intervalo de confiança para
previsões a partir do modelo de
regressão
‰ Para x = xp e yp = b0 + b1xp, o intervalo de confiança
para um nível de significância α é:
yˆ p ± t α s yˆ p
2
s yˆ p
1
=s
+
n
(x p − x )2
2
2
(
)
−
x
x
∑i ∑i
n
SSE
s=
n−2
O valor de tα/2 é baseado em uma distribuição t de Student
260
com n – 2 graus de liberdade
Intervalo de confiança para
previsões a partir do modelo de
regressão
No exemplo anterior, para xp = 10, e α = 5%, temos:
yˆ p = 110
t α = 2,3060
2
s yˆ p
1
(10 − 14) 2
= 13,83
+
= 4,95
10 2528 − (140) 2 10
O que nos fornece o seguinte intervalo de confiança:
110 ± 2,3060.4,95
110 ± 11,415
261
Intervalo de confiança para
previsões a partir do modelo de
regressão
‰ Podemos também utilizar o modelo de regressão para efetuar
previsões de um valor individual da variável dependente y a
partir de valores de x
‰ Essas previsões nos dão uma estimativa de um único ponto y
a partir de um determinado x
‰ O erro associado a esta previsão, para um determinado nível
de significância, é dado pelo intervalo de confiança
construído em torno desse valor de y
‰ É razoável supor que esse erro seja maior que o do caso
anterior (estimativa do valor esperado de y)
262
Intervalo de confiança para
previsões a partir do modelo de
regressão
‰ Para x = xp e^yp = b0 + b1xp, definimos o intervalo de
confiança, para um nível de significância α, da seguinte
forma:
yˆ p ± t α s yˆind
2
sind = s 2 + s 2yˆ p
s=
1
= s 1+ +
n
(x p − x )2
2
2
(
)
x
x
−
∑i ∑i
n
SSE
n−2
O valor de tα/2 é baseado em uma distribuição t de Student
263
com n – 2 graus de liberdade
Intervalo de confiança para
previsões a partir do modelo de
regressão
No exemplo anterior, para xp = 10, e α = 5%, temos:
yˆ p = 110
t α = 2,3060
2
s yˆ p
1
(10 − 14) 2
= 14,69
= 13,83 1 + +
10 2528 − (140) 2 10
que nos fornece o seguinte intervalo de confiança:
110 ± 2,3060.14,69
110 ± 33,875
264
Intervalo de confiança para
previsões a partir do modelo de
regressão
Podemos observar graficamente os intervalos para o valor
yp
esperado de ^
yp e para um valor individual de ^
_
Note que o menor erro é obtido quando xp = x
250
Intervalo de confiança para
uma previsão de ^
y
200
Reta de regressão
150
100
Intervalo de confiança para o
valor esperado de ^
y
50
0
0
2
4
6
8
10
12
14
16
18
20
22
24
26
28
265
Utilizando a HP-12C e o Excel®
‰ A HP-12C pode ser utilizada para calcular os coeficientes da
regressão, o coeficiente de determinação e estimativas da
variável dependente. Para o exemplo anterior teríamos:
Tecla
Visor
Descrição
<f><Σ>
0,00 Limpa os registros estatísticos
58<ENTER>2<Σ+>
1,00 Primeiro dado inserido
105<ENTER>6<Σ+>
2,00 Segundo dado inserido
88<ENTER>8<Σ+>
3,00 Terceiro dado inserido
118<ENTER>9<Σ+>
4,00 Ops! Dado incorreto
118<ENTER>9<Σ->
3,00 Corrijo o dado incorreto
118<ENTER>8<Σ+>
4,00 Quarto dado inserido
117<ENTER>12<Σ+>
5,00 Quinto dado inserido
137<ENTER>16<Σ+>
6,00 Sexto dado inserido
157<ENTER>20<Σ+>
7,00 Sétimo dado inserido
266
Utilizando a HP-12C e o Excel®
‰Continuação
Tecla
Visor
Descrição
169<ENTER>20<Σ+>
8,00 Oitavo dado inserido
149<ENTER>22<Σ+>
9,00 Nono dado inserido
202<ENTER>26<Σ+>
10,00 Último dado inserido
0<g><y,r><STO>0
60,00 Coeficiente b0
<x y>2<yx>
1<g><y,r><RCL>0<->
10<g><y,r>
0,9027 Coeficiente de determinação
5,00 Coeficiente b1
110,00 Valor de y para x = 10
267
Utilizando a HP-12C e o Excel®
‰ O Excel possui uma ferramenta de análise de regressão
‰ No menu Ferramentas selecione Análise de Dados
‰ Caso esta opção não esteja disponível, selecione Add-Ins e
marque a caixa Ferramentas de Análise
‰ Em Análise de Dados, selecione Regressão
‰ Forneça as informações necessárias
‰ Intervalo dos valores de x
‰ Intervalo dos valores de y
‰ Nível de significância
‰ Intervalo de saída (local na planilha aonde o resultado será268
colocado)
Utilizando a HP-12C e o Excel®
Para o exemplo anterior temos:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.950122955
R Square
0.90273363
Adjusted R Square
0.890575334
Standard Error
13.82931669
Observations
10
Coeficiente de determinação
b0
b1
Limite inferior do intervalo
de confiança
ANOVA
df
Regression
Residual
Total
Intercept
X Variable 1
1
8
9
SS
14200
1530
15730
MS
14200
191.25
Coefficients tandard Erro t Stat
60 9.226035 6.503336
5 0.580265 8.616749
F
Significance F
Limite superior do intervalo
74.24836601
2.54887E-05
de confiança
P-value
0.000187444
2.54887E-05
Lower 95%
Upper 95%
Lower 99.0%
38.72471182 81.27528818 29.04314166
3.661905096 6.338094904
3.05298927
269
Utilizando a HP-12C e o Excel®
‰ Para o exemplo anterior temos:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.950122955
R Square
0.90273363
Adjusted R Square
0.890575334
Standard Error
13.82931669
Observations
10
df
Intercept
X Variable 1
Limite inferior do intervalo
de confiança
b0
ANOVA
Regression
Residual
Total
Coeficiente de determinação
b1
1
8
9
SS
14200
1530
15730
MS
14200
191.25
Coefficients tandard Erro t Stat
60 9.226035 6.503336
5 0.580265 8.616749
F
Significance F
74.24836601
2.54887E-05
P-value
0.000187444
2.54887E-05
Limite superior
do intervalo
de confiança
Lower 95%
Upper 95%
Lower 99.0%
38.72471182 81.27528818 29.04314166
3.661905096 6.338094904
3.05298927
270
Estudo de Caso – Regressão Linear
‰
A planilha stat_case3.xls contém as taxas de juros
praticadas por todas as instituições financeiras brasileiras
em 19/11/1999 nas seguintes modalidades de crédito:
1) Taxa pré fixada para aquisição de bens (denotada por
aq_bens)
2) Taxa pré fixada de cheque especial (indicada por ch_espec)
3) Taxa pré-fixada de crédito ao consumidor (denotada por cdc)
‰
Queremos saber a relação entre estas taxas, e responder
perguntas do tipo: um banco que cobra mais no cheque
especial cobra mais também no CDC? Além disso, se um
banco não tem produtos numa certa categoria, eu poderia
usar a taxa numa outra categoria para tentar “adivinhar”
quanto ele estaria cobrando.
271
Estudo de Caso – Regressão Linear
‰ Gráfico de CH_ESPEC versus AQ_BENS
14
CITIBANK S.A.
12
SANTANDER BRASIL S.A
BCN
HSBC
SAFRA
BRASIL
S.A.S.A.SA
SUDAMERIS
BRASIL
S.A
BRADESCO
AMERICA
S.A. BANK
DO SUL
FRANCES
EBANERJ
BRASILEIRO
S.A.
BANCO DO EST. DE GOI
ITAÚ S.A. UNIBANCO
FICSA S.A.
CH_ESPEC
10
CREDIBEL
S.A.
NOSSA CAIXA-NOSSO
BC
8
BANESTES S.A.
CACIQUE S.A.
MAXINVEST S.A.
TRIANGULO S.A.
INTERCAP S.A.
6
PROSPER S.A.
PANAMERICANO S.A.
4
2
0
0
1
2
3
4
5
AQ_BENS
6
7
8
9
10
272
Estudo de Caso – Regressão Linear
‰ Gráfico de CH_ESPEC versus CDC
16
CRUZEIRO DO SUL S.A.
14
CITIBANK S.A.
INDUSTRIAL E COMERCI
CH_ESPEC
12
PARANA
BANCO S.A.
MERCANTIL
DO
S.A. DO
SANTANDER BRASIL
S.A BANEB
BANCO
DOBRASIL
EST.
RS
BANDEIRANTES
S.A.
BANCO
DO
EST.
DE
PE
REAL
BCN S.A.
BEMGE
S.A.
CIDADE
S.A.
SAFRA
S.A.BRASIL
BANCO
HSBC
DESUL
BRASILIA
BANK
BRASIL
S.
SA S.A.
BRADESCO
SUDAMERIS
S.A
AMERICA
DO
S.A.
FRANCES E BANERJ
BRASILEIRO
S.A.
10
BANCO
DO EST.
DE GOI
MERIDIONAL
S.A.
UNIBANCO
BANKBOSTON
BANCO
DO EST.
DOS.A.
PR
ITAÚ
FICSA S.A.
ARAUCARIA
S.A.
BILBAO
VIZCAYA
BANCO
DOBRASI
EST.
DOPIA
MA
BANCO
DO
EST.
DO
BANCO
DO
EST.
DO
CE
BANCO
DO
EST. DO AM
MERCANTIL-FINASA
S.A
LUSO
BRASILEIRO
S.A.
CREDIBEL
S.A.
BANESTES
S.A.
NOSSA CAIXA-NOSSO BC
BANCO DOBANESPA
BRASIL
8
CAIXA
ECONOMICA FEDE
BOAVISTA
INTERATLANT
COOPERATIVO SICREDI
BR MERCANTIL S.A.
INTERIOR DE SP S.A. MINAS S.A.
TRIANGULORURAL
S.A. S.A.
BANCO DO EST.
DE SE S.A.
INTERCAP
6
ABN AMRO S.A.
BANCO DO EST. DOPROSPER
PA
S.A.
MATONE S.A.
BANCO
VR S.A.
PANAMERICANO
S.A.
BANCO DA AMAZONIA
FICRISA AXELRUD S.A.
INTERPART S.A.
4
CACIQUE S.A.
2
0
2
4
6
8
10
CDC
12
14
16
18
273
Estudo de Caso – Regressão Linear
‰ Gráfico de CDC versus AQ_BENS
18
CACIQUE S.A.
16
14
CREDITO LLOYDS
DE SP S.A.
TSB S.A.
FICSA
S.A. CFI S.A.
CREDITEC
CDC
12
10
CONTINENTAL S.A.
MORADA S.A. INTERMEDIUM - CFI S.
BRADESCO
C.S.C.
SA CFI S.A.
FINAUSTRIA CIA DE CR
8
PECUNIA S.A.
HSBC BANK BRASIL SA
PROSPER S.A.
INTERCAP S.A.
UNILETRA S/A CFI
BBV CFI S.A.
6
UNIBANCO
S.ADO
CFIEST. PERNAMBUCANAS
FINANC
ITAÚOMNI
S.A.
BANCO
DE GOI
BANERJ
S.A.LOCAL
MERCANTIL
BRASIL
FIN
AMERICA
SUDAMERIS
BRASIL
S.A SUL S.A.
BMG
S.A. DO
FRANCES
E
BRASILEIRO
GENERAL
MOTORS
S.A.
NOSSA
FINANC
CAIXA-NOSSO
ALFABCN
S.A.
BC
CFI
BARIGUI
S.A.
CFI
BB-FINANCEIRA
S.A.
BANESTES S.A.
4
SAFRA S.A.
CITIBANK
S.A. S.A. S.A.
TRIANGULO
FINANSINOS
FININVEST
S.A. S.A.
FINAMAX S.A.
CFI
PANAMERICANO
S.A. RENNER
A.J.
SANTANDER BRASIL S.A
CREDIBEL S.A.
BV FINANCEIRA SA CFI
2
0
0
2
4
6
AQ_BENS
8
10
12
274
Estudo de Caso – Regressão Linear
‰ Faça no Excel a regressão de CH_ESP versus CDC
‰ A equação ajustada é ch_esp = 8.94 - 0.105 cdc
Variável
Constant
cdc
S = 2.234
Coeficiente
Erro Padrão do Coef.
Estatística T
8.9442
0.6546
-0.105
0.1253
R2 =1.2%
R2 ajustado =
valor-p
13.66
-0.84
0.00
0.41
0.00%
‰ Mas, note que o ajuste do modelo é PÉSSIMO, como
indicado pelo baixíssimo valor do coeficiente de
detreminação R2 (igual a 1.2%). Também, o coeficiente do
termo linear não é significante (basta ver a sua estatística t
ou o “p-value”), indicando que o modelo poderia ter sido
perfeitamente substituído por um modelo constante! Agora
volte ao gráfico de CH_ESP versus CDC e tente enxergar
por que isso aconteceu... A relação entre as variáveis
parece linear? NÂO!
275
Estudo de Caso – Regressão Linear
‰ A planilha stat_case2.xls contém as vendas de carros, TV
a cores e videocassetes no mercado brasileiroi entre
Janeiro de 1995 e Dezembro de 1997.
‰ Calcule a matriz de correlação entre as variáveis.
‰ Faça o gráfico de vendas de carros versus vendas de TV.
‰ Faça o gráfico de vendas de TV versus vendas de
videocassetes.
‰ Faça o gráfico de vendas de carros versus vendas de
videocassetes.
‰ Ajuste um modelo de gressão linear simples onde y =
vendas de TV e x = vendas de video.
276
Estudo de Caso – Regressão Linear
‰Matriz de correlação
carros
TV
Video
carros
TV
Video
1
0.6524
1
0.6850 0.9495
1
‰ O coeficiente de correlação de uma variável com ela
mesma é sempre 1. Por que? Dica: qual a definição
do coeficiente de correlação?
‰ Note também a alta correlação entre vendas de TV e
Video.
277
Estudo de Caso – Regressão Linear
‰Gráfico carros X TV
Vendas de Carros (eixo Y) versus Venda de TVs (eixo X)
180,000
160,000
140,000
120,000
100,000
80,000
60,000
300,000
400,000
500,000
600,000
700,000
800,000
900,000
278
Estudo de Caso – Regressão Linear
‰Gráfico TV X Video
Vendas de TVs (eixo Y) versus Vendas de Videocassetes (eixo X)
900,000
800,000
700,000
600,000
500,000
400,000
300,000
70,000
120,000
170,000
220,000
270,000
320,000
279
Estudo de Caso – Regressão Linear
‰Gráfico Carros X Video
Vendas de Carros (eixo Y) versus Vendas de Videocassetes
(eixo X)
180,000
160,000
140,000
120,000
100,000
80,000
60,000
70,000
120,000
170,000
220,000
270,000
320,000
280
Estudo de Caso – Regressão Linear
‰ Regressão Linear de TV em Video
Estatísticas da Regressão
Multiple R
0.9495 <<< é o coef. de correlação
R Square
90.1% <<< é o coef. de determinação
Adjusted R Square
89.9%
Standard Error
45,634
Observations
36 <<< número de pares de observações
Coefficients
bo
b1
126,709.81
2.53
Standard Error
29,167.78
0.14
t Stat
4.34
17.64
P-value
0.01%
0.00%
Lower 95%
67,433.78
2.24
Upper 95%
185,985.84
2.82
‰ Note que agora o ajuste da regressão é ÓTIMO,
como já esperado, pois o gráfico entre as duas
variáveis mostrava uma relação altamente linear.
281
Estudo de Caso – Regressão Linear
‰ Regressão Linear de TV em Video
‰ Dicas:
‰ Quando os coeficientes b0 e b1 são significantes? Em geral,
se suas estatísticas t forem maiores que 2, em módulo,
podemos afirmar que os coeficientes são diferentes de zero.
Também podemos olhar para os intervalos de confiança
para b0 e b1 – se estes intervalos NÃO INCLUEM ZERO
podemos dizer que os coeficientes são significantes, e é
exatamente este o caso que acabamos de mostrar na
página anterior!
‰ Na próxima página está o gráfico dos valores reais e
ajustados (previstos) pela reta de regressão.
282
Estudo de Caso – Regressão Linear
‰Valores Reais e Previstos pela Regressão
Relação entre Vendas de Tv e Video e Reta de Regressão Ajustada
900,000
800,000
700,000
TV
600,000
500,000
400,000
300,000
200,000
70,000
120,000
170,000
220,000
270,000
Video
TV
TV prevista pela regressão
320,000
283
Estudo de Caso – Regressão Linear
– Para Casa
‰ Considere os dados do arquivo stat_case3.xls contidos na
pasta “bancos com todos os produtos”. Você deverá repetir
as análises mostradas aqui, e interpretar os resultados –
use sua criatividade! Abaixo segue um roteiro mínimo de
atividades que você deve desenvolver.
a) Faça o gráfico dos 3 pares de taxas.
b) Calcule a matriz de correlação entre as 3 variáveis (isto é,
as 3 taxas).
c) Calcule o máximo, mínimo, média, mediana, moda,
percentis 10 e 90% e desvio padrão de cada uma das taxas.
d) ajuste um modelo de regressao linear da forma y = a + b.x
para relacionar as diversas taxas.
4.1) Faça a regressão de CH_ESPEC em AQ_BENS
4.2) Faça a regressão de CH_ESPEC em CDC
4.3) Faça a regressão de CDC em CH_ESPEC
284
Estudo de Caso – Regressão Linear
– Para Casa
4.4) A partir da regressão que você estimou, qual seria a taxa
média de cheque especial para um banco que praticasse uma
taxa de crédito pessoal de 6% ao mês?
4.5) Faça um gráfico de CH_ESPEC versus CDC superpondo
a ele a reta estimada para a regressão. Você vai ver que a
reta estimada pela regressão está passando pelo "meio" da
nuvem de pontos (CDC,CH_ESPEC).
e) Neste item você vai precisar instalar o add-in “ferramentas
de análise” do Excel e usar o módulo de regressão dentro
destas ferramentas. O objetivo é fazer a regressão da taxa
CH_ESPEC (cheque especial) nas taxas AQ_BENS e CDC.
285
Estudo de Caso – Regressão Linear
– Para Casa
Ou seja, você procura ajustar a seguinte equação:
CH_ESPEC = a + b*AQ_BENS + c*CDC
Responda a seguinte pergunta a partir da equação ajustada
acima: se AQ_BENS é 4% a.m, CDC é 7% a.m, qual o valor
de CH_ESPEC?
286
Nota – Instalação das Ferramentas
de Análise do Excel
‰ Muitas das técnicas descritas aqui requerem a prévia
instalação do suplemento (“add-in”) “Ferramentas de
Análise” do Excel. O procedimento de instalação é
descrito a seguir:
‰ No menu Ferramentas, selecione “Suplementos” e
na caixa de diálogo que será aberta marque a opção
“Ferramentas de análise”. Se esta opção não estiver
presente, clique “procurar” para encontrar o arquivo
correspondente (em geral chamado Analys32.xll) ou
rode novamente o “set-up” do MS-Office.
287
Download

E(X) - M. Barros Consultoria