Testes e Exames de
Probabilidades e
Estatística
Enunciados com
resoluções
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o Teste (A)
Duração: 1 hora e 30 minutos
2o semestre 2004/05
30/04/2005 – 9 horas
Justifique convenientemente todas as respostas!
1. Um centro de combate e prevenção de incêndios dispõe, além de meios terrestres, de dois meios aéreos:
um ligeiro e um pesado. No caso de ocorrer um incêndio de pequenas proporções só o meio ligeiro
é activado e em 90% das vezes ele é extinto em menos de 24 horas. Quando um incêndio assume
maiores proporções em 70% dos casos é activado o meio pesado; nessas condições o incêndio é dado
como extinto em menos de 24 horas em 80% das vezes. Quando o meio pesado não é utilizável, o
apoio do meio ligeiro só garante a extinção de um incêndio de maiores proporções em menos de 24
horas em 15% das vezes. Admita que 75% dos incêndios registados na área abrangida pelo centro são
de pequenas proporções.
(a) Qual é a probabilidade de um incêndio, qualquer que seja a sua dimensão, ser extinto em menos
de 24 horas?
(1.5)
(b) Sabendo que um incêndio de grandes proporções foi extinto em menos de 24 horas, qual é a
probabilidade do meio pesado ter sido usado no seu combate?
(1.0)
2. Sejam A e B dois acontecimentos de um espaço de resultados Ω. Supondo que A e B são acontecimentos
independentes tais que P (A) > 0 e P (B) > 0, mostre que, para qualquer acontecimento C ⊂ Ω, se
tem
P (C | A) = P (B)P (C | A ∩ B) + P (B̄)P (C | A ∩ B̄).
(1.0)
3. O atraso, em minutos, nas ligações por via marı́tima entre duas cidades tem distribuição uniforme no
intervalo (0, 15). Admita ainda que os atrasos em diferentes ligações são independentes.
(a) Qual é a probabilidade de uma ligação com um atraso superior a 10 minutos chegar com um
atraso inferior a 12 minutos?
(1.0)
(b) Calcule a probabilidade de em dez ligações pelo menos uma ter um atraso inferior a 10 minutos.
(1.0)
(c) Determine a probabilidade de uma pessoa que vai observando a partir de uma das cidades a
chegada de sucessivas ligações tenha que assistir a pelo menos 15 chegadas até que surja a
primeira com um atraso superior a 10 minutos. Qual o número mais provável de chegadas a que
esse observador vai assistir?
(1.5)
4. Uma grande editora classifica o material que recebe quanto à urgência (X = 0: não urgente; X = 1:
urgente) e quanto ao conteúdo (Y = 0: só texto; Y = 1: só imagem; Y = 2: texto e imagem). A partir
dos registos existentes estimou-se de forma incompleta a seguinte função de probabilidade conjunta:
X \Y
0
1
0
0.15
0.05
1
a
b
2
0.30
0.20
(a) Sabendo que E[XY ] = 0.6 determine a e b.
(1.0)
(b) Calcule a função de distribuição condicional de Y dado X = 1. (Se não resolveu a alı́nea (a)
considere nesta alı́nea e na próxima que a = 0.1 e b = 0.2.)
(1.0)
(c) Que pode concluir a partir do valor do coeficiente de correlação entre X e Y neste caso concreto?
(1.0)
Página 1 de 1
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o Teste (B)
Duração: 1 hora e 30 minutos
2o semestre 2004/05
30/04/2005 – 11 horas
Justifique convenientemente todas as respostas!
1. Uma empresa pretende criar uma equipa para acorrer a problemas que provoquem paragens inesperadas de uma linha de produção. Dessa equipa farão parte dois engenheiros inexperientes e um número,
a determinar, de engenheiros com experiência. Sempre que houver um problema será destacado ao
acaso um dos engenheiros da equipa. Sabe-se que a probabilidade de um qualquer desses problemas ser prontamente resolvido é de 0.95 para um engenheiro experiente e de 0.8 para um engenheiro
inexperiente.
(a) Considere uma equipa formada por 7 engenheiros. Sabendo que um problema que ocorreu não
foi resolvido de imediato, qual a probabilidade de ter sido destacado um engenheiro inexperiente
para o tentar resolver?
(1.2)
(b) Qual deverá ser o número mı́nimo de engenheiros com experiência a incluir na equipa para que
a probabilidade de resolver um problema seja, no mı́nimo, de 0.9?
(1.3)
2. O número de falhas semanais de um braço robótico numa linha de montagem automóvel é uma variável
aleatória com distribuição de Poisson e valor esperado igual a 0.1.
(a) Calcule a probabilidade de ocorrer mais do que uma falha numa semana em que se sabe que
ocorreram falhas. Qual o número mais provável de falhas por semana?
(1.5)
(b) De cada vez que há uma falha, uma equipa técnica leva uma semana para averiguar as causas
dessa falha e elaborar um relatório. Calcule a probabilidade de ocorrer uma nova falha do braço
robótico durante o perı́odo em que decorre uma dessas investigações.
(1.5)
(c) Cada falha do braço robótico pode provocar a paragem de toda linha de montagem com probabilidade 0.01. Calcule a probabilidade da linha de montagem parar pelo menos uma vez num ano
(52 semanas) devido a esse tipo de falhas.
(1.5)
3. Seja X a variável aleatória que indica a ocorrência (1) ou não (0) de grandes catástrofes naturais em
perı́odos de uma década e numa dada região e Y a variável aleatória que representa o número de
nascimentos por casal no mesmo perı́odo de tempo. A função de probabilidade conjunta de (X, Y ) é
definida por
Y \X
0
1
2
0
2/9
1/9
1/18
1
1/9
2/9
5/18
(a) Determine as funções de probabilidade marginais de ambas as variáveis e identifique as distribuições dessas variáveis aleatórias.
(1.0)
(b) Numa década em que não ocorram catástrofes naturais qual o valor esperado do número de
nascimentos por casal?
(1.0)
(c) Determine o coeficiente de correlação de (X, Y ) e comente o valor obtido.
(1.0)
Página 1 de 1
Probabilidades e Estatı́stica
1o Teste – Teste A
2o semestre – 2004/05
Duração: 1 hora e 30 minutos
30/04/005 – 9 horas
RESOLUÇÃO ABREVIADA
1.
Acontecimento
IP =incêndio de pequenas proporções
IP =incêndio de grandes proporções
E=incêndio é extinto em 24 horas
M L=meio aéreo do tipo ligeiro
M P =meio aéreo do tipo pesado
Probabilidade
P (IP ) = 0.75
P (IP ) = 1 − P (IP ) = 0.25
P (M L|IP ) = 1
P (M P |IP ) = 0.7
¯ ) = 0.3
P (M L|IP ) = 1 − P (M P |IP
P (E|IP ∩ M L) = 0.9
P (E|IP ∩ M P ) = 0.8
P (E|IP ∩ M L) = 0.15
(a)
P (E) = P ((E ∩ IP ) ∪ (E ∩ IP )) = P (E ∩ IP ) + P (E ∩ IP ) =
= 0.675 + 0.15125 = 0.82625
pois
P (E ∩ IP ) = P ((E ∩ IP ∩ M L) ∪ (E ∩ IP ∩ M P )) =
(1)
= P (E ∩ IP ∩ M L) + P (E ∩ IP ∩ M P ) =
(1)
= P (E|IP ∩ M L) × P (IP ∩ M L) + 0 =
= P (E|IP ∩ M L) × P (M L|IP ) × P (IP ) =
= 0.9 × 1 × 0.75 =
= 0.675
e
1
P (E ∩ IP ) = P ((E ∩ IP ∩ M L) ∪ (E ∩ IP ∩ M P )) =
(2)
= P (E ∩ IP ∩ M L) + P (E ∩ IP ∩ M P ) =
= P (E|IP ∩ M L) × P (IP ∩ M L)+
+ P (E|IP ∩ M P ) × P (IP ∩ M P ) =
= P (E|(IP ∩ M L)) × P (M L|IP ) × P (IP )
+ P (E|IP ∩ M P ) × P (M P |IP ) × P (IP ) =
= 0.15 × 0.3 × 0.25 + 0.8 × 0.7 × 0.25 =
= 0.01125 + 0.14 = 0.15125
(1) M P ∩ IP = ∅ ⇒ P (M P ∩ IP ) = 0;
(2) M P ∩ M L ∩ IP = ∅.
(b)
P (E|IP ∩ M P ) × P (IP ∩ M P )
P (M P ∩ IP ∩ E)
=
=
P (IP ∩ E)
P (IP ∩ E)
0.8 × 0.7 × 0.25
=
' 0.9256
0.15125
P (M P |IP ∩ E) =
2.
P (C|A)
=
(2)e(3)
=
(3)
=
=
P (C ∩ A) (1) P (C ∩ A ∩ B) + P C ∩ A ∩ B̄
=
=
P (A)
P (A)
P (C|A ∩ B) × P (A ∩ B) + P C|A ∩ B̄ × P A ∩ B̄
=
P (A)
P (C|A ∩ B) × P (A) × P (B) + P C|A ∩ B̄ × P (A) × P B̄
=
P (A)
P (C|A ∩ B) × P (B) + P C|A ∩ B̄ × P B̄
Observar que:
(1) C ∩ A = (C ∩ A) ∩ Ω = (C ∩ A) ∩ (B ∪ B̄) = (C ∩ A ∩ B) ∪ (C ∩ A ∩ B̄);
(2) P (A ∩ B) > 0 e P (A ∩ B̄) > 0 pois A é independente de B logo P (A ∩ B) =
P (A) × P (B) e para além disso P (A) > 0 e P (B) > 0 e admite-se que P (B) 6= 1;
(3) A é independente de B então A é independente de B̄.
3. X= v.a. que indica o atraso, em minutos, na ligação marı́tima entre duas cidades.
X ∼ unif orme(0, 15); admite-se que os atrasos em ligações distintas são independentes.
(a)
R 12
1
dx
10 15
R
+∞
1
dx + 15
10 15
P (10 < X < 12)
P (X < 12|X > 10) =
= R 15
P (X > 10)
=
2/15
= 2/5 = 0.4
5/15
2
0dx
=
(b) Seja Y = v.a. que representa o número de ligações, em 10, com atraso inferior a 10
minutos.
Como os atrasos são independentes em diferentes ligações tem-se
2
Y ∼ binom n = 10, p = P (X < 10) =
3
5
pois p = P (X < 10) = 1 − P (X ≥ 10) = 1 − 15
= 23 . Observar que na alı́nea (a) já
se calculou P (X > 10). A probabilidade pedida é:
P (Y ≥ 1) = 1 − P (Y < 1) = 1 − P (Y = 0) = 1 − 10
(2/3)0 (1/3)10 ' 0.999.
0
(c) Seja W = v.a. que indica o número de ligações sucessivas observadas até que surja
uma com um atraso superior a 10 minutos.
W ∼ geom (p = P (X > 10)) ,
onde p = P (X > 10) = 13 . Pretende-se:
P (W ≥ 15) = 1 − P (W ≤ 14) = 1 −
14 X
w=1
= 1−
1 1
×
3
14
− 23
1 − 23
1
1−
3
w−1
1
=
3
' 0.0034
Ou de forma equivalente,
+∞ X
w−1
+∞ w−15 14
1
1 X 2
1
2
P (W ≥ 15) =
1−
=
=
3
3
3 w=15 3
3
w=15
14 X
+∞ t−1
1 2
2
=
=
3 3
3
t=1
14
14
1 2
1
2
' 0.0034
=
2 =
3 3
3
1− 3
O número mais provável corresponde à moda da v.a. W . Assim, denotando por
M o a moda da variável aleatória W , ter-se-á que M o = argmax{P (W = w)}. Para
encontrar esse valor basta observar que a função de probabilidade de W ,
w−1
1
2
P (W = w) =
, w = 1, 2, · · · ,
3
3
é decrescente, logo a moda será M o = 1. Então o número mais provável de chegadas
que essa pessoa vai assistir é um.
4. X = v.a. indicadora da urgência do material recebido;
Y = v.a. indicadora do tipo de conteúdo do material recebido;
(a)
X
E(XY ) =
xyP (X = x, Y = y) =
x,y
1 X
2
X
xyP (X = x, Y = y) = 0.6 ⇔
x=0 y=0
= b + 2 × 0.2 = 0.6 ⇔ b = 0.2
Por outro lado
XX
x
P (X = x, Y = y) = 1 ⇔ 0.45 + a + 0.45 = 1 ⇔ a = 0.1
y
3
(b)

0,
y<0





 0.05 = 1 , 0 ≤ y < 1
X
0.45
9
FY |X=1 (y) = P (Y ≤ y|X = 1) =
P (Y = yj |X = 1) =
0.25
5


yj ≤y

0.45 = 9 , 1 ≤ y < 2



1
2≤y
pois

0.05 = 1 , y = 0


0.45
9




0.20
4
P (X = 1, Y = y)
0.45 = 9 , y = 1
P (Y = y|X = 1) =
=

P (X = 1)
0.20 = 4 , y = 2



0.45
9


0,
c.c.
(c)
E(XY ) − E(X)E(Y )
p
V ar(X)V ar(Y )
V ar(X)V ar(Y )
0.015
0.6 − 0.45 × 1.3
'
= √
' 0.039
0.1510
0.2475 × 0.61
Corr(X, Y ) = p
Cov(X, Y )
=
pois pela alı́nea (a) sabe-se que E(XY ) = 0.6. Verifica-se ainda que X ∼ Bern (p = 0.45)
logo E(X) = 0.45 e V ar(X) = 0.45 × 0.55 = 0.2475.
X
yP (Y = y) = 0 × 0.20 + 1 × 0.30 + 2 × 0.5 = 1.3
E(Y ) =
y
E(Y 2 ) =
X
y 2 P (Y = y) = 0 × 0.20 + 1 × 0.30 + 4 × 0.5 = 2.3
y
V ar(Y ) = E(Y 2 ) − (E(Y ))2 = 2.3 − (1.3)2 = 0.61
já que

0.20, y = 0



X
0.30, y = 1
P (X = x, Y = y) =
P (Y = y) =
0.50, y = 2


x

0,
c.c.
X e Y são v.a. dependentes pois Corr(X, Y ) 6= 0. X e Y têm tendência para
variar no mesmo sentido porque Corr(X, Y ) > 0. A dependência linear entre elas
é extremamente fraca (0.039) pois o coeficiente de correlação está próximo de zero.
Isto é, a urgência do material recebido está fracamente relacionada com o conteúdo
desse material.
4
Probabilidades e Estatı́stica
1o Teste – Teste B
2o semestre – 2004/05
Duração: 1 hora e 30 minutos
30/04/005 – 11 horas
RESOLUÇÃO ABREVIADA
1.
Acontecimento
E=engenheiro experiente
Ē=engenheiro inexperiente
R=problema ser prontamente resolvido
Probabilidade
x , x a determinar
P (E) = x +
2
2
P (Ē) = x + 2
P (R|E) = 0.95
P (R|Ē) = 0.80
(a) Neste caso tem-se P (E) = 57 e P (Ē) = 27 , logo
P (R̄|Ē)P (Ē)
P (R̄)
1 − P (R|Ē) P (Ē)
=
1 − P (R|E)P (E) + P (R|Ē)P (Ē)
0.2 × 27
h
i
=
1 − 0.95 × 75 + 0.80 × 27
P (Ē|R̄) =
'
(Teo. Bayes)
(Teor. Prob. Total)
0.057
' 0.61
0.9071
Observar que E e Ē formam uma partição de Ω.
(b) Pretende-se determinar x tal que P (R) ≥ 0.9. Pelo teorema da probabilidade
total sabe-se que essa condição é equivalente a
P (R|E)P (E) + P (R|Ē)P (Ē)
x
2
⇔ 0.95 ×
+ 0.80 ×
x+2
x+2
0.95x + 1.6
⇔
2+x
⇔ 0.95x + 1.6 − 1.8 − 0.9x
≥ 0.9 ⇔
≥ 0.9 ⇔
≥ 0.9 ⇔
≥ 0 ⇔
0.2
⇔x ≥
=4
0.05
O número mı́nimo de engenheiros com experiência a incluir será quatro.
2. X= v.a. que indica o número de falhas semanais de um braço robótico.
X ∼ P oisson(λ), para algum λ > 0 e sabe-se que E(X) = 0.1 logo que
X ∼ P oisson(0.1).
5
(a)
P (X > 1)
P (X > 1 ∧ X > 0)
=
=
P (X > 0)
P (X > 0)
0.0047
1 − P (X ≤ 1) (1) 1 − 0.9953
=
=
' 0.05
=
1 − P (X = 0)
1 − 0.9048
0.0952
P (X > 1|X > 0) =
(1) Valores obtidos consultando a tabela da função de distribuição P oisson(0.1)
ou efectuando os respectivos cálculos usando a função de probalidade.
O número mais provável corresponde à moda da v.a. X. Assim, denotando por
M o a moda da variável aleatória X, ter-se-á que M o = argmax{P (X = x)}.
Para encontrar esse valor basta observar que
0.1x+1
e
P (X = x + 1)
0.1
(x + 1)!
=
=
< 1, ∀x≥0
x
0.1
P (X = x)
x+1
e−0.1
x!
−0.1
o que implica que a função de probabilidade de X é decrescente, logo a moda
será M o = 0. Então o número mais provável de falhas por semana é zero.
(b) Defina-se W = v.a. que representa o tempo (em semanas) que decorre até à
ocorrência de uma falha.
Para que a falha seguinte ocorra antes de terminar a semana é porque na semana
ocorreu pelo menos uma falha. Logo, a probabilidade pedida
P (W < 1) = P (X ≥ 1) = 1 − P (X = 0) = 1 − e−0.1 ' 0.095.
Ou, em alternativa, usando a relação da distribuição Poisson com a distribuição
exponencial sabe-se que
W ∼ exp(λ = 0.1).
A probabilidade pedida vem então
Z1
P (W < 1) =
0.1e−0.1 dw = 1−e−0.1 ' 0.095
0
.
(c) Defina-se Y = v.a. que indica o número de paragens, num ano, da linha de
montagem devido à ocorrência de falhas do braço robótico.
e
X52 = v.a. que indica o número de falhas, num ano (52 semanas), que ocorrem
no braço robótico.
Pelas propriedades do Processo de Poisson sabe-se que
X52 ∼ P oisson(52 × 0.1 = 5.2),
pois pelo enunciado, X ∼ P oisson(0.1).
Sabe-se ainda que a probabilidade da linha de montagem parar devido a falha
no braço robótico é igual a 0.01. A variável aleatória Y condicionada a X52 = x
que representa o número de paragens da linha de montagem, num ano, em x
falhas do braço robótico, tem, assumindo independência entre as falhas no braço
robótico,
Y |(X52 = x) ∼ binom(n = x, p = 0.01).
6
A probabilidade pedida é
P (Y ≥ 1) = 1 − P (Y = 0) =
= 1 − [P (Y = 0 ∧ X52 = 0) + P (Y = 0 ∧ X52 = 1)
+P (Y = 0 ∧ X52 = 2) + · · · ] =
+∞
X
=1−
P (Y = 0, X52 = x) =
x=0
=1−
+∞
X
P (Y = 0|X52 = x) P (X52 = x) =
x=0
=1−
+∞
X
0.010 × (1 − 0.01)x ×
x=0
−5.2
=1−e
+∞
X
(0.99 × 5.2)x
x!
x=0
e−5.2 5.2x
=
x!
=
= 1 − e−5.2 × e0.99×5.2 = 1 − e−5.2×0.01 ' 0.05
3. X = v.a. indicadora da ocorrência de grandes catástrofes naturais;
Y = v.a. que indica o número de nascimentos por casal;
(a) A função probabilidade marginal de X é dada por
X
P (X = x) =
P (X = x, Y = y)
y∈{0,1,2}

7, x=0


 18
11 , x = 1
=

18


0,
c.c.
11 .
i.e. X ∼ Bern p = 18
A função probabilidade marginal de Y é dada por
P (Y = y) =
1
X
P (X = x, Y = y)
x=0
1 , y = 0, 1, 2
3
0, c.c.
(
=
i.e. Y ∼ unif {0, 1, 2} .
(b) A função de probabilidade condicionada de Y dado X = 0 é

2/9

=

7/18


1/9
P (X = 0, Y = y)  7/18 =
P (Y = y|X = 0) =
= 1/18

P (X = 0)
=

7/18



0,
4
7, y = 0
2
7, y = 1
1
7, y = 2
c.c.
donde
E(Y |X = 0) =
X
yP (Y = y|X = 0) = 1 ×
y
7
2
1
4
+2× =
7
7
7
(c)
Cov(X, Y )
E(XY ) − E(X)E(Y )
Corr(X, Y ) = p
= p
=
V ar(X)V ar(Y )
V ar(X)V ar(Y )
14 11
1
−
×1
r 18
' 6 ' 0.4187
= 18
0.398
2
77
×
182 3
pois
E(Y ) =
X
yP (Y = y) =
y∈{0,1,2}
E(Y 2 ) =
X
1
× (0 + 1 + 2) = 1
3
y 2 P (Y = y) =
y∈{0,1,2}
V ar(Y ) = E(Y 2 ) − (E(Y ))2 =
5
1
× (12 + 22 ) =
3
3
5
2
−1=
3
3
Pela alı́nea anterior pode afirmar-se que:
11
18 11
11
77
V ar(X) =
1−
= 2
18
18
18
e
1
X
X
5
14
2
=
E(XY ) =
xyP (X = x, Y = y) = 1 × 1 × + 1 × 2 ×
9
18
18
x=0
E(X) =
y∈{0,1,2}
X e Y são v.a. dependentes já que Corr(X, Y ) 6= 0. X e Y têm tendência para
variar no mesmo sentido porque Corr(X, Y ) > 0. A dependência linear entre elas é
moderada (0.4187) pois o coeficiente de correlação está próximo de 0.5. Isto é, a ocorrência de catástrofes naturais parece estar associada com o aumento de nascimentos
por casal, no entanto esta relação é moderada.
8
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o Exame/2o Teste
Duração: 3 horas/1 hora e 30 minutos
2o semestre 2004/05
23/06/2005 – 9 horas
• Se pretende fazer o 2o teste deve resolver apenas o grupo II.
• Se pretende fazer o exame deve resolver ambos os grupos.
• Justifique convenientemente todas as respostas!
Grupo I
10 valores
1. Um vendedor de pequenos motores eléctricos inclui, em cada encomenda e com igual probabilidade, 0, 1 ou 2 motores com ligeiros defeitos. Esse vendedor prepara-se para entregar uma
encomenda de 10 motores e sabe que o comprador irá inspeccionar dois motores escolhidos
ao acaso. Se forem encontrados defeitos em qualquer motor inspeccionado toda a encomenda
é rejeitada.
(a) Qual a probabilidade de o vendedor ver a sua entrega rejeitada?
(1.5)
(b) O comprador recebeu a encomenda e não a rejeitou. Qual a probabilidade de essa
encomenda conter dois motores com defeitos?
(1.0)
2. Suponha que em cada emissão de um programa popular num determinado canal televisivo,
o tempo de publicidade por cliente tem distribuição normal de valor médio 7.5 minutos e
desvio padrão de 2 minutos.
(a) Qual é o tempo de publicidade que é excedido:
(1.5)
i) em 15% das emissões?
ii) e em 50 % das emissões? Qual a denominação usual para este tempo?
(b) O departamento comercial desse canal televisivo tem a seguinte regra: independentemente do tempo de publicidade existe uma taxa fixa de e200 para um cliente que
pretenda efectuar publicidade durante uma emissão desse programa. Para além disso,
se o tempo de publicidade for inferior a 3 minutos o cliente paga e500, se esse tempo
estiver entre 3 e 5 minutos o cliente paga e700 e se o tempo de publicidade for superior a
5 minutos ele pagará e1000. Qual é o valor esperado de receitas que esse canal receberá
devido à publicidade, por cliente, durante a emissão desse programa? E o valor mais
provável?
(2.0)
3. Admite-se que o tempo de vida, em anos, de um tipo de projector usado para iluminar pistas
de aeroportos segue uma distribuição exponencial. Sabe-se ainda que 20% dos projectores
avariam durante o primeiro ano de utilização.
(a) Numa pista iluminada por 500 projectores, qual a probabilidade aproximada de mais
de 80 avariarem durante o primeiro ano de funcionamento?
Página 1 de 2
(1.5)
(b) A potência radiante de um projector (em 103 W) com x > 0 anos de vida tem uma
distribuição exponencial com valor esperado 1/x.
i) Determine a função densidade de probabilidade conjunta do tempo de vida e da
potência radiante de um projector.
(1.0)
ii) Calcule a probabilidade de a potência radiante de um projector não exceder 500 W.
(1.5)
Grupo II
10 valores
1. Num estudo sobre famı́lias com dois filhos foi recolhido o seguinte conjunto de dados referentes
a 120 famı́lias:
Y \X
0 (masculino)
1 (feminino)
0 (masculino)
36
31
1 (feminino)
37
16
em que as variáveis X e Y indicam o género do primeiro e segundo filhos, respectivamente.
(a) Calcule a estimativa de máxima verosimilhança da proporção de crianças do sexo feminino, p, na população em estudo. (Note que na tabela estão registadas 240 crianças.)
(1.5)
(b) Averigue se os dados recolhidos suportam a hipótese da equiprobabilidade dos géneros
dos filhos nessas famı́lias.
(2.0)
(c) Admita que, nas famı́lias em estudo, os géneros dos dois filhos são independentes e que
a probabilidade de uma criança ser do sexo feminino é sempre igual a p. Mostre que a
probabilidade de numa famı́lia haver um filho de cada género é igual a 2p(1−p). Verifique
que o estimador T = 2X̄(1 − X̄) não é um estimador centrado dessa probabilidade e
sugira um outro estimador que seja centrado.
(1.5)
(d) Teste, ao nı́vel de significância de 5%, a hipótese da independência entre os géneros dos
dois filhos nessas famı́lias.
(1.5)
2. No decorrer de um estudo sobre a relação entre as classificações a Análise Matemática (AM)
e a Probabilidades e Estatı́stica (PE) de um determinado curso, foram observadas as notas
finais (de 0 a 20 valores) obtidas nessas disciplinas por um conjunto de alunos seleccionados
aleatoriamente. Os resultados obtidos foram os seguintes:
PE (y)
AM (x)
10
X
i=1
xi = 122.00,
11.2
12.0
10
X
i=1
10.0
10.0
14.4
13.4
x2i = 1535.76,
10
X
13.4
15.0
6.2
8.8
10.0
11.2
yi = 114.40,
i=1
10
X
13.0
14.4
8.0
9.6
yi2 = 1388.64,
i=1
16.0
15.2
10
X
12.2
12.4
xi yi = 1453.40
i=1
Considerando um modelo de regressão linear simples de Y em x:
(a) Obtenha a recta de regressão dos mı́nimos quadrados e, com base nela, calcule uma
estimativa da diferença entre as notas finais esperadas em PE de dois alunos cujas notas
em AM diferem de 2 valores.
(1.5)
(b) Obtenha um intervalo de confiança a 99% para o declive da recta de regressão. O que
pode dizer sobre a significância do modelo de regressão?
(2.0)
Página 2 de 2
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
o
o
2o semestre 2004/05
1 Exame/2 Teste – 23/06/2005
Grupo I
10 valores
1. (a) Sejam Y =v. a. que representa o número de motores com defeito colocados na encomenda e X=v. a. que indica o número de motores com defeitos, de entre 2 (retirados
ao acaso e sem reposição) de uma caixa com 10 motores.
Tem-se que Y ∼ unif orme {0, 1, 2} e X|Y = y ∼ hipergeom(N = 10, M = y, n = 2).
P (encomenda ser rejeitada) = P (X ≥ 1) = 1 − P (X = 0) =
= 1 − 0.8074 = 0.1926
pois
P (X = 0) =
2
X
P (X = 0, Y = y) =
y=0
=
2
X
P (X = 0|Y = y) × P (Y = y) =
y=0
=
=
=
=
10 − y
y
2
X
1
2
0
× =
10
3
y=0
2

 10
9
8

1 2
2
2 
 =
+
+
10
10 
3  10
2
2
2
1
[1 + 18/45 + 28/45] =
3
1
[1 + 0.8 + 0.62(2)] ' 0.8074
3
Observação: Uma resolução alternativa passaria pela definição de acontecimentos e
uso de cálculo combinatório.
(b)
P (Y = 2, X = 0)
P (X = 0|Y = 2) × P (Y = 2)
=
P (X = 0)
P (X = 0)
1/3 × 0.62(2)
=
' 0.2569
0.8074
P (Y = 2|X = 0) =
2. (a)
i) X=v. a. que representa tempo (em minutos) em publicidade, por cliente, na
emissão de determinado programa popular, X ∼ N (µ = 7.5, σ 2 = 22 ).
1
Pretende-se x : P (X > x) = 0.15. Vem então
P (X > x) = 0.15 ⇔ 1 − P (X ≤ x) = 0.15 ⇔ P (X ≤ x) = 0.85
x − 7.5
x − 7.5
⇔ Φ
= 0.85 ⇔
= Φ−1 (0.85)
2
2
⇔ x = Φ−1 (0.85) × 2 + 7.5 ⇔
⇔ x = 1.0364 × 2 + 7.5 = 9.57 minutos
ii) Pretende-se m : P (X > m) = 0.50. Já que a f.d.p da distribuição normal é
simétrica em torno do valor médio é imediato que m seja 7.5 minutos. Este valor
corresponde à mediana da distribuição.
(b) R= v. a. que indica a receita, em euros, devido à publicidade de um cliente por
emissão.
A função de probabilidade de R será dada por

P (X < 3) = 0.0122,



 P (3 ≤ X ≤ 5) = 0.0934,
P (R = r) =

P (X > 5) = 0.8944,



0,
r = 700
r = 900
,
r = 1200
c.c
onde
P (X < 3) = Φ
3 − 7.5
2
= Φ (−2.25) = 1 − Φ (2.25) = 1 − 0.9878 = 0.0122
5 − 7.5
3 − 7.5
P (3 ≤ X ≤ 5) = Φ
−Φ
=
2
2
= Φ (−1.25) − Φ (−2.25) =
= 1 − Φ (−1.25) − 0.0122 = 1 − 0.8944 − 0.0122 = 0.0934
e
P (X > 5) = 1 − Φ
5 − 7.5
2
= 1 − Φ (−1.25) = Φ (1.25) = 0.8944.
O valor esperado de receitas é então
X
E (R) =
r × P (R = r) =700×0.0122+900×0.0934+1200×0.8944 = 1165.88 euros.
r
O valor mais provável corresponde a r = 1200 euros, ou seja é moda da v. a. R.
3. (a) X= v. a. que indica o tempo de vida, em anos, de um tipo de projectores,
X ∼ exponencial(λ).
Seja Y = v.a. que representa o número de projectores, em 500, que avariam durante o
primeiro ano de vida.
Admitindo que as avarias são independentes em diferentes projectores ter-se-á
Y ∼ binom (n = 500, p = P (X ≤ 1) = 0.2)
2
já que, pelo enunciado, se sabe que 20% dos projectores avariam durante o primeiro
ano de vida, i. e., P (X ≤ 1) = 0.2.
A probabilidade pedida é
P (Y > 80) =
500 X
500
y
y=81
0.2y 0.8500−y
porém esta probabilidade não é de fácil cálculo nem esta distribuição está tabelada,
mas como np = 100 > 5 e n(1 − p) = 400 > 5 pode recorrer-se à seguinte aproximação
a
Y ∼ N (µ = 500 × 0.2 = 100, σ 2 = 500 × 0.2 × 0.8 = 80)
com correcção de continuidade obtém-se
80 + 0.5 − 100
√
' 1 − Φ(−2.18) = Φ(2.18) = 0.9854
P (Y > 80) ' 1 − Φ
80
e sem correcção de continuidade obtém-se
80 − 100
√
P (Y > 80) ' 1 − Φ
' 1 − Φ(−2.24) = Φ(2.24) = 0.9875.
80
(b) Seja W = v.a. que representa a potência radiante de um projector.
Pelo enunciado sabe-se que W |X = x ∼ exponencial(γ) e E(W ) = 1/x, logo γ = x.
i) A função densidade conjunta do par (X, W ) é
f(X,W ) (x, w) = fW |X (w) × fX (x) = γe−γw × λe−λw = xe−xw × λe−λx = xλe−x(w+λ) ,
para (x, w) ∈ IR+ × IR+ .
ii) A probabilidade pedida é:
Z0.5
P (W < 0.5) = fW (w)dw,
0
para simplificar os cálculos encontre-se em primeiro lugar a f.d.p da v. a. W .
Observe-se que esta pode ser determinada de duas formas distintas:
Processo 1: (primitivação por partes)
Z+∞
Z+∞
fW (w) =
fX,W (x, w)dx =
xλe−(w+λ) dx =
0
=
0
−(w+λ)x
−(w+λ)x
e
e
λx −
λ
−(w + λ)
(w + λ)2
+∞
=
0
λ
, w ∈ IR+
(w + λ)2
Processo 2: (observando que se obtém o valor médio de uma exponencial de
parâmetro w + λ)
Z+∞
Z+∞
fW (w) =
f(X,W ) (x, w) dx =
xλe−(w+λ)x dx =
0
=
λ
w+λ
0
Z+∞
x(w + λ)e−(w+λ)x dx =
0
3
λ
, w ∈ IR+
(w + λ)2
Então
Z0.5
Z0.5
P (W < 0.5) = fW (w)dw =
0
0
0.5
λ
λ
λ
=−
+ 1.
2 dw = −
w+λ 0
0.5 + λ
(w + λ)
Resta ainda determinar o valor de λ. Pelo enunciado geral sabe-se que
P (X ≤ 1) = 0.2 ⇔ P (X ≤ 1) = FX (1) = 1 − e−λ = 0.2 ⇔ λ = − ln 0.8 = 0.223.
Finalmente
ln 0.8
' 0.6914.
P (W < 0.5) = 1 +
0.5 − ln 0.8
Grupo II
10 valores
1. (a) Seja X = v. a. indicadora do género da criança, X ∼ Bernoulli(p), onde p=P(criança
do género feminino) é desconhecido.
Seja (X1 , X2 , . . . , Xn ) uma amostra aleatória de dimensão n proveniente da população
X e (x1 , x2 , . . . , xn ) uma sua concretização (amostra). A função verosimilhança é, para
xi ∈ {0, 1} , i = 1, 2, . . . , n, dada por
iid
L(p|x1 , x2 . . . , xn ) ≡ fX1 ,...,Xn (x1 , . . . , xn ) =
= p
P
n
i=1
xi
n−
(1 − p)
P
n
Y
fX (xi ) =
i=1
n
i=1
xi
n
Y
pxi (1 − p)1−xi =
i=1
, p ∈]0, 1[
e a função log-verosimilhança, para xi ∈ {0, 1} , i = 1, 2, . . . , n, é dada por
"
#
n
n
X
X
l (p|x1 , x2 , . . . , xn ) = ln (L(p|x1 , x2 , . . . , xn )) =
xi ln p + n −
xi ln (1 − p)
i=1
i=1
A estimativa de máxima verosimilhança de p, p̂, maximiza a função log-verosimilhança,
i. e., deve ser tal que
 dl(p|x
,
.
.
.
,
x
)
1
n


=0

dp
p=p̂
2
d l(p|x1 , . . . , xn )


<0

dp2
p=p̂
Neste caso tem-se



P
n
i=1
xi
−
(n−
P
n
i=1
xi )
P
=0
Pn
n

 − i=12 xi − (n− i=12 xi ) < 0,
p
(1−p)
p
1−p
⇔ p = n−1
n
P
i=1
∀p ∈]0, 1[
Logo a estimativa de máxima verosimilhança de p é dada por
p̂ = n
−1
n
X
xi = x̄.
i=1
Particularizando para a amostra recolhida obtém-se:
p̂ =
37 + 31 + 2 × 16
' 0.417.
240
4
xi
(b) Continue a denotar-se por p a probabilidade de uma criança ser do género feminino e
considerem-se as hipóteses
H0 : p = p0 = 0.5 vs H1 : p 6= 0.5.
Sob H0 , E(X̄) = E(X) = p0 e V ar(X̄) = V ar(X)/n = p0 (1 − p0 )/n. Como sob H0
V ar(X) < ∞ e temos uma sucessão de variáveis aleatórias {Xi } i = 1, 2, · · · , n i.i.d
com X e n > 30 então
X̄ − p0 a
X̄ − E(X̄)
∼ N (0, 1)
=q
T0 = p
p0 (1−p0 ) T LC
V ar(X̄)
n
A amostra observada conduz a x̄ = 0.417 logo
x̄ − p0
t0 = q
p0 (1−p0 )
n
0.417 − 0.5
−0.083
=r
=
≈ −2.59
0.032
0.5(1 − 0.5)
240
Decisão: Determine-se o valor-p.
Tendo em conta as hipóteses especificadas,
o valor-p = 2 × min{P (T0 ≤ −2.59|H0 ), P (T0 > −2.59|H0 )} = 2[1 − Φ(| − 2.59|)] =
2[1 − 0.9952] = 2 × 0.0048 = 0.0096
então devemos rejeitar H0 para nı́veis de significância > 0.0096. Isto é, há evidência
para rejeitar H0 para os nı́veis de significância usuais (1%, 5% e 10%) logo parece não
haver equiprobabilidade no género dos filhos dessas famı́lias.
(c) A probabilidade pedida é:
P (ter um filho de cada género) = P ((X = 1, Y = 0) ∨ (X = 0, Y = 1)) =
= P (X = 1, Y = 0) + P (X = 0, Y = 1) =
= P (X = 1) P (Y = 0) + P (X = 0) P (Y = 1) =
= p (1 − p) + (1 − p) p = 2p (1 − p)
E[T ] = E 2X̄ 1 − X̄
h
2 i
2
= 2 E X̄ − E X̄
= 2 E X̄ − V ar X̄ − E X̄
p (1 − p)
2 (n − 1)
= 2 p−
− p2 =
p (1 − p)
n
n
6
=
2p (1 − p) , ∀n ∈ IN
n
Um estimador centrado poderá ser T ∗ = n−1
T . Uma outra alternativa, para um
estimador centrado para 2p (1 − p), poderá ser 2×S 2 já que S 2 é um estimador centrado
da V ar(X) = p(1 − p).
(d) Teste de independência do qui-quadrado de Pearson.
Hipóteses: H0 : X é independente de Y vs H1 : X não é independente de Y ;
A estatı́stica de teste é:
r X
s
X
(Oij − Eij )2 a
∼ χ2(r−1)(s−1)
Q=
sobH
Eij
0
i=1 j=1
5
onde r=número de categorias da v.a. X, s=número de categorias da v.a. Y ; Oij =
número de elementos na categoria (i, j); Eij = número esperado de elementos na categoria (i, j) sob H0 .
Determinação do valor observado da estatı́stica de teste:
As probabilidades sob H0 :
p0ij = P (X = i) × P (Y = j),
são desconhecidas e, por isso, estimam-se por
p̂0ij =
ni· n·j
×
,
n
n
ni· n·j
ni· × n·j
×
=
.
n
n
n
Com base na amostra dada vem ê11 ' 40.76, ê12 ' 26.24, ê21 ' 32.24 e ê22 ' 20.76
obtendo-se Êij = n ×
o que conduz a
qobs =
(36 − 40.76)2 (31 − 26.24)2 (37 − 32.24)2 (16 − 20.76)2
+
+
+
40.76
26.24
32.24
20.76
' 0.5559 + 0.8634 + 0.7027 + 1.091 = 3.213
Para o nı́vel de significância especificado, α = 5%, tem-se:
Região Crı́tica para Q: RCα = (c, +∞)
com c = Fχ−1
2
(r−1)(s−1)
(1 − 0.05) = Fχ−1
2
(0.95) = 3.841
(2−1)(2−1)
logo RC0.05 = (3.841, +∞).
Como o valor observado da estatı́stica de teste (qobs = 3.213) não pertence a RC0.05 ,
existe evidência para não rejeitar H0 ao nı́vel de significância de 5%. Ou seja, os géneros
dos filhos parecem ser independentes.
2. (a) Modelo de RLS:
Yi = β0 + β1 xi + εi ,
onde
Yi : variável aleatória que representa a classificação de PE obtida pelo i-ésimo aluno;
xi : variável explicativa que representa classificação de AM obtida pelo i-ésimo aluno;
β0 : ordenada na origem;
β1 : parâmetro regressor;
εi : erro aleatório associado ao i-ésimo aluno, verificando:
i) E [εi ] = 0;
ii) V ar [εi ] = σ 2 ;
iii) Cov [εi , εj ] = 0, ∀i,j (i 6= j);
6
i = 1, 2, . . . , 10.
Cálculos auxiliares:
n
P
xi yi − nx̄ȳ = 1453.4 − 122 ×
i=1
n
P
i=1
n
P
114.4
10
= 57.72
x2i − nx̄2 = 1535.76 − 122 × 12.2 = 47.36
yi2 − nȳ 2 = 1388.64 − 114.4 × 11.44 = 79.904
i=1
As estimativas de mı́nimos quadrados de β1 e β0 são respectivamente:
n
P
xi yi − nx̄ȳ
57.73
i=1
β̂1 = P
=
≈ 1.22
n
47.36
2
2
xi − nx̄
i=1
e
βˆ0 = ȳ − βˆ1 x̄ = 11.44 − 1.22 × 12.2 = −3.444,
logo a estimativa dos mı́nimos quadrados da recta de regressão é dada por:
E\
[Y |x] = −3.444 + 1.22x
Como E [Y |(xj + 2)]−E [Y |xj ] = β0 +β1 (xj +2)−β0 −β1 xj = 2β1 , então uma estimativa
dessa diferença será
2β̂1 = 2 × βˆ1 = 2 × 1.22 = 2.44.
(b) Pretende-se um intervalo de confiança a 99% para β1 .
Considerando como hipótese de trabalho que os erros εi possuiem distribuição normal
pode considerar-se a seguinte variável aleatória fulcral:
β̂1 − β1
T =s
P x −nx̄
∼ t(n−2)
σ̂ 2
n
i=1
2
i
2
n
2
1 X
onde σ̂ =
Yi − Ŷi .
n − 2 i=1
2
Após dedução, o intervalo aleatório com 99% de confiança para β1 , é dado por:


v
u

σ̂ 2
u

−1
IAC99% (β1 ) = β̂1 ± Ftn−2 (1 − α/2)u P
n
t

x2i − nx̄2
i=1
n
2
1 X
com σ̂ =
Yi − Ŷi .
n − 2 i=1
2
Concretização:
β̂1 = 1.22
7




" n
!
!#
n
2 X
X
1
σ̂ 2 =
yi2 − nȳ 2 − β̂1
x2i − nx̄2
=
n−2
i=1
i=1
1
=
79.904 − 1.222 × 47.36 ' 1.177
8
−1
−1
e como 1 − α = 0.99 então α = 0.01 e a = Ft(8)
1 − α2 = Ft(8)
(1 − 0.005) =
−1
Ft(8) (0.995) = 3.355.
Obtendo-se
r
IC99% (β1 ) =
1.22 ± 3.355
1.177
47.36
!
= (0.691, 1.749) .
Uma vez que o valor (nulo) de β1 sob a hipótese H0 : β1 = 0 (contra a alternativa
H1 : β1 6= 0) ∈
/ IC99% (β1 ) o que equivale a dizer que esse valor pertence à região de
rejeição a 1% do teste baseado na estatı́stica
T =s
β̂1
P x −nx̄
∼ t(8) .
σ̂ 2
n
i=1
2
i
2
pode afirmar-se que há evidência para dizer que a regressão é significativa ao nı́vel de
significância de 1%.
8
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
2o Exame/2o Teste
Duração: 3 horas/1 hora e 30 minutos
2o semestre 2004/05
12/07/2005 – 9 horas
• Se pretende fazer o 2o teste deve resolver apenas o grupo II.
• Se pretende fazer o exame deve resolver ambos os grupos.
• Justifique convenientemente todas as respostas!
Grupo I
10 valores
1. Um revendedor de cabos compra cabos metálicos com iguais caracterı́sticas a dois fabricantes, A
e B, sendo que a fracção de cabos metálicos comprada ao fabricante A é o dobro da comprada ao
fabricante B. Por informação passada apurou-se que os números de pequenos defeitos num cabo
metálico de 25 m do fabricante A e num de 30 m do fabricante B possuem distribuições de Poisson
de parâmetros 1 e 2 respectivamente.
(a) Um construtor civil compra ao revendedor um cabo metálico de 150 m mas o contrato de
compra inclui uma cláusula que isenta o cliente do pagamento do custo de entrega se o cabo
metálico tiver pelo menos 8 pequenos defeitos. Qual é a probabilidade de o construtor civil
vir a ficar isento do pagamento do custo de entrega?
(2.0)
(b) Sabendo que num cabo metálico de 150 m, escolhido ao acaso no armazém do revendedor, não
se encontrou nenhum defeito, qual a probabilidade de ele ser proveniente do fabricante A?
(1.5)
2. Uma empresa do sector têxtil tem fábricas no extremo-oriente. Os produtos que importa vêm
embalados em caixotes de 1000 unidades. Para prevenir a contrafacção, em cada caixote são
examinadas ao acaso 5 unidades e o caixote é devolvido se for detectada alguma unidade suspeita.
(a) Qual é a probabilidade de um caixote com 10 unidades suspeitas ser rejeitado? É importante
saber se a inspecção foi feita com ou sem reposição? Compare os resultados e comente.
(1.5)
(b) O importador vai receber uma encomenda de 500 desses caixotes, contendo cada caixote 10
unidades suspeitas. Qual a probabilidade aproximada de ele ter de devolver no máximo 20
caixotes?
(2.0)
3. Admita que o número diário (Y ) de pedidos de reserva de bilhetes a custo reduzido num voo de
certa companhia, tem distribuição binomial de parâmetros 3 e 0.4. Seja X a variável aleatória que
indica se ainda há lugares disponı́veis (X = 1) ou não (X = 0).
A função de probabilidade conjunta estimada de (X, Y ) é parcialmente indicada na tabela seguinte:
X \Y
0
1
2
3
0
0
b
0.132
d
1
a
0.18
c
0.02
(a) Complete a tabela e determine o valor esperado de Y quando X = 0.
(1.5)
(b) Calcule o coeficiente de correlação entre X e Y e comente o valor obtido.
(1.5)
Nota: use a = 0.08, b = 0.108, c = 0.3 e d = 0.18 se não completar a tabela.
Página 1 de 2
Grupo II
10 valores
1. Considere uma amostra aleatória de dimensão 2n proveniente de uma população X, tal que
E(X) = µ e V ar(X) = σ 2 . Sejam
T1 =
2n
P
i=1
Xi
2n
n
P
e T2 =
i=1
(1.5)
Xi
n
dois estimadores de µ. Qual dos dois estimadores é mais eficiente? Comente.
2. Numa linha de montagem, um engenheiro recém-contratado sugeriu uma alteração ao actual processo de produção, mas não houve consenso. Para resolver a questão, a administração decidiu que
fossem experimentados os dois processos em duas amostras independentes de 16 produtos finais e
comparada a sua eficiência, em termos do tempo despendido. Designando por X a variável aleatória que representa o tempo gasto, em horas, usando o processo tradicional e por Y a que representa
a mesma quantidade usando o novo processo, os resultados obtidos foram:
16
X
xi = 33.6,
i=1
16
X
x2i = 92.4,
i=1
16
X
yi = 35.2,
i=1
16
X
yi2 = 91.5.
i=1
Admitindo que em ambos os casos os tempos têm distribuições normais com variâncias iguais:
(a) Teste a hipótese de o novo processo não exigir em média mais tempo para a montagem do
produto que o processo tradicional, calculando o valor-p do teste.
(2.0)
(b) Continuando a admitir amostras independentes e de igual dimensão para os dois processos
2 = σ 2 = 1.2, que dimensão mı́nima deveriam ter as amostras para que a
e considerando σX
Y
diferença entre os tempos médios dos dois processos fosse estimada com um erro não superior
a 15 minutos, a um nı́vel de confiança de 99%?
(1.5)
3. Num teste à variação num dado veı́culo do consumo médio C (em litros/100 km) em circuito
urbano com a velocidade média V (em km/hora), foram efectuadas 300 viagens num percurso fixo.
Observaram-se os seguintes resultados:
(2.0)
V \C
(0,5]
(5,7]
(7,9]
[0,30)
10
30
60
[30,50)
20
40
40
[50,80)
10
80
10
Teste, ao nı́vel de significância de 1% , a hipótese do consumo médio ser independente da velocidade
média.
4. Num estudo registou-se o peso de crianças recém-nascidas (Y , em kg) e o respectivo tempo de
gestação (x, em semanas). Esses registos foram resumidos nos seguintes resultados:
240
X
i=1
xi = 9615.9,
240
X
i=1
x2i = 386272.3,
240
X
i=1
yi = 812.0,
240
X
yi2 = 2755.7,
i=1
240
X
xi yi = 32615.2, x ∈]31, 47[
i=1
(a) Ajuste um modelo de regressão linear simples de Y em x aos dados observados. Com base
no modelo estimado diga qual é o aumento esperado do peso de um recém-nascido por cada
semana adicional de gestação.
(1.5)
(b) Calcule um intervalo de confiança a 98% para o peso esperado de um recém-nascido com um
tempo de gestação de 40 semanas. O mesmo procedimento será válido qualquer que seja o
tempo de gestação considerado?
(1.5)
Página 2 de 2
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
o
o
2o semestre 2004/05
2 Exame/2 Teste – 12/07/2005
Grupo I
10 valores
1. (a) Designe-se por XA a v. a. que indica se um cabo seleccionado ao acaso no armazém
do revendedor é proveniente ou não do fabricante A.
Pelo enunciado sabe-se que P (XA = 1) = 2P (XA = 0). Como P (XA = 1) + P (XA =
0) = 1 ⇔ P (XA = 1) = 23 . Logo XA ∼ Bernoulli( 23 ).
Seja W150 : v.a. que indica o número de pequenos defeitos num cabo metálico seleccionado ao acaso do armazém do revendedor. Como a ocorrência de pequenos defeitos
de cabo metálico produzido pelo fabricante A tem uma distribuição de Poisson de taxa
média (1/25)/m = 0.04/m e 150m × 0.04/m = 6, então W150 |XA = 1 ∼ P oisson(6).
Analogamente para os cabos provenientes do fabricante B, sendo neste caso que a taxa
média é (2/30)/m = 1/15m e 150m × (1/15)/m = 10 que conduz a W150 |XA = 0 ∼
P oisson(10).
P
(construtor ficar isento do pagamento) =
= P [(W150 ≥ 8, XA = 1) ∨ (W150 ≥ 8, XA = 0)] =
= P (W150 ≥ 8, XA = 1) + P (W150 ≥ 8, XA = 0) =
= (1 − P (W150 ≤ 7|XA = 1)) × P (XA = 1) + (1 − P (W150 ≤ 7|XA = 0)) × P (XA = 0) =
1
2
= (1 − FW150 |XA =1 (7)) × + (1 − FW150 |XA =0 (7)) × =
3
3
2
1
(1)
= (1 − 0.7440) × + (1 − 0.2202) × =
3
3
2
1
= 0.256 × + 0.7798 × =
3
3
= 0.1707 + 0.2599 = 0.4306.
(1) Usando, por exemplo, a tabela da função de distribuição da Poisson.
(b)
P (XA = 1, W150 = 0)
P (W150 = 0|XA = 1) × P (XA = 1)
=
P (W150 = 0)
P (W150 = 0)
0.0025 × 2/3
'
' 1,
0.0025 × (2/3) + 0.0000 × (1/3)
P (XA = 1|W150 = 0) =
1
já que, e de forma semelhante à alı́nea (a), se tem
P (W150 = 0) = (W150 = 0|XA = 1)) × P (XA = 1) + P (W150 = 0|XA = 0) × P (XA = 0) =
2
1
= FW150 |XA =1 (0) × + FW150 |XA =0 (0) × =
3
3
(1)
1
2
' 0.0025 × + 0.0000 × =
3
3
= 0.0017
(1) Usando mais uma vez a tabela da função de distribuição da Poisson.
2. (a) X=v. a. que representa o número de unidades suspeitas numa amostra de 5 unidades
seleccionadas ao acaso de um caixote de 1000 unidades.
Se a extracção for realizada sem reposição então X ∼ hipergeom(N = 1000, M =
10, n = 5) e neste caso a probabilidade pedida é
990 10
5
0
'
P X ≥ 1) = 1 − P (X = 0) = 1 − 1000
5
' 1 − 0.9509 = 0.0491.
Se a extracção for realizada com reposição então X ∼ binomial(n = 5, p =
e neste caso a probabilidade pedida é
5
P (X ≥ 1) = 1 − P (X = 0) = 1 −
0.010 0.995 '
0
10
1000
= 0.01)
' 1 − 0.9510 = 0.049.
Comentário: A diferença entre os dois valores não é significativa, observar que a diferença absoluta entre eles é de apenas 10−4 ! Este resultado já era esperado já que nas
condições deste problema (o tamanho da amostra recolhida é bastante inferior ao da
população, n = 5 << 0.1N = 100) as probabilidades calculadas efectuando a extracção
com ou sem reposição são aproximadamente iguais.
(b) Seja Y = v.a. que representa o número de caixotes, em 500, que são devolvidos.
Como os caixotes são independentes uns dos outros ter-se-á
Y ∼ binomial(n = 500, p)
como, pela alı́nea anterior, se calculou a probabilidade um caixote ser rejeitado (supondo que há 10 unidades suspeitas), i.e P (X ≥ 1) verificando-se que era ' 0.049, quer
tenha sido feita a extracção das 5 unidades com ou sem reposição, vai considerar-se
que p = 0.049.
A probabilidade pedida é
P (Y ≤ 20) =
20 X
500
y=0
2
y
0.049y 0.951500−y
porém esta probabilidade não é de fácil cálculo nem esta distribuição está tabelada, mas
como np = 24.5 > 5 e n(1 − p) = 475.5 > 5 pode recorrer-se à seguinte aproximação
a
Y ∼ N (µ = 500 × 0.049 = 24.5, σ 2 = 500 × 0.049 × 0.951 ' 23.3)
com correcção de continuidade obtém-se
20 + 0.5 − 24.5
√
P (Y ≤ 20) ' Φ
' Φ(−0.83) = 1 − Φ(0.83) = 1 − 0.7967 = 0.2033
23.3
e sem correcção de continuidade obtém-se
20 − 24.5
√
P (Y ≤ 20) ' Φ
' Φ(−0.93) = 1 − Φ(0.93) = 1 − 0.8238 = 0.1762
23.3
Nota: Uma forma equivalente de calcular a probabilidade pedida seria considerar a
soma de 500 v.a. independentes com distribuição de Bernoulli e utilizar o Teorema do
Limite Central ou ainda fazer uma primeira aproximação à Poisson seguida de outra à
distribuição normal.
3. Considere-se:
Y = v.a. que representa o número de pedidos de reserva de bilhetes de um voo;
X = v.a. indicadora se há ou não lugares disponı́veis nesse voo;
(a) Sabe-se que Y ∼ binomial(n = 3, p = 0.4), P (Y = y) =
P
P (X = x, Y = y) e usando,
x
por exemplo, a tabela da função de distribuição da binomial vem
P (Y = 0) = FY (0) = 0.216 ⇒ a = 0.216
P (Y = 1) = FY (1) − FY (0) = 0.6480 − 0.216 = 0.432 ⇒ b = 0.432 − 0.18 = 0.252
P (Y = 2) = FY (2) − FY (1) = 0.9360 − 0.6480 = 0.288 ⇒ c = 0.288 − 0.132 = 0.156
P (Y = 3) = FY (3) − FY (2) = 1 − 0.9360 = 0.064 ⇒ d = 0.064 − 0.02 = 0.044
Como

0.252 ' 0.5888, y = 1


0.428



 0.132
P (X = 0, Y = y)  0.428 ' 0.3084, y = 2
P (Y = y|X = 0) =
=
0.044 ' 0.1028, y = 3

P (X = 0)


0.428




0,
c.c.
vem
E(Y |X = 0) =
X
yP (Y = y|X = 0) = 1 ×
y
0.252
0.132
0.044
+2×
+3×
'
0.428
0.428
0.428
' 1.514
3
(b)
Corr(X, Y ) = p
E(XY ) − E(X)E(Y )
p
V ar(X)V ar(Y )
V ar(X)V ar(Y )
−0.1344
0.552 − 0.572 × 1.2
'
' −0.32
= √
0.4198
0.2448 × 0.72
Cov(X, Y )
=
pois verifica-se que X ∼ Bern (p = 0.572) logo E(X) = 0.572 e V ar(X) = 0.572 ×
0.428 ' 0.2448. Para além disso Y ∼ binomial(n = 3, p = 0.4) logo E(Y ) = 3 × 0.4 =
1.2 e V ar(Y ) = 3 × 0.4 × 0.6 = 0.72. Para além disso
1
X
E(XY ) =
X
xyP (X = x, Y = y) =
x=0 y∈{0,1,2,3}
= 1 × 1 × 0.18 + 1 × 2 × 0.156 + 1 × 3 × 0.02 = 0.552
Comentário: X e Y são v.a. dependentes já que Corr(X, Y ) 6= 0. X e Y têm tendência
para variar em sentido inverso porque Corr(X, Y ) < 0. A dependência linear entre elas
é, no entanto, fraca (-0.32).
Nota: Resposta parcial da alı́nea (a) e resposta integral da alı́nea (b) quando a = 0.08,
b = 0.108, c = 0.03 e d = 0.18.
(a) Como

0.108 ' 0.2571 y = 1


0.42




0.132
P (X = 0, Y = y)  0.42 ' 0.3143 y = 2
=
P (Y = y|X = 0) =
0.18 ' 0.4286 y = 3

P (X = 0)


0.42




0,
c.c.
vem
E(Y |X = 0) =
X
yP (Y = y|X = 0) = 1 ×
y
0.132
0.18
0.108
+2×
+3×
'
0.42
0.42
0.42
' 2.71
(b)
Corr(X, Y ) = p
E(XY ) − E(X)E(Y )
p
V ar(X)V ar(Y )
V ar(X)V ar(Y )
0.84 − 0.58 × 1.752
−0.1762
'
= √
' −0.4132
0.4264
0.2436 × 0.7465
Cov(X, Y )
=
pois verifica-se que X ∼ Bern (p = 0.58) logo E(X) = 0.58 e V ar(X) = 0.58 × 0.42 '
0.2436. E
X
E(Y ) =
yP (Y = y) = 0 × 0.08 + 1 × 0.288 + 2 × 0.432 + 3 × 0.2 = 1.752
y
4
E(Y 2 ) =
X
y 2 P (Y = y) = 0 × 0.08 + 12 × 0.288 + 22 × 0.432 + 32 × 0.2 = 3.816
y
V ar(Y ) = E(Y 2 ) − (E(Y ))2 = 3.816 − (1.752)2 ' 0.7465
já que


0.08,





 0.288,
X
P (Y = y) =
P (X = x, Y = y) =
0.432,


x

0.2,



 0,
y=0
y=1
y=2
y=3
c.c.
Para além disso
E(XY ) =
1
X
X
xyP (X = x, Y = y) =
x=0 y∈{0,1,2,3}
= 1 × 1 × 0.18 + 1 × 2 × 0.3 + 1 × 3 × 0.02 = 0.84
Comentário análogo ao anterior.
Grupo II
10 valores
1. Denote-se por eficiência relativa de T1 em relação a T2 para estimação de µ ao quociente
ef rµ (T1 , T2 ) =
EQMµ (T1 )
EQMµ (T2 )
onde
EQMµ (Tj ) = E (Tj − µ)2 = V ar (Tj ) + vies2µ (Tj ) corresponde ao Erro Quadrático Médio
de Tj na estimação de µ, j = 1, 2.
2n
P
Xi
Como T1 =
e X1 , X2 , · · · , X2n são v.a. independentes e identicamente distribuı́das
2n
i=1
(i.i.d) tem-se, para cada i = 1, 2, · · · , 2n,
E (Xi ) = E (X) = µ, V ar (Xi ) = V ar (X) = σ 2 ,
!
2n
2n
2n
X
1 X
1 X
Xi
=
E (Xi ) =
E (X) = µ
E (T1 ) = E
2n
2n i=1
2n i=1
i=1
E (T2 ) = E
n
X
Xi
i=1
n
!
n
n
1X
1X
=
E (Xi ) =
E (X) = µ
n i=1
n i=1
Concluindo-se que ambos os estimadores são centrados para µ logo o viesµ (Tj ) = E (Tj − µ) =
0, j = 1, 2, reduzindo-se o estudo da eficiência à variância.
Como
V ar (T1 ) = V ar
2n
X
Xi
i=1
2n
!
2n
2n
1 X
1 X
1 2
= 2
V ar (Xi ) = 2
V ar (X) =
σ
4n i=1
4n i=1
2n
5
e
V ar (T2 ) = V ar
n
X
Xi
i=1
!
n
n
n
1 X
1 X
1
= 2
V ar (Xi ) = 2
V ar (X) = σ 2
n i=1
n i=1
n
logo
ef rµ (T1 , T2 ) =
EQMµ (T1 )
=
EQMµ (T2 )
1 2
σ
2n
1 2
σ
n
=
1
2
logo, o estimador T1 possui o dobro da eficiência que o estimador T2 . Este resultado já
seria de esperar pois a forma funcional dos estimadores é análoga no entanto T2 usa apenas
metade da amostra.
2. (a) Seja X:v.a que indica o tempo gasto, em horas, usando o processo tradicional;
2
2
X ∼ N (µX , σX
), com µX e σX
desconhecidos; e
Y :v.a que indica o tempo gasto, em horas, usando o novo processo; Y ∼ N (µY , σY2 ),
com µY e σY2 desconhecidos.
Considerem-se as a.a., X16 = (X1 , X2 , · · · , X16 ), proveniente da população X e Y16 =
(Y1 , Y2 , · · · , Y16 ), proveniente da população Y . X16 é independente de Y16 .
Hipóteses: H0 : µY ≤ µX vs H1 : µY > µX que podem ser reescritas da seguinte forma
H0 : µY − µX ≤ 0 vs H1 : µY − µX > 0
Sob a “validade” de H0 (para µY − µX = 0) tem-se a estatı́stica de teste
T0 = r
(Ȳ − X̄)
2
(nY −1)SY2 +(nX −1)SX
nY +nX −2
1
nY
+
1
nX
que tem uma distribuição t-student com (nY + nX − 2) graus de liberdade, SY2 =
nY
2
P
1
Y
−
Ȳ
, onde Ȳ é a média da amostra aleatória Y16 (análogo para X). Esta
i
nY −1
i=1
é a estatı́stica adequada para realizar este teste já que se trata de um teste sobre a
comparação de valores esperados de duas populações normais com variâncias, embora
desconhecidas, iguais.
Valor observado da estatı́stica de teste:
Tendo em conta os resultados sumariados para cada amostra, vem ȳ = 2.2 e s2y ' 0.937
e x̄ = 2.1 e s2x ' 1.456.
t0 = r
(ȳ − x̄)
(nY −1)s2y +(nX −1)s2x
nY +nX −2
1
nY
+
1
nX
(2.2 − 2.1)
' q (16−1)0.937+(16−1)1.456
16+16−2
'√
1
16
+
1
16
≈
0.1
' 0.258
0.1496
Face às hipóteses especificadas, o valor-p = [P (T0 > 0.258|H0 )] = [1 − FT0 (0.258)], é
necessário então determinar a função de distribuição da t(nY +nX −2) = t(30) no ponto
0.258. No entanto, a tabela disponı́vel é da função de distribuição inversa da t-student
6
e o valor 0.258 não consta na tabela, assim, poder-se-á apenas determinar um intervalo
de valores para o valor-p. Consultando a tabela verifica-se que
0.256 < 0.258 < 0.530 e como FT0 (0.256) ≤ FT0 (0.258) ≤ FT0 (0.530), ou seja 0.6 ≤
FT0 (0.258) ≤ 0.7 logo 0.3 ≤valor-p ≤ 0.4.
Decisão: não devemos rejeitar H0 para os nı́veis de significância usuais. Ou seja, a
amostra suporta a ideia de que o novo processo não exige mais tempo que o tradicional.
(b) Inicie-se por construir o ICA a 99% para µY − µX . A v.a. fulcral adequada neste caso
é (recordar que agora as variâncias das populações normais são conhecidas) :
T =
(Ȳ − X̄) − (µY − µX )
q 2
∼ N (0, 1)
2
σY
σX
+ nX
nY
Após dedução, o intervalo de confiança aleatório para µY − µX é


s
s
2
2
2
2
σY
σ
σY
σ
ICA99%(µY −µX ) =  Ȳ − X̄ − Φ−1 (0.995)
+ X , Ȳ − X̄ + Φ−1 (0.995)
+ X 
nY
nX
nY
nX
O erro de estimação (ou margem de erro) é
s
ε = Φ−1 (0.995)
σY2
σ2
+ X
nY
nX
O objectivo é estimar nX = nY = n tal que ε ≤ 0.25. Vem então
s
ε=Φ
−1
r
⇔
(0.995)
r
2
σX
σY2
1.2 1.2
+
≤ 0.25 ⇔ 2.5758
+
≤ 0.25 ⇔
nY
nX
n
n
2.4
0.25
2.57582 × 2.4
≤
⇒n≥
= 254.77 ⇒ nmin = 255.
n
2.5758
0.252
3. Sejam V = v. a. que representa o consumo médio (em litros/100 km) de determinado veı́culo;
e C = v.a. que representa a velocidade média (em km/hora) de determinado veı́culo.
Teste de independência do qui-quadrado de Pearson.
Hipóteses: H0 : V é independente de C vs H1 : V não é independente de C;
A estatı́stica de teste é:
r X
s
X
(Oij − Eij )2 a
∼ χ2(r−1)(s−1)
Q=
sobH0
E
ij
i=1 j=1
onde r=número de categorias da v.a. X, s=número de categorias da v.a. Y ; Oij = número
de elementos na categoria (i, j); Eij = número esperado de elementos na categoria (i, j) sob
H0 .
Determinação do valor observado da estatı́stica de teste:
7
As probabilidades sob H0 :
p0ij = P (X = i) × P (Y = j),
são desconhecidas estimando-se por
p̂0ij =
ni· n·j
×
,
n
n
ni· n·j
ni· × n·j
×
=
.
n
n
n
Com base na amostra dada vem êi1 = 13.3(3), êi2 = 50, êi3 ' 36.6(6), para i=1,2,3,
obtendo-se Êij = n ×
o que conduz a
(10 − 13.33)2 (20 − 13.33)2 (10 − 13.33)2
+
+
+
13.33
13.33
13.33
(30 − 50)2 (40 − 50)2 (80 − 50)2
+
+
+
+
50
50
50
(60 − 36.66)2 (40 − 36.66)2 (10 − 36.66)2
+
+
+
'
36.66
36.66
36.66
qobs =
' 0.8333 + 3.3333 + 0.8333 + 8 + 2 + 18 + 14.85 + 0.303 + 19.39 '
' 67.54
Para o nı́vel de significância especificado, α = 1%, tem-se:
Região Crı́tica para Q: RCα = (c, +∞)
com c = Fχ−1
2
(r−1)(s−1)
(1 − 0.01) = Fχ−1
2
(0.99) = 13.28
(3−1)(3−1)
logo RC0.01 = (13.28, +∞).
Como o valor observado da estatı́stica de teste (qobs = 67.54) pertence a RC0.01 , existe
evidência para rejeitar H0 ao nı́vel de significância de 1%. Ou seja, a amostra observada
não suporta a hipótese de que o consumo médio desse veı́culo e a velocidade média sejam
independentes.
4. (a) Modelo de RLS:
Yi = β0 + β1 xi + εi ,
onde
Yi : variável aleatória que representa o peso do i-ésimo recém-nascido;
xi : variável explicativa que representa o tempo de gestação do i-ésimo recém-nascido;
β0 : ordenada na origem;
β1 : parâmetro regressor;
εi : erro aleatório associado ao i-ésimo recém-nascido, verificando:
i) E [εi ] = 0;
ii) V ar [εi ] = σ 2 ;
iii) Cov [εi , εj ] = 0, ∀i,j (i 6= j);
8
i = 1, 2, . . . , 240.
Cálculos auxiliares: n = 240; x̄ =
n
P
i=1
n
P
i=1
n
P
9615.9
812.0
' 40.06625; ȳ =
= 3.383(3)
240
240
xi yi − nx̄ȳ = 32615.2 − 240 × 40.06625 × 3.383(3) ' 81.40
x2i − nx̄2 = 386272.3 − 240 × 40.066252 ' 999.25
yi2 − nȳ 2 = 2755.7 − 240 × 3.383(3)2 ' 8.433
i=1
A estimativa dos mı́nimos quadrados da recta de regressão é dada por:
E\
[Y |x] = 0.1379 + 0.081x,
x ∈ ]31, 47[
pois
n
P
β̂1 =
xi yi − nx̄ȳ
i=1
n
P
=
x2i − nx̄2
81.40
≈ 0.081
999.25
i=1
e
βˆ0 = ȳ − βˆ1 x̄ = 3.383(3) − 0.081 × 40.06625 ' 0.1379.
Como E [Y |(xj + 1)]−E [Y |xj ] = β0 +β1 (xj +1)−β0 −β1 xj = β1 , então uma estimativa
dessa diferença será
β̂1 = 0.081.
Nota: observar que essa é a interpretação de declive de uma recta, por isso bastaria
dizer que a estimativa pretendida é a do declive da recta de regressão, i.e β̂1 .
(b) Pretende-se um intervalo de confiança a 98% para E [Y |x = 40] = β0 + β1 40. Observar
que x = 40 ∈ (min(xi ), max(xi )).
Considerando como hipótese de trabalho que os erros εi possuem distribuição normal
pode considerar-se a seguinte variável aleatória fulcral:
β̂0 + β̂1 x0 − (β0 + β1 x0 )
T = v
∼ t(238)) ,

u
u
u 1
(x̄−x0 )2  2
σ̂
t n+ P
n
i=1
x2i −nx̄2
n
2
1 X
onde x0 = 40 e σ̂ =
Yi − Ŷi .
n − 2 i=1
2
Após dedução, o intervalo aleatório com 98% de confiança para E [Y |x = 40], é dado
por:
v

u
u
u

(x̄ − 40)2 
u 1

 σ̂ 2
u
+
IAC99% (β0 + β1 40) =  β̂0 + β̂1 40 ± Ft−1
(0.99)
n

(238)
t n P 2

2
xi − nx̄

i=1
9





Concretização:
β̂1 = 0.081
"
!
n
X
n
X
1
yi2 − nȳ 2
x2i − nx̄2
n−2
i=1
i=1
1 =
8.433 − 0.0812 × 999.25 ' 0.008
238
σ̂ 2 =
2
− β̂1
!#
=
−1
e Ft(238)
(0.99) ' 2.327.
Obtendo-se
v
u
u
IC98% (β0 + β1 × 40) = (0.1379 + 0.081 × 40) ± 2.327t

2
1
(40.06625 − 40)
+
240
999.25

!
0.008 
= (3.3779 ± 2.327 × 0.0057)
= (3.36, 3.39)
Só será correcto utilizar o mesmo procedimento para valores pertencentes ao (min(xi ) =
31, max(xi ) = 47). Qualquer extrapolação para valores fora do intervalo de valores que
fizeram parte do ajuste deste modelo será um abuso.
10
Enunciados com
soluções
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o Teste – LEEC+LEQ+LQ+LEBL
Duração: 1.5 horas – 1o semestre 2004/05
05/11/2004
19 horas
• Justifique convenientemente todas as respostas!
Grupo I
2.5 valores
O comprimento de parafusos produzidos numa fábrica (X) pode ser representado por uma distribuição Normal, com valor esperado 3 cm e variância de 0.64 cm2 . Os parafusos produzidos serão
vendidos a uma loja que os classifica de acordo com o seu comprimento do seguinte modo: pequeno
para os 20% mais pequenos, médio para os 55% seguintes e grande para os 25% maiores.
(a) Quais os limites das classes de comprimentos consideradas?
(1.0)
(b) Demonstre que (X − 3)/0.8 segue uma distribuição N (0, 1).
(1.5)
Grupo II
7.5 valores
Uma empresa com duas filiais (numeradas 1 e 2) produz artigos, cada um dos quais pode ter 0,
1 ou 2 defeitos, sendo a probabilidade de não ter qualquer defeito de 3/16. A produção global da
empresa divide-se equitativamente entre as duas filiais.
1. A função (massa) de probabilidade conjunta das variáveis aleatórias X e Y , representando
o número de defeitos por artigo e o número identificador da filial, encontra-se reproduzido
parcialmente na seguinte tabela:
X \Y
0
1
2
1
a
b
5/16
2
1/16
1/16
c
(a) Complete a tabela, especificando os valores de a, b e c.
(1.5)
(b) Ao analisar-se um artigo extraı́do ao acaso da produção global constatou-se que apresentava um defeito. Qual a probabilidade de ter sido produzido pela filial 1?
(1.0)
(c) Determine o número esperado de defeitos por artigo da filial 1 e, com base neste valor
e no facto de o número esperado de defeitos por artigo ser 3/2, determine o número
esperado de defeitos por artigo da filial 2.
(1.5)
2. Da produção global da empresa foram-se extraindo artigos aleatória e sucessivamente (com
reposição).
(a) Determine os números esperado, mediano e modal de artigos produzidos na filial 1 nos
primeiros 10 artigos extraı́dos e diga se o resultado era previsı́vel.
(2.0)
(b) Sabendo que nos primeiros 5 artigos extraı́dos não houve nenhum sem defeitos, qual a
probabilidade de se ter que extrair mais do que 10 artigos adicionais para que surja o
primeiro sem defeitos? Comente o resultado obtido.
(1.5)
Página 1 de 1
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o Exame/2o Teste – LEEC+LEQ+LQ+LEBL
Duração: 3 horas – 1o semestre 2004/05
13/01/2005
17 horas
• Se pretende fazer o exame deve resolver todos os grupos.
• Se pretende fazer o 2o teste deve resolver apenas os grupos III e IV.
• Justifique convenientemente todas as respostas!
Grupo I
5 valores
1. Uma companhia de seguros classifica os seus clientes em 3 classes de risco: alto (A), médio (M ) e
baixo (B). Com base em registos passados, as probabilidades de os clientes com risco alto, médio e
baixo se envolverem em acidentes durante um ano são 0.30, 0.15 e 0.05, respectivamente. Sabe-se que
20% dos clientes são considerados de alto risco e 50% são de risco médio. Qual a probabilidade de
haver acidentes num ano entre os segurados dessa companhia? Se um segurado não tem acidentes
num ano, qual a probabilidade de ele estar classificado como de alto risco?
(2.0)
2. Num troço de uma auto-estrada há duas entradas: acesso norte e acesso sul. Suponha que o número
de automóveis que entram pelo acesso norte segue uma distribuição de Poisson com taxa média de
1 automóvel por minuto, enquanto o número de automóveis que entram pelo acesso sul segue uma
distribuição de Poisson com taxa média de 2 automóveis por minuto, independentemente do que
acontece na entrada norte.
(a) Seja Xt o número de automóveis que entram nesse troço da auto-estrada pelo conjunto dos dois
acessos em t minutos. Especifique a distribuição de Xt e encontre a probabilidade de em 30
segundos não entrar nenhum carro nesse troço da auto-estrada.
(1.5)
(b) Sejam T1 e T2 os tempos (em minutos) que decorrem desde o inı́cio do processo de contagem até à
entrada de um automóvel pelos acessos norte e sul, respectivamente. Determine a probabilidade
de a entrada do primeiro automóvel na auto-estrada pelo acesso norte ocorrer depois da primeira
entrada pelo acesso sul.
(1.5)
Grupo II
5 valores
1. Suponha que o diâmetro exterior de um eixo, D, é uma variável aleatória com distribuição Normal de
média 4 polegadas e variância 0.01 polegadas2 . Se o diâmetro diferir do seu valor esperado por mais
de 0.05 polegadas e menos de 0.08 polegadas, o prejuı́zo do fabricante será 0.50 euro. Se o diâmetro
diferir do seu valor esperado por mais de 0.08 polegadas, o prejuı́zo do fabricante será 1.00 euro. Não
haverá prejuı́zo em qualquer outro caso. Encontre a função de probabilidade do prejuı́zo por cada
eixo. Qual o valor esperado do prejuı́zo relativamente a 50 eixos selecionados aleatoriamente?
(2.5)
2. Num tanque de piscicultura com 400 trutas há 3 vezes mais trutas arco-ı́ris do que trutas salmonadas.
Desse tanque vai ser recolhida uma amostra retirando sucessivas trutas sem reposição.
(2.5)
Sejam X1 e X2 variáveis aleatórias que tomam o valor 1 quando a primeira e a segunda trutas
recolhidas são da variedade arco-ı́ris, respectivamente, e 0 no caso contrário. Determine a função de
probabilidade de X2 e calcule a covariância entre as duas variáveis. Sem apresentar cálculos indique
quais os resultados que se obteria se as tiragens fossem feitas com reposição. Comente.
Página 1 de 2
Grupo III
4 valores
Seja p a proporção desconhecida de defeituosos numa grande colecção de voltı́metros, relativamente à
qual se pretende testar a hipótese H0 : p = 0.2 contra a hipótese H1 : p > 0.2.
(a) Seleccionados ao acaso 100 voltı́metros verificou-se que 25% eram defeituosos. Construa um teste
para as hipóteses indicadas e diga qual a conclusão do mesmo ao nı́vel de significância de 5%.
(2.0)
(b) Considere-se agora um novo procedimento para testar as mesmas hipóteses:
(2.0)
• Observa-se uma amostra de 5 voltı́metros escolhidos com reposição e anota-se o número X de
voltı́metros defeituosos. Se X ≤ 2 aceita-se H0 e se X ≥ 4 rejeita-se H0 ;
• Caso contrário, observa-se uma segunda amostra de tamanho 5 pelo mesmo processo (independente da primeira). Sendo então Y o número de voltı́metros defeituosos na segunda amostra,
rejeita-se H0 se Y ≥ 2, e aceita-se H0 no caso contrário.
Calcule a probabilidade do erro de tipo 2 (2a espécie) cometido por esse teste quando a verdadeira
proporção de voltı́metros defeituosos é 0.3.
Grupo IV
6 valores
1. Num estudo sobre a fiabilidade de lâmpadas produzidas por um dado processo de fabrico, foram
ensaiadas 300 delas, escolhidas aleatoriamente, e anotados os valores ti , i = 1, . . . , 300, da duração T
(em horas) das lâmpadas.
a) Admitindo que T segue uma distribuição Exponencial de valor médio λ, mostre que o estimador
de máxima verosimilhança (MV) de λ é a média amostral. Determine a expressão do estimador
de MV da probabilidade de uma lâmpada durar pelo menos 150 horas.
(1.5)
b) O agrupamento da amostra observada conduziu aos seguintes resultados
(1.5)
T (em horas)
o
N lâmpadas
0 ≤ T < 100
100 ≤ T < 200
200 ≤ T < 300
300 ≤ T < 400
T ≥ 400
80
70
65
50
35
com base nos quais se chegou ao valor 220 horas para a média da amostra agrupada. Poder-se-á
afirmar que o modelo Exponencial para T se ajusta significativamente aos dados? Justifique
calculando o valor-p de um teste adequado.
2. Acredita-se que a tensão Y (em psi) de uma componente de plástico é influenciada pela sua temperatura de moldagem x (em 0 F ). Os resultados (yi , xi ), i = 1, . . . , 8, de uma experiência com essas
variáveis encontram-se resumidos em
8
X
i=1
yi = 5745,
8
X
i=1
yi2 = 4206125,
8
X
xi = 2377,
i=1
8
X
i=1
x2i = 707263,
8
X
yi xi = 1699380.
i=1
Admitindo a validade do modelo de regressão linear simples (Normal) na descrição dos dados indicados,
responda às seguintes questões:
(a) Estime a equação de regressão do modelo em causa. Determine um intervalo de confiança a 99%
para o valor esperado da tensão para uma componente de plástico com temperatura de moldagem
de 2900 F .
(1.5)
(b) Teste se a temperatura de moldagem é influente para a tensão da componente de plástico?
(1.5)
Página 2 de 2
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
2o Exame/2o Teste – LEEC+LEQ+LQ+LEBL
Duração: 3 horas – 1o semestre 2004/05
01/02/2005
17 horas
• Se pretende fazer o exame deve resolver todos os grupos.
• Se pretende fazer o 2o teste deve resolver apenas os grupos III e IV.
• JUSTIFIQUE CONVENIENTEMENTE TODAS AS RESPOSTAS!
Grupo I
4 valores
1. Um aluno de LEEC pretende enviar uma mensagem electrónica a uma dada aluna de LEQ. Suponha
que a probabilidade de o aluno escrever a mensagem é 0.7 e, uma vez escrita esta, a probabilidade de o
servidor a enviar é 0.9. Dada a escrita e envio da mensagem, admita que a probabilidade de a aluna a
receber através desse servidor é 0.8. Dado que a aluna não recebeu a mensagem, qual a probabilidade
de que o aluno não a tenha escrito?
(2.0)
2. Suponha que num conjunto de 100 ratos de uma certa raça hı́brida 25 apresentam uma dada doença
congénita. A fim de montar uma experiência, retiraram-se aleatoriamente 10 ratos (sem reposição)
daquele conjunto de ratos.
(a) Calcule a probabilidade (exacta) de haver pelo menos 2 ratos com a doença congénita na amostra
retirada.
(1.0)
(b) Qual é o número (par) mı́nimo de ratos que deve ser retirado desse conjunto, a fim de que a
probabilidade aproximada de encontrar no máximo metade deles com essa doença seja maior que
0.97?
(1.0)
Grupo II
6 valores
1. A duração de vida (em anos) de uma certa válvula é uma variável aleatória contı́nua X com função
densidade de probabilidade f (x) = 2 e−x (1 − e−x ), para x > 0, e zero para os demais valores de x.
(a) Calcule a probabilidade de uma válvula durar mais de 4 anos, sabendo que ela ainda está a
funcionar após 1.5 anos.
(1.0)
(b) Se 15 dessas válvulas (seleccionadas aleatoriamente de um grande lote delas) forem montadas
num aparelho, qual será a probabilidade de que exactamente 10 delas tenham de ser substituı́das
após 1.5 anos?
(1.0)
(c) Num processo de inspecção de válvulas de um grande lote, determine os números esperado e
mediano de válvulas até se encontrar a primeira delas com duração de vida superior a 4 anos.
(1.0)
2. Considere que o número X de maremotos ocorridos por perı́odo de 10 anos numa determinada região
sı́smica tem uma distribuição de Poisson com variância igual a 0.2 maremotos2 . Sabe-se que a probabilidade de cada maremoto não dar origem a uma onda gigante nessa região é 0.95, sendo razoável
afirmar que o número Y de maremotos com onda gigante em x (x ≥ 1) maremotos ocorridos por
perı́odo de 10 anos nessa região tem uma distribuição binomial.
(a) Demonstre que o número de maremotos com onda gigante ocorridos por perı́odo de 10 anos nessa
região segue uma distribuição de Poisson com parâmetro λ = 0.01.
(1.5)
(b) Calcule um valor aproximado da probabilidade de o total de maremotos com onda gigante ocorridos nessa região em 3 séculos ser quando muito 1.
(1.5)
Página 1 de 2
Grupo III
5 valores
1. Sejam Xi , i = 1, · · · , n observações da amplitude de vibração, X, de uma estrutura, sujeita a determinadas forças, supostas i.i.d. segundo uma lei de probabilidade com f.d.p.
2
x
x
f (x|θ) = exp −
, x > 0, θ > 0,
θ
2θ
onde θ é uma quantidade relacionada com a dispersão do deslocamento da estrutura. O valor esperado
p
e a variância desta distribuição são dados por πθ/2 e (2 − π/2)θ, respectivamente.
(a) Determine os estimadores de máxima verosimilhança de θ e do valor esperado de X.
(1.5)
(b) Compare do ponto de vista da centragem (não enviesamento) os seguintes estimadores de θ:
(1.5)
n
1 X 2
X
2n i=1 i
T1 =
e T2 =
2 2
X .
π
2. A tabela de contingência abaixo reporta-se à classificação de 170 peças defeituosas produzidas numa
fábrica, de acordo com o turno de produção (X) e o tipo de defeito (Y ).
Turno de
produção
Manhã
Tarde
Tipo de defeito
A B
C
15 21
44
25 31
34
(2.0)
Total
80
90
Com base na estatı́stica abaixo indicada, especifique cuidadosamente um teste da hipótese de o tipo
de defeito das peças ser independente do turno de produção e discuta a decisão a tomar com base no
respectivo valor-p.
r X
s
2
X
(Oij − Eij ) a 2
∼ χ(r−1)(s−1)
H0
Eij
i=1 j=1
Grupo IV
5 valores
Para comparar um novo método de espectroscopia de absorção atómica para determinação de antimónio
numa atmosfera urbana com o tradicional método colorimétrico, tomaram-se aleatoriamente 12 amostras
de ar e obtiveram-se os seguintes valores para a concentração de antimónio (em mg/m3 ):
Novo método (xi )
Método padrão (yi )
22.2
25.0
19.2
19.5
15.7
16.6
20.4
21.3
19.6
20.7
15.7
16.8
P 2
x = 2154.78
Pi 2i
i yi = 2445.23
Considerando que os valores desta grandeza obtenı́veis por qualquer dos métodos se distribuem gaussianamente (i.e., de acordo com uma lei Normal) com a mesma dispersão:
(a) Determine um intervalo de confiança a 99% para a diferença entre as concentrações médias de
antimónio relativas aos dois métodos.
(2.0)
(b) Recorrendo a um procedimento estatı́stico adequado, diga se os dois métodos diferem significativamente em termos das concentrações médias.
(1.5)
(c) Querendo fazer o mesmo número de determinações pelos dois métodos, qual o número de amostras de
ar que devem ser obtidas de modo a garantir com um grau de confiança de 90% (aproximadamente)
que o erro máximo de estimação da diferença de concentrações médias de antimónio, quando se
assume um desvio padrão comum para a concentração de antimónio de 3 mg/m3 , seja de 0.7 mg/m3 ?
(1.5)
Página 2 de 2
Soluções de Exames/Testes de PE
(LEEC+LEQ+LQ+LEBL)
1o Semestre 2004/05
1o Teste - 05/11/2004
I
a) classe ‘pequeno’: X ∈ (0, 2.33], classe ‘médio’: X ∈ (2.33, 3.54] e classe ‘grande’:
X ∈ (3.54, +∞).
dFZ (z)
dFX (x) X−0.3
1 2
√1
b) Z = 0.8 ; fZ (z) = dz = dx × dx
dz = 2π exp(− 2 z ).
x=3+0.8z
II
1. a) a = 1/8, b = 1/16, c = 3/8.
1. b) P (Y = 1|X = 1) = 1/2.
1. c) E(X) = E(E(X|Y )) ⇒ E(X|Y = 2) = 13/8.
2. a) Z = número de artigos da filial 1 em 10 artigos extraı́dos. E(Z) = Moda(Z) =
Mediana(Z) = 5. A unimodalidade, conjugada com a simetria da distribuição de Z,
justificam essa coincidência de valores.
2. b) W = número de artigos extraı́dos até surgir o primeiro sem defeito (X = 0).
P (W > 5 + 10 | W > 5) = (13/16)10 = P (W > 10). Concretização da falta de memória
da distribuição Geométrica.
1
1o Exame / 2o Teste - 13/01/2005
I
1. a) C = ‘cliente ter acidentes num ano’; P (C) = 0.15.
1. b) A = ‘cliente de risco alto’; P (A|C) ' 0.16
2. a) Xt ∼ Poisson (3t); P (X1/2 = 0) ' 0.22.
2. b) Ti ∼ Exponencial (λi ), i = 1, 2, λ1 = 1, λ2 = 2;
R +∞ R t2
P (T1 > T2 ) = 0
0 λ1 λ2 exp(−λ1 t1 − λ2 t2 ) dt1 dt2 = 2/3.
II
1. R = prejuı́zo do fabricante por eixo (em euros); E(R) = 26.02.
R
0
0.5
1.0
P (R = r)
P (|D − 4| ≤ 0.05) = 0.3830
0.1932
P (|D − 4| > 0.08) = 0.4238
P
2. X1 ∼ Bernoulli (p), p = 0.75; P (X2 = 1) = x=0,1 P (X1 = x)P (X2 = 1|X1 = x) = p
e P (X2 = 0) = 1 − p ⇒ X2 ∼ Bernoulli (p). E(X1 , X2 ) = P (X1 = 1, X2 = 1) ' 0.5620
⇒ Cov(X1 , X2 ) = 0.0055. X1 e X2 são identicamente distribuı́das nos dois esquemas
de tiragens (com ou sem reposição). Todavia, as duas variáveis são independentes ou
dependentes consoante os esquemas de tirangens com ou sem reposição, respectivamente.
III
a) X = v.a. indicadora do carácter defeituoso de um voltı́metro, X ∼ Bernoulli (p)
aprox.
∼ Normal(0, 1) para n grande; tobs = 1.25 < 1.64 = FN−1(0,1) (0.95) ⇒
⇒ T = √ X−p
p(1−p)/n
não se rejeita H0 a esse nı́vel de significância.
b) X ∼ Binomial(5, p), Y ∼ Binomial(5, p), X e Y independentes;
P (Erro tipo 2 | p = 0.3) = P [(X ≤ 2) ∪ (X = 3 ∩ Y < 2)|p = 0.3] = 0.9068.
IV
b é o EMV de p = P (T ≥ 150) pela
1. a) T ∼ Exponencial(1/λ); pb = exp(−150/λ)
b = T , de λ.
propriedade de invariância do EMV, λ
b0 = 220; qobs ' 38.94; valor-p = P (Q ≥ 38.94|H0 ) <
1. b) H0 : T ∼ Exponencial(1/λ); λ
0.0005 ⇒ Rejeita-se H0 .
\) = 2985.19 − 7.63 x; IC a 99% para E(Y |x = 290) = (677.36, 867.62).
2. a) yb ≡ E(Y
2. b) H0 : β1 = 0; tobs = −3.94; valor-p = P (|T | ≥ 3.94|H0 ) ∈ (0.002, 0.01); Deve-se
rejeitar H0 para α ≥ 0.01 (x influencia significativamente Y ) e aceitar H0 para α ≤ 0.002.
2
2o Exame / 2o Teste - 01/02/2005
I
1. E = ‘aluno escreve mensagem’, V = ‘servidor envia mensagem’, R = ‘aluna recebe
mensagem’, P (E|R) ' 0.605.
2. a) X = no de ratos com doença congénita na amostra; P (X ≥ 2) =
10 25
X
( )(
x
x=2
75
10−x
100
10
(
)
)
'
0.771
2. b) n = 8 pois P (X ? ≤ 4) = 0.9727, onde X ? ∼ Binomial (n, p = 0.25).
II
1. a) P (X > 4|X ≥ 1.5) ' 0.092.
1. b) Y = no de válvulas com X ≤ 1.5 em 15 válvulas, Y ∼ Binomial (15, p = 0.6035),
P (Y = 10) ' 0.187.
1. c) Z = no de válvulas inspeccionadas até se encontrar a primeira com X > 4, Y ∼
Geométrica (p = 0.0363), E(Z) ' 27.55, Mediana (Z) = 19.
2. a) P (Y = y) =
∞
X
P (X = x)P (Y = y|x = x) =
e−0.01 0.01y
.
y!
x=y
2. b) W = total de maremotos com onda gigante nessa região em 3 séculos, P (W ≤ 1) '
√
P (Z ≤ (1 − 0.3)/ 0.3) = 0.898, onde Z ∼ Normal (0, 1).
III
1 P
2
1. a) θb = 2n
i Xi é o EMV de θ,
dos EMV.
q
π θb
2
é o EMV de E(X) pela propriedade de invariância
1. b) Somente T1 é centrado, sendo E(T2 ) = θ
4
nπ
−
1
n
+1 .
2. H0 : pij = pi· p·j , ∀i, j; valor-p = P (Q > 5.128|H0 ) ∈ (0.075, 0.100); Deve-se aceitar H0
para α < 0.075, i.e., não há evidência suficiente contra a hipótese de independência entre
X e Y aos nı́veis de significância usuais.
IV
√ 2−(µX −µY ) ∼ t(10) ; IC a 99% para µX − µY = (−6.463, 4.103).
a) Z = X−Y
Sp (1/6+1/6)
b) Como 0 ∈ IC anterior, não se rejeita H0 : µX = µY ao nı́vel de significância de 1%
(ou menor), i.e., os métodos não diferem significativamente. A mesma conclusão é válida
a qualquer valor usual para o nı́vel de significância.
c) m = no amostras de ar (em cada método) talque o erro máximo de estimação (margem
p
de erro máximo) no IC a 90% para µX −µY é dado por = FN−1(0,1) (0.95) 32 (1/m + 1/m) '
0.7 ⇒ m = 99 ⇒ no de amostras = 198.
3
Departamento de Matemática
Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica (I)
LEC, LET, LArq, LMAC, LEFT, LEGM, LEMat, LEAN, LEAmb, LEBiom, LEAero, LEMec, LCI
1o semestre – 2004/05
02/11/2004 – 19 horas e 30 minutos
1o Teste
Duração: 1 hora e 30 minutos
Justifique convenientemente todas as respostas!
Grupo I
10 valores
1. Uma empresa com várias sucursais espalhadas pelo paı́s costuma alugar camionetas em três agências Rent a Car. Estima-se que a empresa alugue 50% das camionetas à agência A, 25% à agência
B e as restantes à agência C. Sabe-se ainda que a probabilidade de haver avarias numa camioneta
é de 8%, 21% e 7% quando é alugada respectivamente à agência A, B e C. Se uma camioneta
alugada por essa empresa tiver avarias, qual é a probabilidade de ter sido alugada à agência C?
(2.5)
2. Sejam A e B dois acontecimentos de um espaço de resultados Ω. Mostre que
(1.0)
P (A) + P (B) − 1 ≤ P (A ∩ B) ≤ P (A) + P (B).
3. Uma empresa de construção civil estima em 500 euros o custo médio por m2 de construção. Admita
que o custo real por m2 é independente de m2 para m2 , tem distribuição normal com valor esperado
500 euros e que em 31.74% dos casos o custo real é inferior a 400 euros ou superior a 600 euros.
(a) Calcule o desvio padrão do custo real por m2 de construção.
(2.0)
2
(b) Qual é o valor do custo real por m de construção que é excedido em 5% dos casos?
(2.0)
(c) Em 10 m2 de construção, qual é a probabilidade de pelo menos três terem um custo real por
m2 superior ao valor referido na alı́nea anterior?
(2.5)
Grupo II
10 valores
1. Numa certa cidade, o número de vezes em que a concentração de certo poluente excede os limites
recomendados é uma variável aleatória de Poisson com valor médio diário igual a 0.05.
(a) Determine a probabilidade de num mês (30 dias) os limites recomendados serem excedidos
mais do que uma vez.
(2.0)
(b) Indique o valor médio do intervalo de tempo entre duas ultrapassagens consecutivas dos
limites recomendados e calcule a probabilidade desse intervalo ser inferior a 15 dias.
(3.0)
2. Seja X a variável aleatória (v.a.) que indica o número de jogos em DVD vendidos por dia numa
loja e Y a v.a. que indica o número de filmes em DVD vendidos por dia nessa mesma loja. Por
experiência passada sabe-se que a função de probabilidade conjunta do par aleatório (X, Y ) é a
seguinte:
X\Y
0
1
2
3
0
c1
c3
0.23
0.02
1
c2
0
0.20
0
2
0.10
0
0
0.05
(a) Complete a tabela e determine as funções de probabilidade marginais de X e de Y sabendo
que E(X 2 ) = 2.45 e E(Y ) = 0.7.
(2.5)
Nota: Se não resolveu a alı́nea (a) passe a assumir que c1 = 0.15, c2 = 0.15 e c3 = 0.10.
(b) Obtenha a função de probabilidade e a função de distribuição do número de jogos em DVD
vendidos, num dia em que é vendido um filme em DVD.
Página 1 de 1
(2.5)
Departamento de Matemática –Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica (I)
LEC, LET, LArq, LMAC, LEFT, LEGM, LEMat, LEAN, LEAmb, LEBiom, LEAero, LEMec, LCI
1o semestre – 2004/05
13/1/2005 – 9 horas
1o Exame/ 2o Teste
Duração: 3 horas/1 hora e 30 minutos
• Se pretende fazer o exame deve resolver todos os grupos.
• Se pretende fazer o 2o teste deve resolver apenas os grupos III e IV. Nesse caso as cotações
passam a ser o dobro das indicadas.
• Justifique convenientemente todas as respostas!
Grupo I
7.0 valores
1. Para avaliar se os residentes estão ou não satisfeitos face a três diferentes plantas (P1, P2 e
P3), usadas em fogos de habitação social, 120 agregados familiares foram inquiridos. Desses, 60
habitavam em fogos com a planta P1, 45 em fogos com a planta P2 e os restantes em fogos com
a planta P3. O inquérito revelou que 40% dos agregados alojados em fogos com a planta P1, 60%
dos alojados em fogos com a planta P2 e 80% dos alojados em fogos com a planta P3 estavam
satisfeitos com a planta do seu fogo.
(a) Qual é a probabilidade de um agregado familiar que se declarou satisfeito com a planta do
seu fogo estar alojado num fogo com a planta P1?
(1.5)
(b) Qual é a probabilidade de um agregado familiar que se declarou insatisfeito com a planta do
seu fogo não estar alojado num fogo com a planta P3?
(1.5)
2. Prove que para quaisquer acontecimentos A, B, C e D de um espaço de resultados Ω, se tem:
(1.0)
P (A ∪ B ∪ C ∪ D) ≤ P (A) + P (B) + P (C) + P (D).
3. Para testar a eficácia de uma campanha de publicidade a um certo produto, perguntou-se a 100
consumidores desse produto se tinham tido conhecimento da campanha. Apenas 30 responderam
afirmativamente.
(a) Se escolher ao acaso e sem reposição 3 desses 100 consumidores, determine:
(1.5)
– a probabilidade de nenhum ter tido conhecimento da campanha.
– o valor esperado e o desvio padrão do número de consumidores com conhecimento da
campanha.
(b) Considere que se repetiu 100 vezes, de forma independente, a experiência referida na alı́nea
anterior. Determine um valor aproximado para a probabilidade de, nessas 100 repetições, o
número médio de consumidores com conhecimento da campanha exceder 0.8.
Grupo II
3.0 valores
Sejam X e Y as variáveis aleatórias que representam o atraso à partida e à chegada (em horas, arredondado para valores inteiros) de certo voo de longo curso de uma companhia aérea. Os registos da
companhia mostram que a função de probabilidade conjunta de (X, Y ) é dada por:
X\Y
0
1
2
0
0.1
0.1
0.1
1
0.2
0.0
0.1
Página 1 de 2
2
0.1
0.3
a
(1.5)
(a) Determine o valor de a e calcule a função de distribuição condicionada de Y dado X = 1.
(1.5)
(b) Calcule o coeficiente de correlação entre X e Y . Que pode concluir do valor obtido?
(1.5)
Grupo III
5.5 valores
1. Suponha que X1 , X2 , . . . , Xn é uma sucessão de variáveis aleatórias independentes tais que Xi ∼
P oisson(ti θ), onde ti são constantes conhecidas e θ é um parâmetro positivo. Foram propostos os
seguintes estimadores para o parâmetro desconhecido θ:
Pn
n
Xi
1 X Xi
T1 =
e T2 = Pi=1
n
n i=1 ti
i=1 ti
(a) Mostre que ambos os estimadores são centrados para θ.
(1.0)
(b) Determine as condições em que cada um dos estimadores é mais eficiente do que o outro na
estimação de θ.
(1.0)
2. O tempo de processamento CPU (em segundos) dos trabalhos de computador que chegam a um
determinado centro de computação é uma variável aleatória X que tem distribuição normal com
desvio padrão de 1.5 segundos. Seja (X1 , X2 , · · · , Xn ) uma amostra aleatória proveniente da
população X e (x1 , x2 , · · · , xn ) uma sua concretização.
(a) Deduza o estimador de máxima verosimilhança do valor esperado de X.
(1.5)
(b) Obtenha o intervalo de confiança aleatório a 95% para o valor esperado de X. Qual deverá
ser a dimensão da amostra a obter de modo a que este intervalo tenha uma amplitude de 0.5
segundos?
(2.0)
Grupo IV
4.5 valores
1. Um jogador suspeita que, num determinado dado, a probabilidade de ocorrer cada número par é
o dobro da probabilidade de ocorrer cada número ı́mpar. A fim de testar esta conjectura efectuou
135 lançamentos desse dado, de forma independente, tendo obtido resultados que se apresentam
no quadro seguinte:
Face
Frequência observ.
1
18
2
28
3
16
4
26
5
18
6
29
(a) Será que as observações obtidas são consistentes com a conjectura do jogador, para o nı́vel
de significância 1%?
(2.0)
(b) Determine um intervalo para o valor−p do teste anterior. Comente.
(0.5)
2. Considere que o modelo de regressão linear, Y = β0 + β1 x + ε, é adequado para explicar a relação
entre a variável aleatória Y e a variável x.
Com base numa amostra {(xi , yi ) : (xi , yi ) = (i, yi ), i = 1, 2, · · · , 12}, obteve-se a seguinte estimativa da recta de regressão
d|x) = 0.992 − 0.987x.
E(Y
Sabendo ainda que
12
P
2
(yi − ŷi ) = 0.316, obtenha um intervalo de confiança a 90% para o valor
i=1
esperado de Y quando x = 6.
Recorde que:
n
P
i=1
i=
n(n+1)
2
e
n
P
i=1
i2 =
n(n+1)(2n+1)
.
6
Página 2 de 2
(2.0)
Departamento de Matemática –Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica (I)
LEC, LET, LArq, LMAC, LEFT, LEGM, LEMat, LEAN, LEAmb, LEBiom, LEAero, LEMec, LCI
1o semestre – 2004/05
1/2/2005 – 9 horas
2o Exame/ 2o Teste
Duração: 3 horas/1 hora e 30 minutos
• Se pretende fazer o exame deve resolver todos os grupos.
• Se pretende fazer o 2o teste deve resolver apenas os grupos III e IV. Nesse caso as cotações
passam a ser o dobro das indicadas.
• Justifique convenientemente todas as respostas!
Grupo I
7.0 valores
1. Um jovem ecologista vai para as aulas a pé ou de bicicleta. Quando está a chover, o que acontece
com probabilidade 0.1, vai a pé e chega atempadamente com probabilidade 0.8. Se não está a
chover ele vai de bicicleta. Neste caso, se o semáforo que existe num cruzamento perigoso está
vermelho, o que acontece com probabilidade 1/3, ele usa um caminho alternativo e chega a tempo
com probabilidade 0.85; caso contrário, ele vai pelo caminho mais directo e chega a tempo com
probabilidade 0.95.
(a) Sabendo que o jovem chegou tarde às aulas, qual é a probabilidade de estar a chover?
(2.0)
(b) Sabendo que não está a chover mas mesmo assim o jovem chegou atrasado, qual é a probabilidade do semáforo ter sido encontrado vermelho?
(1.0)
2. Sejam A e B dois acontecimentos de um espaço de resultados Ω tais que P (A) > 0 e P (B) > 0.
Diz-se que o acontecimento A atrai o acontecimento B se P (B|A) > P (B). Mostre que A atrai B
se e só se B atrai A.
(1.0)
3. Suponha que, quando se tenta fazer uma certa operação usando um terminal Multibanco, ocorre
uma falha na comunicação com probabilidade 0.2.
(a) Calcule a probabilidade de terem de ser feitas pelo menos 5 tentativas, independentes, até
que ocorra a primeira falha.
(1.0)
(b) Foram sendo efectuadas, de forma independente, tentativas até ocorrerem 100 falhas. Seja
Y a variável aleatória que representa o número de vezes em que foram necessárias menos
do que 5 tentativas entre a ocorrência de falhas consecutivas. Indique uma expressão para
o valor exacto da probabilidade de Y exceder 60 e calcule um valor aproximado para essa
probabilidade usando a distribuição normal.
(2.0)
Grupo II
3.0 valores
Para determinar a resistência à luz solar e à humidade de um novo tipo de revestimento cerâmico, um
grande número de placas idênticas foram ensaiadas. No final de cada ano as placas foram examinadas
e foram contadas as que apresentavam anomalias na cor, na textura e em ambas. As que apresentavam
já os dois tipos de anomalias foram retiradas do ensaio. Representando por (X, Y ) o par aleatório que
indica o número de anos sem que se registassem anomalias na cor (X) e na textura (Y ) durante o
perı́odo em que decorreu o ensaio, obteve-se a seguinte função de probabilidade conjunta:
X\Y
0
1
2
0
0.25
0.19
0.07
1
0.2
0.1
b
Página 1 de 2
2
0.06
a
0.02
(a) Sabendo que as variáveis X e Y são identicamente distribuı́das, complete a tabela e obtenha o
valor esperado condicional de X dado Y = 2.
(1.5)
(b) Calcule o coeficiente de correlação entre X e Y . Que pode concluir?
(1.5)
Grupo III
5.5 valores
1. Use o método da máxima verosimilhança para obter o estimador de máxima verosimilhança do
dobro da variância de uma população exponencial.
(1.5)
2. Uma determinada fábrica emite diariamente para a atmosfera elevadas quantidades de certo poluente. A direcção de ambiente dessa fábrica afirma que estão a cumprir o limite imposto por
lei, ou seja, no máximo emitem 16 un/dia. No entanto uma organização ambientalista colocou
em causa essa afirmação. Para resolver essa questão, uma entidade independente mediu durante
40 dias, escolhidos ao acaso, a quantidade de poluente emitido, tendo obtido uma média de 19
un/dia. Com base nesta amostra, e supondo que a variável em estudo tem desvio padrão de 5
un/dia, responda às seguintes questões:
(a) Pode-se concluir, para um nı́vel de significância de 5%, que a fábrica está a cumprir o limite
imposto por lei?
(1.5)
(b) Ao efectuar o teste da alı́nea anterior, qual será a probabilidade de ser dada razão à direcção
de ambiente da fábrica, caso o valor médio da quantidade de poluente emitido seja de 18
un/dia?
(1.0)
3. Seja p a proporção de moedas de um euro não portuguesas a circular em Portugal. De acordo
com um jornal económico essa proporção é de 0.2. Uma amostra de 1000 moedas de um euro foi
seleccionada ao acaso em Portugal e nessa amostra verificou-se que havia 160 moedas espanholas,
80 francesas, 60 italianas e as restantes eram portuguesas. Efectuando um teste adequado, diga se
a amostra é consistente com a afirmação referida pelo jornal para os nı́veis de significância usuais.
Grupo IV
4.5 valores
(1.5)
1. Segundo as hipóteses de herança de Mendel, filhos provenientes de pais em que ambos possuem
sangue do tipo AB podem ter grupo sanguı́neo AA, AB e BB com probabilidades, respectivamente,
0.25, 0.50 e 0.25. Numa amostra de 284 crianças, em que ambos os progenitores têm sangue do
tipo AB, analisou-se o tipo de sangue e obteve-se os seguintes resultados:
Tipo de sangue
Número de crianças
AA
65
AB
152
BB
67
Será que estas observações corroboram a hipótese referida por Mendel? Tome a decisão com base
num intervalo para o valor-p.
(2.0)
2. Com o objectivo de investigar a resistência de um dado tipo de molas, registou-se respectivamente
a carga aplicada (x) e a deformação sofrida (y) em oito molas, tendo-se obtido resultados que
conduziram aos seguintes valores:
8
P
i=1
8
P
i=1
xi = 330.1
yi = 31.4
8
P
i=1
8
P
i=1
x2i = 16626.57
8
P
xi yi = 1531.46
i=1
yi2 = 143.68.
Considerando um modelo de regressão linear simples de Y em x e sabendo ainda que
8
P
2
(yi − ŷi ) = 1.9343:
i=1
(a) Obtenha a estimativa dos coeficientes da recta de regressão.
(0.5)
(b) Calcule o intervalo de confiança a 95% para o declive da recta de regressão. Com base no
intervalo obtido, avalie a significância (adequação) do modelo de regressão.
(2.0)
Página 2 de 2
Soluções das Provas de 1o Semestre 2004/2005
1
Exame de 1/02/005 às 9:00h
I
1. a) 0.211.
1. b) 0.6.
3. a) X : v.a. que indica o no de tentativas, independentes, até que ocorra a primeira
falha; X ∼ geom(p = 0.2), P (X ≥ 5) = 0.4096.
3. b) Y ∼ binom(n = 100, p = 0.59), P (Y > 60) =
100
P
y=61
100
y
0.59y 0.41100−y ;
P (Y > 60) ≈ 0.3821 (com correcção de continuidade).
II
b) 0.00604; como este valor é próximo
a) a = 0.06, b = 0.05, E(X|Y = 2) = 57 .
de zero as v.a.s são dependentes e positivamente associadas, porém o grau de associação
é extremamente fraco.
III
1. EM V (2V ar(X)) = 2X̄ 2 .
2. a) H0 : µ = 16 (H0 : µ ≤ 16) vs H1 : µ > 16 , tobs = 3.7947; rejeitar H0 para
α ≥ 0.05.
2. b) 0.1867.
3. H0 : p = 0.2 vs H1 : p 6= 0.2 , tobs = 7.9; rejeitar H0 para os nı́veis de significância
usuais (1%, 5% e 10%).
IV
1. qobs ≈ 1.44, valor-p ∈ ]0.40, 0.50[; rejeitar H0 (hipótese de Mendel) para α ≥ 0.50 e
não rejeitar H0 para α ≤ 0.40, pelo que não é de rejeitar H0 para os nı́veis usuais de
significância.
2. a) β̂0 = 0.68795, β̂1 = 0.07845.
2. b) I95% (β1 ) = (0.05266, 0.10334), como
β1 = 0 ∈
/ I95% (β1 ) há evidência para rejeitar H0 : β1 = 0 ao nı́vel de significância 5%, pelo
que é de considerar que a regressão é significativa.
Exame de 13/1/005 às 9:00h
I
1. a) 0.381.
1. b) 0.947.
3. a) X : v.a. que indica o no de consumidores, em 3 escolhidos ao acaso e sem reposição,
com conhecimento da campanha; X ∼ hipergeom(N = 100, M = 30, n = 3),
p
P (X = 0) ≈ 0.3385; E(X) = 0.9; V ar(X) = 0.7857.
3. b) 0.898.
1
Secção de Estatı́stica e Aplicações, IST, Fevereiro de 2005
1
II


y<0
 0,
a) a = 0.0, FY |X=1 (y) =
1/4, 0 ≤ y < 2


1,
y≥2
b) -0.1287; como este valor é menor que zero as v.a. são dependentes e estão negativamente associadas, porém o grau de associação linear é muito fraco.
III
1. b) T1 é mais eficiente que T2 na estimação de θ se t̄aritmetica =
Pt
i i
n
<
Pn
1
i ti
=
t̄harmonica , porém t̄harmonica ≤ t̄aritmetica , pois ti > 0, ∀i , logo T2 é sempre mais eficiente
que T1 .
2. a) EM V (E(X)) = X̄.
2. b) n = 139.
IV
1. a) X : v.a. que indica
o no de pintas da face de um certo dado, após o seu lançamento.


 1/9 x = 1, 3, 5
H0 : P (X = x) =
vs H1 : X não tem essa distribuição, qobs =
2/9 x = 2, 4, 6


0
c.c.
1.9(6), não rejeitar H0 para α ≤ 0.01.
1. b) Valor-p ∈ ]0.85, 0.90[; rejeitar H0 para α ≥ 0.90 e não rejeitar H0 para α ≤ 0.85,
pelo que não é de rejeitar H0 para os nı́veis usuais de significância (1%, 5% e 10%).
2. IC90% (E(Y |x = 6)) = (−5.024, −4.836).
Teste de 02/11/004 às 19:30h
I
1. ≈ 0.159.
3. a) 100 euros.
3. b) 664.49 euros.
3. c) 0.0115.
II
1. a) 0.4422.
1. b) 0.5276.


0.40, x = 0





 0.10, x = 1
2. a) c1 = c3 = 0.1, c2 = 0.2; P (X = x) =
0.43, x = 2



0.07, x = 3




0,
c.c.
(
2. b) P (X = x|Y = 1) =


0.45, y = 0



 0.40, y = 1
P (Y = y) =

0.15, y = 2



 0,
c.c.


x<0
 0,
FX|Y =1 (x) =
1/2, 0 ≤ x < 2


1,
x≥2
1/2, x = 0, 2
0,
c.c.
2
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o Teste
Duração: 1 hora e 30 minutos
1o semestre 2005/2006
03/11/2005 – 19:00 horas
Justifique convenientemente todas as respostas!
Grupo I
6 valores
1. Numa cidade com 100 mil habitantes são publicados 3 jornais diários: Púlpito (A), Espesso
(B) e Diário Noticioso (C). A partir de uma sondagem concluiu-se que 40000, 25000 e 20000
habitantes lêem A, B e C, respectivamente, bem como 3000 habitantes lêem B e C, 10000
habitantes lêem C e não A e, entre os que lêem A, 15% também lêem B. Suponha ainda que
nenhum habitante lê os três jornais.
(a) Calcule a probabilidade de um habitante dessa cidade ler pelo menos um jornal.
(1.5)
(b) Qual a probabilidade de um habitante da cidade ler somente um jornal?
(1.0)
(c) Determine o valor esperado e a variância do número de jornais diários lidos por habitante.
(1.0)
2. Admita que a altura (em metros) de uma certa variedade de eucalipto aos 4 anos de idade é
uma variável aleatória, X, com a seguinte função de distribuição:
(
FX (x) =
1 − e−0.4x (1 + 0.4x), x > 0
0,
x≤0
(a) Determine a moda da variável aleatória X.
(1.5)
(b) Calcule a probabilidade de que a altura de um eucalipto, retirado de um lote de árvores
com mais de 250 cm, não exceda 320 cm.
(1.0)
Grupo II
4 valores
1. Num concurso televisivo os concorrentes participam num jogo que se desenrola em duas fases:
começam por retirar, ao acaso e sem reposição, duas fichas de um pote que contém dez fichas
coloridas, duas das quais são verdes. Em seguida, lançam uma moeda equilibrada um número
de vezes igual ao número de fichas verdes que conseguirem obter na primeira fase. Por cada
“cara” obtida nesses lançamentos ganham e1000.
Sejam X e Y as variáveis aleatórias que representam o número de fichas verdes obtidas na
primeira fase do jogo e o número de “caras” obtidas na segunda, respectivamente.
(a) Calcule a probabilidade de um concorrente não chegar a fazer qualquer lançamento da
moeda, indicando qual a distribuição da variável aleatória X.
(1.0)
(b) Mostre que a função de probabilidade conjunta de (X, Y ) é definida pelos valores da
seguinte tabela:
(1.0)
Y \X
0
1
2
0
28/45
0
0
1
8/45
8/45
0
2
1/180
1/90
1/180
(c) Justifique a seguinte afirmação: “Se um concorrente retirar duas fichas verdes então é
tão provável não ganhar nada como ganhar o prémio máximo”.
(1.0)
(d) Qual o valor médio do prémio que o produtor do concurso paga aos concorrentes?
(1.0)
Página 1 de 1
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o Exame/2o Teste
Duração: 3 horas/1 hora e 30 minutos
1o semestre 2005/2006
12/01/2006 – 9:00 horas
• Se pretende entregar o exame deve resolver todos os grupos.
• Se pretende entregar o 2o teste deve resolver apenas os grupos III e IV.
• Justifique convenientemente todas as respostas!
Grupo I
5 valores
1. Numa experiência de laboratório, um rato pode escolher entre virar à esquerda ou à direita
no fim de um labirinto, recebendo comida ou um choque eléctrico, respectivamente. Assuma
que no primeiro ensaio o rato tem igual probabilidade de virar para cada um dos dois lados
no fim do labirinto. Após receber comida num ensaio, a probabilidade de o rato virar para
a esquerda no ensaio seguinte é 0.6. Caso o rato tenha levado um choque no ensaio anterior,
a probabilidade de ele virar à esquerda é 0.8. Considere que, em cada ensaio, a escolha do
rato só depende da escolha feita no ensaio imediatamente anterior.
(a) Calcule a probabilidade de o rato virar à esquerda no terceiro ensaio.
(1.5)
(b) Se o rato virou à direita no terceiro ensaio, qual a probabilidade de ele ter virado à
direita no primeiro ensaio?
(1.0)
2. Um jovem “desnorteado” tenta entrar em casa numa madrugada de Sábado com um molho de
chaves no qual só uma abre a porta. A probabilidade de ele abrir a porta em cada tentativa é
0.1. Admita que ele leva 2 minutos para tentar abrir a porta com qualquer chave e que inicia
essa operação 7 minutos antes de o seu pai se colocar junto à porta à sua espera. Suponha
ainda que o jovem é apanhado pelo pai com probabilidade 0.4, se entrar em casa antes de o
seu pai se postar à sua espera.
(a) Encontre o valor esperado do número de tentativas de abertura da porta até à entrada
do jovem em casa.
(1.0)
(b) Qual a probabilidade de o jovem ser apanhado pelo pai naquela madrugada?
(1.5)
Grupo II
5 valores
1. Seja X a duração (em horas) de uma válvula produzida por um certo fabricante. Suponha
que X tem distribuição normal com média 60 e variância σ 2 .
(a) Se um comprador dessas válvulas requer que pelo menos 90% das válvulas tenham uma
duração que exceda 50 horas, qual é o maior valor de σ 2 para que esse comprador fique
satisfeito?
(1.0)
(b) Calcule a probabilidade de, em 5 válvulas escolhidas aleatoriamente desse fabricante,
pelo menos 4 tenham uma duração que exceda 50 horas. Considere que a variância de
X tem o mesmo valor da respectiva média.
(1.5)
2. Sejam X e Y as variáveis aleatórias que representam os atrasos em minutos com que um comboio parte de uma estação de origem e chega a uma outra estação de destino, respectivamente.
Considere que a função densidade de probabilidade conjunta de (X, Y ) é
(
f(X,Y ) (x, y) =
1
20x ,
0,
0 < x < 10 e 0 < y < 2x
.
caso contrário
Página 1 de 2
(a) Calcule a probabilidade de o atraso à chegada ser inferior ao atraso na partida.
(1.0)
(b) Para um comboio que partiu com 5 minutos de atraso qual é a probabilidade de o atraso
à chegada ser inferior a 3 minutos?
(1.5)
Grupo III
5 valores
1. Considere a temperatura de destilação (em o C) de um tipo de óleo, X, como uma variável
aleatória com distribuição normal. Tendo em conta os seguintes valores obtidos de uma amostra aleatória de X, construa um intervalo de confiança a 99% para a temperatura esperada
de destilação do óleo.
8
X
8
X
xi = 1733
i=1
(2.0)
x2i = 376175
i=1
2. Um produtor de peças electrónicas resolveu inspeccionar 5 lotes de peças anotando, em cada
um, o número de peças inspeccionadas até encontrar a primeira peça defeituosa (X). Seja
p a probabilidade de uma peça ser defeituosa. Retirando peças com reposição em cada lote,
ele inspeccionou um total de 30 peças nos 5 lotes.
(a) Qual a estimativa de máxima verosimilhança da probabilidade de ocorrência de uma
peça defeituosa? E do valor esperado de X?
(2.0)
(b) Indique um estimador centrado do valor esperado de X. Avalie a eficiência desse estimador relativamente a um outro estimador T tal que
(1.0)
E[T ] =
1+p
p
e
V ar[T ] =
1 − p2
.
p2
Grupo IV
5 valores
1. No século XVIII, Buffon lançou uma moeda 4040 vezes, obtendo 2048 vezes uma face.
Baseando-se na frequência relativa dessa face, ele concluiu que a moeda seria equilibrada.
(a) Poder-se-á afirmar que há evidência a favor da conclusão de Buffon ao nı́vel de significância de 2%?
(2.0)
(b) Qual a probabilidade de o procedimento realizado em (a) conduzir à invalidação da
conclusão de Buffon, quando a probabilidade de sair essa face é p = 0.6?
(1.0)
2. A tabela seguinte sumaria o tempo de reparação, em minutos, de 100 instrumentos electrónicos de um determinado tipo, seleccionados ao acaso de entre os registos de uma oficina de
reparações.
(2.0)
Tempo
]0.0, 18.0]
]18.0, 20.5]
]20.5, +∞[
No de instrumentos
18
61
21
Tendo em conta esta amostra diga se é legı́timo considerar que o tempo de reparação desse
tipo de instrumento segue uma distribuição normal de valor médio 19 e variância 4.
Página 2 de 2
Departamento de Matemática – Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
2o Exame/2o Teste
Duração: 3 horas/1 hora e 30 minutos
1o semestre 2005/2006
31/01/2006 – 9:00 horas
• Se pretende entregar o exame deve resolver todos os grupos.
• Se pretende entregar o 2o teste deve resolver apenas os grupos III e IV.
• Justifique convenientemente todas as respostas!
Grupo I
7 valores
1. O nı́vel da albufeira de uma barragem é classificado como normal ou elevado. Apenas em
5% dos dias a albufeira atinge uma altura considerada elevada e, só neste caso, são feitas
descargas extraordinárias da barragem em 60% das vezes. Quando o nı́vel da albufeira
é considerado normal a probabilidade de haver uma cheia que afecte a cidade situada a
jusante da barragem é de 0.001. No entanto, se o nı́vel for elevado e forem feitas descargas
extraordinárias, a probabilidade de haver uma cheia passa a ser de 0.2 enquanto que, se o
nı́vel for elevado mas não forem feitas descargas extraordinárias, é de 0.01.
(a) Num dia em que não sejam feitas descargas extraordinárias da barragem qual é a probabilidade de a altura da albufeira se encontrar num nı́vel elevado?
(1.5)
(b) Qual é a probabilidade de haver uma cheia na cidade num dia em que a altura da
albufeira da barragem se encontra num nı́vel elevado?
(1.0)
(c) Qual a probabilidade de, num dia ao acaso, haver uma cheia na cidade?
(1.0)
2. Admita que o número de tufões (X) que, por ano, atingem uma certa cidade segue uma
distribuição de Poisson de variância igual a 2.4.
(a) Calcule a probabilidade de a cidade ser atingida por dois ou mais tufões num ano em
que se sabe que ela será atingida por algum tufão.
(1.0)
(b) Diga qual é o número médio de meses entre tufões sucessivos que atingem a cidade.
(1.0)
(c) Os prejuı́zos anuais no aeroporto da cidade, devidos a tufões, são inteiramente cobertos
pelas empresas seguradoras se houver menos de três tufões num ano. No entanto, se
ocorrerem x ≥ 3 tufões num ano, o prejuı́zo do aeroporto é de (x2 − 8) × 106 e. Calcule
o prejuı́zo anual esperado desse aeroporto devido à ocorrência de tufões.
(1.5)
Grupo II
3 valores
Considere uma estrutura com resistência X sobre a qual é aplicado um esforço Y . Sempre que o
esforço aplicado for superior à resistência da estrutura esta sofre danos. Suponha que a função
densidade de probabilidade do par aleatório (X, Y ) em unidades apropriadas é dada por
(
fX,Y (x, y) =
2 e−x−2 y , x ≥ 0 e y ≥ 0
.
0,
caso contrário
(a) Serão a resistência da estrutura e o esforço aplicado independentes?
(1.0)
(b) Qual a probabilidade de um esforço aplicado não provocar danos na estrutura?
(1.0)
(c) Sabendo que a estrutura sofreu danos, qual a probabilidade do esforço aplicado ter sido
no máximo 2?
(1.0)
Página 1 de 2
Grupo III
4.5 valores
O governo de um certo paı́s anunciou um conjunto de medidas com o objectivo de controlar
a recessão económica em que o paı́s se encontra. Antes de essas medidas serem aplicadas é
desejável obter uma estimativa da proporção de cidadãos que concordam com a sua aplicação.
Com esse objectivo considerou-se a recolha de uma amostra de dimensão 1500 a obter, ao acaso,
da população.
(a) Deduza o estimador de máxima verosimilhança da razão entre as proporções de habitantes
a favor e contra as medidas propostas pelo governo desse paı́s.
(2.0)
(b) Verificou-se que, na amostra recolhida, 950 habitantes responderam ser contra a aplicação
dessas medidas. Com base nesta amostra construa um intervalo de confiança aproximado
a 96% para a proporção de habitantes na população que concordam com as medidas
anunciadas pelo governo.
(1.5)
(c) Quantos mais cidadãos será necessário inquirir para que o erro de estimação aproximado
seja no máximo de 0.02, mantendo o nı́vel de confiança da alı́nea anterior?
(1.0)
Grupo IV
5.5 valores
1. Trinta pacientes do Dr. Pacon com excesso de peso foram aleatoriamente divididos em
dois tipos de dietas. Após 10 semanas, anotou-se o total de peso perdido (em Kg) por
cada paciente, cujos valores se encontram na tabela abaixo para as dietas 1 (X1 ) e 2 (X2 ).
Considere que as variáveis são independentes e têm ambas distribuições normais com a mesma
variância.
15
X
x1j = 139.2,
j=1
15
X
x21j
= 1385.44,
j=1
15
X
x2j = 125.4,
j=1
15
X
x22j = 1131.80
j=1
(a) Averigue se as duas dietas têm estatisticamente o mesmo efeito na perda de peso.
(1.5)
(b) Considerando agora a amostra formada pelos 30 pacientes como sendo proveniente de
uma única população, teste a hipótese da variância dessa população ser no máximo igual
a 4, para um nı́vel de significância de 5%.
(1.5)
2. Um serviço de reparações de máquinas regista diariamente o número de pedidos de reparação
(x) e o tempo total gasto em reparações (Y , em minutos). As observações registadas durante
18 dias conduziram aos seguintes valores:
18
X
i=1
xi = 81,
18
X
i=1
x2i
= 439,
18
X
i=1
yi = 1152,
18
X
i=1
yi2
= 90232,
18
X
xi yi = 6282.
i=1
(a) Considere o modelo de regressão linear simples para explicar a relação entre Y e x e
obtenha a estimativa dos mı́nimos quadrados da equação de regressão.
(1.0)
(b) Calcule o coeficiente de determinação e comente o resultado obtido.
(1.0)
(c) Qual a interpretação da estimativa do coeficiente β0 da equação de regressão? No caso
presente essa interpretação é válida?
(0.5)
Página 2 de 2
Soluções de Exames/Testes de PE
(LEEC+LEC+LEM+LEMat+LEAN+LET+LEAer+LEAmb+LEBM+LEGM+LCI)
1o Semestre 2005/06
1o Teste - 03/11/2005
I
1. a) 0.66.
1. b) 0.47.
1. c) X: número de jornais diários lidos por habitante. E(X) = 0.85. V (X) = 0.5075.
2. a) Moda = 2.5.
2. b) 0.1384.
II
1. a) P (X = 0) = 28/45. X ∼ Hipergeométrica (N = 10, M = 2, n = 2).
1. b) P (X = x, Y = y) = P (X = x)P (Y = y|X = x) com x, y = 0, 1, 2 e P (X = x) > 0,
onde P (Y = 0|X = 0) = 1, Y |X = 1 ∼ Bernoulli (0.5) com y = 0, 1 e Y |X = 2 ∼
Binomial (2, 0.5) com y = 0, 1, 2.
1. c) A afirmação é verdadeira pois P (Y = 0|X = 2) = P (Y = 2|X = 2) = 0.25
1. d) Z: quantia (em euros) ganha por um concorrente. E(Z) = 200 euros.
1
Soluções de Exames/Testes de PE
(LEEC+LEC+LEM+LEMat+LEAN+LET+LEAer+LEAmb+LEBM+LEGM+LCI)
1o Semestre 2005/06
1o Exame / 2o Teste - 12/01/2006
I
1. a) 0.66.
1. b) 0.5294.
2. a) 10 tentativas.
2. b) 0.8374.
II
1. a) 60.88.
1. b) 0.9207.
2. a) 0.5.
2. b) 0.3.
III
1. IC a 99% para E(X): (203.702, 229.548).
2. a) 1/6 é a estimativa de MV de p = P (X = 1). 6 é a estimativa de MV de E(X) = 1/p
pela propriedade de invariância do EMV.
2. b) X é um estimador centrado para E(X). X é mais eficiente que T pois EQM (X) =
(1 − p)/(np2 ) < EQM (T ) = 1/p2 , ∀n ≥ 1 e ∀p ∈ (0, 1).
IV
1. a) X = v.a. indicadora de uma face da moeda; X ∼ Bernoulli (p = P (X = 1)) ⇒
aprox.
∼ Normal(0, 1) para n grande pelo T.L.C.; 0 < |zobs. | =
variável fulcral Z = √ X−p
p(1−p)/n
0.877 < 2.3263 = FN−1(0,1) (0.99) ⇒ não se rejeita a hipótese H0 : p = 1/2 ao nı́vel de
significância ≤ 2%, pelo que as observações sustentam a conclusão de Buffon.
1. b) FN (0,1) (−15.35) + 1 − FN (0,1) (−10.60) ≈ 1.
2. T : tempo de reparação do instrumento electrónico; H0 : T ∼ N (µ = 19, σ 2 = 4);
−1
valor-p ∈ (0.005, 0.010) pois Fχ−1
2 (0.99) = 9.21 e Fχ2 (0.995) = 10.60; Rejeita-se H0 ao
2
2
nı́vel de significância ≤ 1%, pelo que as observações não sustentam H0 .
2
Soluções de Exames/Testes de PE
(LEEC+LEC+LEM+LEMat+LEAN+LET+LEAer+LEAmb+LEBM+LEGM+LCI)
1o Semestre 2005/06
2o Exame / 2o Teste - 31/01/2006
I
1. a) 0.0206.
1. b) 0.124.
1. c) 0.00715.
2. a) 0.7606.
2. b) 5 meses.
2. c) 3.4548 × 106 Euros.
II
a) Sim, X e Y são independentes.
b) 2/3.
a) 0.95001.
III
a) Estimador de máxima verosimilhança de p/(1 − p): X/(1 − X).
b) IC (aproximado) a 99% para p: (0.3411, 0.3922).
c) Mais 949 cidadãos.
IV
(0.80) = 0.855 e Ft−1
(0.85) = 1.056;
1. a) H0 : µ1 = µ2 ; valor-p ∈ (0.30, 0.40) pois Ft−1
28
28
Não se rejeita H0 para α ≤ 30%, i.e., há evidência que as duas dietas têm o mesmo efeito
na perda de peso.
1. b) H0 : σ 2 ≤ 4; região crı́tica a 5% C = (42.56, ∞) pois Fχ−1
2 (0.95) = 42.56; Rejeita-se
29
H0 para α ≥ 5%.
\
2. a) Equação de regressão estimada: E(Y
|x) = −2.322 + 14.738 x.
2. b) R2 = 0.9805; 98% da variação total de Y é explicada a partir de x; bom ajustamento.
2. c) Num dia sem máquinas para reparar, o tempo médio de reparação é estimado em
β̂0 = −2.322. No caso presente, esta interpretação não é válida.
3
Enunciados
Departamento de Matemática
Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica (I)
LEQ, LEFT, LMAC, LQ, LEBiol, LArq
1o semestre – 2005/06
5/11/2005 – 13 horas
1o Teste
Duração: 1 hora e 30 minutos
Justifique convenientemente todas as respostas!
1. Uma fábrica produz um certo tipo de tubos de PVC usando duas técnicas A e B. A técnica A,
mais barata mas menos fiável, é usada em 90% da produção e resulta bem em 70% dos casos.
Quando não resulta é necessário recorrer à técnica B, o que permite resolver o problema em 50%
das vezes. Se a técnica B é usada de inı́cio, o resultado é bom em 95% das situações mas não há
alternativa quando não resulta.
(a) Qual é a probabilidade de produzir um tubo de boa qualidade?
(3.0)
(b) Quando um tubo de boa qualidade é produzido, qual é a probablidade de ter sido usada
inicialmente a técnica A? E de ter sido usada exclusivamente a técnica A?
(2.0)
2. Perante um horário de uma carreira de autocarros que indica que durante certos perı́odos do
dia deveria passar um autocarro de 10 em 10 minutos, um estudante com alguns conhecimentos
de Probabilidades decidiu propor como modelos alternativos a distribuição uniforme no intervalo
(0, 20) e a distribuição exponencial com o mesmo valor esperado. Assumiu ainda que os intervalos de tempo entre passagens consecutivas dos autocarros dessa carreira são variáveis aleatórias
independentes. Compare os modelos em termos de:
(a) Variância, moda e mediana .
(2.0)
(b) Probabilidade de um passageiro que já esperou 5 minutos ter de esperar ainda mais de 10
minutos pelo próximo autocarro.
(2.0)
(c) Probabilidade de entre 10 intervalos entre passagens consecutivas de autocarros dessa carreira
haver pelo menos dois com duração superior a 10 minutos.
(3.0)
(d) Probablidade de um potencial passageiro ter de assistir no mı́nimo a 5 intervalos entre passagens consecutivas até observar o primeiro com duração inferior a 10 minutos.
(3.0)
3. Um inquérito a um grande número de mulheres com dois ou menos filhos conduziu à seguinte
função de probabilidade conjunta estimada para (X, Y ) onde X representa o número de filhos e
Y a faixa etária das mulheres (Y = 1: menos de 25 anos; Y = 2: 25 anos ou mais):
Y \X
1
2
0
0.15
b
1
a
0.40
2
0.05
c
(a) Sabendo que a distribuição marginal de X é Hipergeométrica(6, 3, 2), complete a tabela e
determine a distribuição marginal de Y .
(2.5)
(b) Calcule a função de probabilidade de X dado Y = 1 e o respectivo valor esperado e variância.
Atenção: Se não resolveu (a) use a = 0.1, b = 0.2 e c = 0.1.
(2.5)
Página 1 de 1
Departamento de Matemática –Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica (I)
LEQ, LEFT, LMAC, LQ, LEBiol, LArq
1o semestre – 2005/06
12/1/2006 – 13 horas
1o Exame/ 2o Teste
Duração: 3 horas/1 hora e 30 minutos
• Se pretende fazer o exame deve resolver todos os grupos.
• Se pretende fazer o 2o teste deve resolver apenas os grupos III e IV. Nesse caso as cotações
passam a ser o dobro das indicadas.
• Justifique convenientemente todas as respostas!
Grupo I
5 valores
1. Um ladrão fez 3 tentativas para retirar dinheiro de uma caixa multibanco usando um cartão
de crédito roubado e conseguiu obter dinheiro precisamente na última tentativa. Diga qual é a
probabilidade deste acontecimento, sabendo que as tentativas foram feitas ao acaso e que o código
do cartão é um número com 4 dı́gitos.
(1.0)
2. A mamografia é um teste de diagnóstico (ou de rastreio) do cancro da mama. O teste é habitualmente recomendado para ser feito anualmente em mulheres a partir dos 40 anos de idade. A
partir do estudo de um grande número de mamografias em mulheres com idades entre os 40 e os
50 anos foi possı́vel concluir o seguinte (para mulheres nesse intervalo de idades):
A probabilidade de uma mulher ter cancro é de 0.8% (taxa de prevalência)
A probabilidade da mamografia ser positiva é de 90%, se a mulher tem cancro (sensibilidade do
teste)
A probabilidade da mamografia ser positiva é de 7%, se a mulher não tem cancro.
Com base nesta informação calcule a probabilidade dos seguintes acontecimentos relativos a uma
mulher que acaba de fazer a sua mamografia.
(a) A mamografia ser negativa, sabendo que a mulher não tem cancro (especificidade do teste).
(1.0)
(b) A mamografia ser positiva.
(1.0)
(c) A mulher ter cancro, sabendo que o resultado da mamografia é positivo (valor preditivo do
teste positivo).
(1.0)
(d) A mulher não ter cancro, sabendo que o resultado da mamografia é negativo (valor preditivo
do teste negativo).
(1.0)
Grupo II
5 valores
O tempo de vida de um certo tipo de satélite (em anos) tem distribuição exponencial. O parâmetro α
da exponencial é tal que a probabilidade de um satélite durar pelo menos 3 anos é e−1.5 .
(a) Determine a probabilidade de um satélite estar em órbita pelo menos 1 ano.
(1.0)
(b) Supondo que 4 desses satélites foram lançados ao mesmo tempo e do mesmo lugar mas de forma
independente, calcule a probabilidade de ao fim de um ano continuarem em órbita pelo menos 3
desses satélites.
(1.0)
(c) Mostre que a probabilidade de um satélite que está em órbita há um ano continuar em órbita pelo
menos mais meio ano é igual à probabilidade do satélite se manter em órbita pelo menos meio ano.
(1.0)
(d) Determine o valor esperado do tempo de vida dos satélites cujo tempo de vida não excede 1 ano.
(2.0)
Página 1 de 2
Grupo III
5 valores
1. Considere uma população X, com distribuição normal em que o valor esperado µ é conhecido e a
variância σ 2 é desconhecida.
(a) Deduza o estimador de máxima verosimilhança de σ 2 obtido com base numa amostra aleatória
X1 , . . . , Xn .
(b) Mostre que o estimador obtido em (a) é não enviesado e calcule a sua variância. Para
responder a esta alı́nea use os seguintes resultados:
Pn
2
i=1 (Xi − µ)
(i)
∼ χ2(n)
2
σ
(ii) uma variável aleatória com distribuição do Qui-quadrado com k graus de liberdade tem
valor esperado igual a k e variância igual a 2k.
(1.5)
(1.0)
2. Um candidato a Presidente da República encomendou uma sondagem que inquiriu 400 eleitores,
escolhidos ao acaso, dos quais 52% declararam dar-lhe o seu voto.
(a) Construa um intervalo de confiança a 95% para a verdadeira proporção de eleitores que
votam naquele candidato, para mostrar que a eleição por maioria absoluta, que a proporção
observada sugere, pode não ser conseguida.
(1.5)
(b) Qual o número mı́nimo de eleitores que deveriam ter sido inquiridos para que aquela mesma
proporção de 52% pudesse deixar o candidato seguro, ao nı́vel de confiança de 95%, quanto
à sua eleição por maioria absoluta?
(1.0)
Grupo IV
5 valores
Numa visita a várias empresas, do mesmo ramo de actividade, foi recolhida informação relativa ao
investimento em publicidade (X, em milhares de euros) e ao volume de vendas (Y , em milhões de euros)
conseguido após a aplicação daquele investimento. Os dados recolhidos são:
xi
yi
100
9
105
8
90
5
80
2
80
4
85
6
87
4
92
7
90
6
95
7
93
5
85
5
85
4
70
3
85
3
Pretende-se estabelecer a relação entre X e Y com base num modelo de regressão linear simples em
que os erros têm distribuição normal com valor médio nulo, são independentes e têm todos a mesma
variância. Para isso foram calculadas cinco quantidades que habitualmente são usadas para estudar o
modelo:
P15
i=1
xi = 1322,
P15
i=1
yi = 78,
P15
i=1
xi yi = 7072,
P15
i=1
x2i = 117532,
P15
i=1
yi2 = 460.
(a) Calcule a recta de regressão estimada.
(1.0)
(b) Acha que a recta de regressão estimada se ajusta bem aos dados?
(1.0)
(c) Proceda ao teste da hipótese “o declive da verdadeira recta de regressão é nulo”, usando um nı́vel
de significância de 5%. Explique o que se pretende ao efectuar este teste de hipóteses.
(1.5)
(d) De acordo com o modelo de regressão estimado, diga qual é a estimativa do valor esperado do
volume de vendas das empresas que decidem investir 75000 euros em publicidade. Obtenha um
intervalo de confiança a 95% para o verdadeiro valor esperado.
(1.5)
Página 2 de 2
Departamento de Matemática — Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o. Teste (A)
Duração: 1 hora e 30 minutos
—
Alameda
2o. Semestre — 2005/06
22/04/2006 — 09 horas
• Justifique convenientemente todas as respostas.
Grupo I
10.0 valores
1. 75% da população de Nicosia (Chipre) é grega e 25% turca. Apurou-se também que 20%
dos gregos e 10% dos turcos falam inglês.
(a) Qual a percentagem da população de Nicosia que fala inglês? Serão os eventos “ser
grego” e “falar inglês” eventos independentes?
(3.0)
(b) Suponha que visita Nicosia, encontra um seu habitante e que este fala inglês. Qual a
probabilidade de ele ser grego?
(2.0)
2. O tempo que uma viatura de uma luxuosa marca leva a atingir 100 Km/h (em segundos)
é uma variável aleatória X com função densidade de probabilidade
(
2×4.52
, x ≥ 4.5
x3
fX (x) =
0,
caso contrário.
(a) Determine a probabilidade de uma viatura seleccionada ao acaso atingir 100 Km/h
em mais de 7 segundos e como tal necessitar de uma afinação.
(2.0)
(b) Qual a probabilidade de pelo menos duas viaturas necessitarem de afinação, de entre
um conjunto de 10 seleccionadas ao acaso da produção diária?
(3.0)
Grupo II
10.0 valores
1. O número de registos de neutrinos registados em intervalos de 12 segundos, aquando
da primeira observação da supernova S1987a por astrónomos, é bem modelado por uma
distribuição de Poisson com variância igual a 0.8.
(a) Obtenha a mediana do número de neutrinos registados num intervalo de 12 segundos.
Interprete este resultado.
(2.0)
(b) Confronte o valor exacto e o aproximado (com e sem correcção de continuidade)
da probabilidade de o número de neutrinos registados em 10 minutos exceder 40.
Comente.
(3.0)
2. Uma empresa tem o exclusivo da venda e manutenção de certo tipo de alfaias em Portugal.
Dos seus registos concluiu-se que nos primeiros quatro anos a idade da máquina (X)
e o número de horas gastas na sua manutenção (Y ) têm uma função de densidade de
probabilidade conjunta dada por

1

 6 , 0 ≤ x ≤ 2, 0 ≤ y < 2
1
fX,Y (x, y) =
24 , 2 < x ≤ 4, 2 ≤ y ≤ 6

 0, outros pares (x, y).
(a) Calcule E(X) e E(X|Y = 2). O que pode concluir?
(3.0)
(b) Calcule a covariância entre X e Y .
(2.0)
1
Departamento de Matemática — Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
1o. Teste (B)
Duração: 1 hora e 30 minutos
—
Alameda
2o. Semestre — 2005/06
22/04/2006 — 11 horas
• Justifique convenientemente todas as respostas.
Grupo I
10.0 valores
1. Numa região em que se admite que 1% das aves selvagens está infectada com o vı́rus H5N1
(gripe das aves), foi desenvolvido um teste rápido para a sua detecção. Esse teste tem as
seguintes caracterı́sticas: indica a presença do vı́rus quando ele não existe (falsos positivos)
em 5% dos casos. Por outro lado, nega a sua presença quando ele existe (falsos negativos)
em 10% das situações.
(a) Qual é a probabilidade de uma ave, diagnosticada como não infectada, não o estar
de facto?
(3.0)
(b) Qual é a probabilidade de uma ave ser erradamente diagnosticada?
(2.0)
2. Um satélite de comunições mantém-se numa órbita estacionária durante um perı́odo de
tempo com distribuição exponencial de valor esperado igual a 6 anos.
(a) Admitindo que o satélite pode ser reparado de modo a retomar uma órbita estacionária, qual é a probabilidade de ele necessitar de pelo menos uma dessas reparações
durante um perı́odo de três anos?
(2.5)
(b) Qual é a probabilidade do tempo de vida exceder 8 anos para um satélite que está
actualmente há mais de três anos em órbita estacionária?
Recalcule esta probabilidade assumindo agora que o tempo de vida tem uma distribuição uniforme com o mesmo valor esperado.
(2.5)
Grupo II
10.0 valores
1. Considere a variável aleatória contı́nua X com função de densidade de probabilidade dada
por:
(x−4)2
1
fX (x) = √ e− 2 , −∞ < x < +∞.
(1)
2π
Após ter identificado a distribuição de X, calcule P (|X − 6| ≤ 2).
(2.0)
2. Um teste de escolha múltipla é constituı́do por 20 questões com a mesma cotação e com
quatro respostas cada. Assuma que um estudante apenas tenta adivinhar a resposta
de cada questão. Obtenha o valor exacto e um valor aproximado da probabilidade do
estudante ter nota positiva. Comente os resultados obtidos.
(3.0)
3. O número de portáteis (X) e PCs (Y ) vendidos diariamente numa loja de material informático têm função de probabilidade conjunta dada parcialmente pela tabela abaixo:
X
0
1
2
0
0.1
0.2
0.0
Y
1
0.1
0.1
0.1
2
0.3
0.1
a
(a) Complete a tabela e determine o coeficiente de correlação ente X e Y . Comente.
(2.5)
(b) Calcule V (X|Y ≥ 1).
(2.5)
1
Departamento de Matemática — Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
—
Exame de 1a. Época / 2o. Teste
Duração: 3 horas / 1 hora e 30 minutos
Alameda
2o. Semestre — 2005/06
24/06/2006 — 09 horas
• Se pretende fazer o exame deve resolver todos os grupos.
• Se pretende fazer o 2o. teste deve resolver apenas os grupos III e IV. Nesse caso as
cotações passam a ser o dobro das indicadas.
• Justifique convenientemente todas as respostas.
Grupo I
6.5 valores
1. Com o objectivo de aumentar a segurança de crianças em automóveis, estão a ser testados
dois dispositivos de retenção A e B. As simulações mostraram que, em caso de acidente grave,
o dispositivo A (resp. B) é eficaz em 95% (resp. 96%) dos casos. Admita que no mercado só
passarão a existir estes dois dispositivos, instalados em automóveis exactamente na mesma
proporção.
(a) Qual a probabilidade do dispositivo de retenção instalado num automóvel seleccionado
ao acaso vir a ser eficaz em caso de acidente grave?
(1.0)
(b) Obtenha agora a probabilidade de o dispositivo ser do tipo A sabendo que foi eficaz em
caso de acidente grave.
(1.0)
2. Um professor tenta lançar o sumário da sua aula teórica no FENIX no próprio dia e nos dias
seguintes, fazendo uma única tentativa por dia. Contudo, a probabilidade de numa tentativa
conseguir aceder ao sistema é de apenas 0.6, independentemente do dia considerado.
(a) Qual é a probabilidade de ser necessário esperar mais de uma semana (7 tentativas) até
que o professsor consiga lançar um sumário?
(1.0)
(b) Assuma que o sumário de uma certa aula já foi objecto de duas tentativas de lançamento
sem sucesso. Qual é o valor esperado do número de tentativas adicionais até o professor
lançar tal sumário?
(1.0)
(c) Em 10 aulas, qual é a probabilidade de pelo menos dois dos sumários terem sido lançados
no próprio dia?
(1.0)
(d) Durante um semestre (52 aulas) quantos sumários é de esperar que possam ser lançados
no próprio dia? Indique um valor aproximado para a probabilidade desse número exceder
30.
(1.5)
Grupo II
3.5 valores
Na afinação de um aparelho é possı́vel controlar duas variáveis contı́nuas X e Y . No entanto,
estas variáveis só podem ser controladas em simultâneo e não individualmente. Com efeito, quando
o aparelho está afinado, o par aleatório contı́nuo (X, Y ) tem função densidade de probabilidade
conjunta constante no triângulo 0 < x < 1, 0 < y < x e nula no resto do plano, i.e.,
(
fX,Y (x, y) =
k, 0 < x < 1, 0 < y < x
0, outros pares (x, y).
(a) Após ter mostrado que k = 2, calcule E(Y ) e E(Y |X = 0.5). O que pode concluir?
(2.0)
(b) Obtenha o coeficiente de correlação entre X e Y e comente o valor obtido.
(1.5)
1
Grupo III
6.0 valores
1. Uma máquina automática é usada para encher e selar latas de 1 litro de um produto lı́quido.
Na sequência de algumas queixas acerca do facto de as latas se encontrarem demasiado cheias,
foi medido o conteúdo de 100 latas seleccionadas ao acaso do fabrico diário, tendo-se obtido
P100
P100 2
i=1 xi = 108.983 e
i=1 xi = 120.238.
(a) Deduza um intervalo aproximado de confiança a 95% para o valor esperado µ do conteúdo
das latas.
(1.5)
(b) Teste a hipótese de µ ser efectivamente igual a 1 litro contra a alternativa H1 : µ > 1
litro, ao nı́vel de significância de 2.5%.
(1.5)
2. Um engenheiro admite que a duração de certa marca de lâmpadas eléctricas é uma variável
aleatória com distribuição exponencial de parâmetro λ = 0.05. Numa experiência laboratorial
envolvendo 100 dessas lâmpadas obtiveram-se as seguintes durações resumidas abaixo:
i
Classe i
1
2
3
4
[0, 10[
[10, 20[
[20, 30[
[30, +∞[
30
27
23
20
Frequência
(a) Com base nos dados fornecidos teste a hipótese considerada pelo engenheiro ao nı́vel de (2.0)
significância de 5%.
(b) Obtenha e discuta o intervalo para o valor–p associado à amostra considerada.
Grupo IV
(1.0)
4.0 valores
Com o objectivo de estimar a constante de elasticidade (β1 )−1 (em Newton/metro) de certo tipo de
mola, foram seleccionadas 10 dessas molas, todas com o mesmo comprimento em repouso β0 (em
metros). Foi obtido o seguinte conjunto de resultados, após se ter suspendido à mola i (i = 1, . . . , 10)
um corpo com peso xi (em Newton) e medido o comprimento da mola após tal suspensão yi :
i
xi
yi
Pn
i=1 xi
1
0.25
0.206
= 13.75
2
0.50
0.212
Pn
2
i=1 xi
3
0.75
0.218
4
1.00
0.225
5
1.25
0.239
6
1.50
0.237
Pn
7
1.75
0.245
− nx̄2 = 5.15625
i=1 yi = 2.353
Pn
i=1 xi yi − nx̄ȳ = 0.131375.
8
2.00
0.251
Pn
9
2.25
0.257
2
i=1 yi
10
2.50
0.263
− nȳ 2 = 0.0034021
Admita a validade do modelo de regressão linear simples Yi = β0 + β1 xi + i (i = 1, . . . , 10) para
este conjunto de dados e responda às questões que se seguem:
(a) Obtenha estimativas do declive da recta, da constante de elasticidade (β1 )−1 e do valor esperado
do comprimento da mola ao sujeitá-la a uma força de 3.0 Newton. Comente esta última
estimativa.
(1.5)
(b) Calcule um intervalo de confiança a 95% para a constante de elasticidade da mola (β1 )−1 .
(1.5)
(c) Determine o coeficiente de determinação. Comente o valor obtido.
(1.0)
2
Departamento de Matemática — Secção de Estatı́stica e Aplicações
Probabilidades e Estatı́stica
Exame de 2a. Época / 2o. Teste
Duração: 3 horas / 1 hora e 30 minutos
—
Alameda
2o. Semestre — 2005/06
08/07/2006 — 09 horas
• Se pretende fazer o exame deve resolver todos os grupos.
• Se pretende fazer o 2o. teste deve resolver apenas os grupos III e IV. Nesse caso as
cotações passam a ser o dobro das indicadas.
• Justifique convenientemente todas as respostas.
Grupo I
6.0 valores
1. Uma companhia aérea vende bilhetes a baixo custo exclusivamente para Berlim e Amesterdão.
Esta companhia constatou que 5% dos seus passageiros perde o vôo para o primeiro destes
destinos e que a probabilidade de um passageiro perder o vôo para um qualquer destes dois
destinos é de 7.1%.
(a) Sabendo que 30% (resp. 70%) dos bilhetes vendidos têm como destino Berlim (resp.
Amesterdão), determine a probabilidade de um passageiro perder o seu vôo para Amesterdão.
(1.5)
(b) Qual a percentagem de passageiros que, tendo perdido o seu vôo, tinham por destino (1.0)
Berlim?
2. O número de descargas efectuadas em cada mês numa ribeira tem distribuição de Poisson
com desvio-padrão igual a 0.5.
(a) Supondo que neste momento a ribeira não está poluı́da, qual é a probabilidade da primeira descarga não ocorrer nos próximos 3 meses?
(1.0)
(b) Um grupo de peritos ambientais estima que, se nos próximos 5 anos ocorrerem mais de 20
descargas, a ribeira ficará irrecuperável. Calcule o valor exacto e um valor aproximado
para a probabilidade de isso vir a acontecer. Comente.
(1.5)
(c) As autoridades só conseguem apurar a responsabilidade pelas descargas em 10% dos
casos, independentemente de descarga para descarga. Qual é o valor esperado do número
de descargas ocorridas até ser encontrado um responsável?
(1.0)
Grupo II
4.0 valores
O número de iPods (X) e de MP3s (Y ) vendidos diariamente numa pequena loja têm função de
probabilidade conjunta dada pela tabela abaixo:
X
0
1
2
Y
0
0.1
a
0.2
1
0.1
b
0.2
(a) Complete a tabela sabendo que P (X = 1|Y = 1) = 0.4 e determine a probabilidade de num
dia arbitrário o número de iPods vendidos ser superior ao de MP3s vendidos.
(1.0)
Nota: Se não responder à alı́nea (a), passe a considerar que a = 0.3 e b = 0.1.
(b) Obtenha o número esperado de MP3s vendidos num dia em que foi vendido somente um iPod. (1.0)
(c) Calcule o valor esperado e a variância do lucro diário da venda total de iPods e MP3s admitindo
que o lucro da venda de um iPod é de 15 euros e o de um MP3 é de 10 euros.
(2.0)
1
Grupo III
6.0 valores
1. Na famosa experiência realizada pelo fı́sico Rutherford (em 1910), sobre a emissão de partı́culas
α por uma fonte radioactiva, foi observado que em 2612 intervalos de 1/8 de minuto foram
emitidas no total 9318 partı́culas.
Admita que a variável aleatória X, que representa o número de partı́culas emitidas por
essa fonte radioactiva num intervalo de 1/8 de minuto, possui distribuição de Poisson com
parâmetro λ/8.
(a) Deduza o estimador de máxima verosimilhança de λ, com base numa amostra aleatória
(X1 , . . ., Xn ) da população X.
(1.5)
(b) Obtenha um intervalo de confiança aproximado a 90% para o valor esperado de X.
(1.5)
2. Os motores a jacto começaram a ser usados há mais de 2 décadas como meio de propulsão
de aeronaves comerciais e constituem o que se considera uma forma económica e segura de
transportar carga e passageiros. Os tempos de reparação de pequenas falhas de 100 desses
motores estão resumidos na seguinte tabela de frequências:
i
Classe i
1
2
3
4
5
[0, 0.431[
[0.431, 0.776[
[0.776, 1.288[
[1.288, 2.320[
[2.320, +∞[
22
20
17
22
19
Frequência
(a) Um gestor da empresa responsável por estas reparações é da opinião que o tempo de
tais reparações (X, em horas) possui função de distribuição dada por FX (x) = Φ(ln x),
onde Φ(t) representa a função de distribuição da normal–padrão.
Confirme que, sob a validade desta hipótese sobre a distribuição de X, as 5 classes da
tabela acima possuem frequências absolutas esperadas aproximadamente iguais a 20.0. (1.0)
(b) Averigue a razoabilidade da conjectura do referido gestor, calculando para o efeito um
intervalo para o valor–p.
(2.0)
Grupo IV
4.0 valores
As 7 observações do quadro a seguir dizem respeito à largura de estrada x (em metros) e ao número
de acidentes por ano Y .
i
xi
yi
Pn
i=1 xi
= 35
Pn
2
i=1 xi
1
2.6
92
= 193.96
2
3.0
85
3
4.4
78
Pn
i=1 yi
4
5.0
81
= 483
5
6.2
54
6
6.6
53
Pn
2
i=1 yi
7
7.2
40
= 35659
Pn
i=1 xi yi
= 2215.
(a) Considere um modelo de regressão linear simples de Y em x e estime a recta de regressão
usando para o efeito os dados fornecidos.
(1.0)
(b) Teste a hipótese de a largura da estrada não influenciar o número de acidentes ao nı́vel de
significância de 5%.
(1.5)
(c) Calcule um intervalo de confiança a 95% para o valor esperado do número de acidentes numa
estrada com 5.5 metros de largura.
(1.5)
2
Download

Testes e Exames de