CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES
Recebi alguns e-mails questionando uma das questões de estatística do simulado.
Segue a questão:
Em uma empresa há 25 homens e 75 mulheres. Os homens recebem, em média, um
salário de R$ 2.751,00. O salário médio das mulheres é, também, de R$ 2.751,00. O
conjunto formado pelos salários dos homens apresenta desvio padrão igual a R$ 3,60. O
conjunto formado pelos salários das mulheres, por sua vez, tem desvio padrão de R$
2,00.
Assinale a alternativa que contém o valor que mais se aproxima do desvio padrão do
conjunto formado pelos salários de todos os funcionários da empresa.
a) 5,6
b) 2,4
c) 2,5
d) 2,8
e) 3,0
Nesse tipo de problema, o principal erro do candidato é fazer uma média ponderada
com os valores de desvio-padrão. Isso não pode. A média ponderada que devemos fazer
é com os valores das variâncias. Em geral, a gente só grava isso: faça a média
ponderada. Abaixo vou mostrar de onde vem a média ponderada, e aí vai ficar fácil
entender porque é que ela só vale quando for feita para a variância.
No presente caso, sabemos que o desvio-padrão dos salários dos homens é R$ 3,60.
Logo, a variância é 12,96. Portanto:
25
σH2 =
∑ (H
i =1
i
− H )2
25
Onde Hi representa os salários dos homens. Assim:
25
12,96 =
∑ (H
i =1
− 2.751) 2
i
25
25
12,96 × 25 = ∑ ( H i − 2.751) 2
i =1
Para as mulheres, temos que a variância é igual a 4. Logo:
75
σM2 =
∑ (M
i =1
i
− M )2
75
1
www.pontodosconcursos.com.br
CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES
75
4=
∑ (M
i =1
i
− 2.751) 2
75
75
4 × 75 = ∑ ( M i − 2.751) 2
i =1
Para calcular a variância de todos os funcionários, temos que calcular a soma dos
quadrados de todos os desvios. Como a média feminina é igual à média masculina,
então a média geral será, também, igual a 2.751. Portanto, no cálculo da variância
conjunta, os desvios são calculados em relação a R$ 2.751,00. Fica assim:
25
σ2 =
75
∑ ( H i − 2.751) 2 + ∑ (M i − 2.751) 2
i =1
i =1
100
σ2 =
25 × 12,96 + 75 × 4
100
E aí é que aparece a tal média ponderada. Fazendo os cálculos, achamos:
σ 2 = 6,24 ⇒ σ ≅ 2,5
E a resposta foi letra C.
E porque é que a média ponderada não vale para o desvio-padrão? É que, tanto na
variância quanto no desvio-padrão, temos um somatório. Temos uma soma de desvios
ao quadrado. No desvio-padrão, depois de calculada a soma, tiramos a raiz quadrada. É
aí que está o detalhe. Acontece que a raiz quadrada da soma não é igual à soma das
raízes.
Um exemplo:
9 + 16 = 25 = 5
Pronto. Calculamos a raiz quadrada da soma. Ela foi igual a 5. Façamos agora outro
cálculo:
9 + 16 = 3 + 4 = 7
Notem como a raiz quadrada da soma (=5) foi diferente da soma das raízes (=7).
É por isso que a média ponderada só vale para a variância.
A tentativa de “forçar” uma média ponderada com os desvios-padrão não dá certo por
esse motivo. É como se fizéssemos algo parecido com:
25
σ2 =
σ=
75
∑ ( H i − 2.751) 2 + ∑ (M i − 2.751) 2
i =1
i =1
100
25
75
i =1
i =1
∑ ( H i − 2.751) 2 + ∑ (M i − 2.751) 2
100
2
www.pontodosconcursos.com.br
CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES
25
σ=
∑ ( H i − 2.751) 2 +
i =1
75
∑ (M
i =1
i
− 2.751) 2
10
O que é falso, pois, como vimos, a raiz da soma não é igual à soma das raízes.
Aproveitando a oportunidade, vejamos um exercício de concurso sobre isso:
Auditor Fiscal ICMS/BA – 2004 [FCC]
Sabe-se que a altura média dos 5.000 habitantes de uma cidade X é igual à altura média
de uma outra cidade Y com 10.000 habitantes, ou seja, igual a 1,70m. O desvio-padrão
correspondente encontrado para a população da cidade X é 2 cm e para a população da
cidade Y é 5 cm. Então, a variância das alturas da população das duas cidades reunidas
é:
a) 12,25 cm2
b) 16,00 cm2
c) 18,00 cm2
d) 24,50 cm2
e) 29,00 cm2
Resolução:
O exercício deu o desvio padrão da cidade X. Para achar a variância, basta elevar ao
quadrado. A variância da cidade X é igual a 4 cm2 (=2 ao quadrado). E como se chega
na variância? Basta fazer a média dos desvios ao quadrado (média esta calculada em
relação a 1,70, que é a altura média da cidade).
Ou seja:
σX2 =
4=
1
2
× ∑ ( X − 1,70)
5.000
1
2
× ∑ ( X − 1,70)
5.000
Multiplicando cruzado:
∑ ( X − 1,70)
2
= 4 × 5.000
A variância das alturas na cidade Y é igual a 25 cm2. Basta elevar o desvio padrão
fornecido ao quadrado. Como é obtida esta variância? Esta variância é igual à média dos
desvios ao quadrado (desvios esses calculados em relação a 1,70m, que é a altura média
na cidade).
σY 2 =
1
2
× ∑ (Y − 1,70)
10.000
3
www.pontodosconcursos.com.br
CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES
25 =
1
2
× ∑ ( X − 1,70)
10.000
Multiplicando cruzado:
∑ ( X − 1,70)
2
= 25 × 10.000
Pois bem. Agora juntamos as pessoas das duas cidades. A altura média continua sendo
de 1,70 (já que as duas cidades tinham médias iguais). E a variância? Fica em quanto?
Para achar a variância, vamos somar todos os quadrados dos desvios (desvios estes
calculados em relação a 1,70).
Depois disso, dividimos o resultado por 15.000 (pois essa nova população tem 15.000
habitantes, resultado da soma dos habitantes de X e Y). Com esse procedimento,
obtemos justamente a variância da nova população.
σ2 =
1
×
15.000
(∑ ( X − 1,70) + ∑ (Y − 1,70) )
2
2
Substituindo os valores dos somatórios:
σ2 =
1
× (4 × 5.000 + 25 × 10.000)
15.000
σ2 =
1
× 270.000 = 18
15.000
A nova variância é de 18 cm2. Resposta: C
Notem bem na fórmula a que chegamos:
σ2 =
1
× (4 × 5.000 + 25 × 10.000)
15.000
Na fórmula acima temos as variâncias das duas cidades, multiplicadas pelos números de
habitantes.
peso da variância da
cidade X: número de
habitantes da cidade
σ2 =
peso da variância da
cidade Y: número de
habitantes da cidade
1
× (4 × 5 .000 + 25 × 10 .000 )
15 .000
variância da cidade X
variância da cidade Y
A variância das duas cidades reunidas é uma média ponderada das variâncias de cada
cidade. E os pesos de ponderação são os números de habitantes (ou número de
elementos de cada conjunto).
4
www.pontodosconcursos.com.br
CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES
Não são raras as questões que pedem a variância da população resultante da união de
dois conjuntos. Nesse caso específico, em que as médias das cidades X e Y são iguais,
até que não deu tanto trabalho. Quando as médias são diferentes, encontrar a variância
da união dos dois conjuntos já fica um pouco mais trabalhoso. Isto porque, quando as
médias são diferentes, não basta simplesmente aplicar a média ponderada.
Vejamos um exemplo.
Analista BACEN/2006 – Área 3 [FCC]
A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor
A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média
aritmética dos valores das vendas diárias realizadas pelas 200 empresas do Setor B é de
R$ 2.000,00, com desvio padrão de R$ 200,00. A variância, em R$2, dos valores das
vendas diárias realizadas pelos dois setores reunidos é:
a) 34.000
b) 50.000
c) 194.000
d) 207.500
e) 288.000
Resolução:
Vamos chamar de A o conjunto das vendas do setor A, de B o conjunto das vendas do
setor B e de C a união de A e B.
A média de A é dada pela soma de todas as vendas do setor A, dividida por 50 (pois são
50 empresas no setor A).
A=
∑A ⇒
50
∑ A = 50 × A ⇒ ∑ A = 50 × 1.000 = 50.000
A média de B é dada pela soma de todas as vendas do setor B, dividida por 200.
B=
∑B ⇒
200
∑ B = 200 × B ⇒ ∑ B = 200 × 2.000 = 400.000
Como fica a média do conjunto C, formado pelas vendas dos dois setores?
Para achar a média de C, somamos todas as vendas, tanto do setor A, quanto do B, e
dividimos por 250 (são 250 empresas ao todo).
C=
∑ A + ∑ B ⇒ C = 50.000 + 400.000 = 1.800
250
250
A média de venda dos dois setores juntos é de R$ 1.800,00.
A variância de A é igual a 10.000 (=100 ao quadrado). Isso significa que:
5
www.pontodosconcursos.com.br
CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES
∑ ( A − 1.000)
10.000 =
50
2
⇒ ∑ ( A − 1.000 ) = 500.000
2
Para o setor B, as contas são análogas.
∑ (B − 2.000)
40.000 =
200
2
⇒ ∑ (B − 2.000 ) = 8.000.000
2
E como fazemos para achar a variância de C? Precisamos pegar cada valor de venda
diária, de cada uma das 250 empresas, e calcular o desvio em relação a 1.800. Depois
disso, elevamos o desvio ao quadrado e dividimos por 250, achando a média dos
quadrados dos desvios, que é a variância.
50
σC2 =
σC2 =
∑(A
i =1
i
200
− 1.800) 2 + ∑ ( Bi − 1.800) 2
i =1
250
200
1 ⎛ 50
⎞
× ⎜ ∑ ( Ai − 1.800) 2 + ∑ ( Bi − 1.800) 2 ⎟
250 ⎝ i =1
i =1
⎠
E aqui é que está o grande problema. O que nós sabemos é o valor da soma dos
quadrados dos desvios das vendas diárias do setor A, quando os desvios são calculados
em relação a 1.000,00. Ou seja, nós sabemos que:
∑ ( A − 1.000)
2
= 500.000
Só que agora nós não precisamos disso. O que nós queremos agora é a soma dos
quadrados dos desvios calculados em relação a 1.800,00, que é a média geral. E isso nós
não temos. Para o setor B, o problema é análogo. Assim, vamos ter que fazer algumas
modificações na equação acima. Justamente para tentar aproveitar as informações que já
temos.
σC2 =
σC2 =
200
1 ⎛ 50
⎞
× ⎜ ∑ ( Ai − 1.800) 2 + ∑ ( Bi − 1.800) 2 ⎟
250 ⎝ i =1
i =1
⎠
200
1 ⎛ 50
⎞
× ⎜ ∑ ( Ai − 1.000 − 800) 2 + ∑ ( Bi − 2.000 + 200) 2 ⎟
250 ⎝ i =1
i =1
⎠
Observem como nós “forçamos a barra”, fazendo com que aparecessem os termos que
já conhecemos.
Desenvolvendo os termos ao quadrado:
σC2 =
[
]
1 ⎛ 50
2
× ⎜ ∑ ( Ai − 1.000) − 2 × ( Ai − 1.000) × 800 + 800 2 +
250 ⎝ i =1
[
]
200
⎞
+ ∑ ( Bi − 2.000) 2 − 2 × ( Bi − 2.000) × 200 + 200 2 ⎟
i =1
⎠
E aqui começa a manipulação do somatório. Separamos o somatório da soma em soma
de somatórios:
6
www.pontodosconcursos.com.br
CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES
σC2 =
50
1 ⎛ 50
2
× ⎜ ∑ ( Ai − 1.000) − 2 × 800 × ∑ ( Ai − 1.000) + 50 × 800 2 +
250 ⎝ i =1
i =1
200
200
⎞
+ ∑ ( Bi − 2000) 2 − 2 × 200 × ∑ ( Bi − 2.000) + 200 × 200 2 ⎟
i =1
i =1
⎠
E aqui lembramos da propriedade da média. A soma dos desvios em relação à média é
sempre igual a zero.
σC2 =
1
× (50 × 10.000 − 2 × 800 × 0 + 50 × 800 2 +
250
+ 200 × 40.000 − 2 × 200 × 0 + 200 × 200 2
)
Logo:
σC2 =
1
× (50 × 10.000 + 50 × 800 2 + 200 × 40.000 + 200 × 200 2 )
250
σC2 =
1
× (500.000 + 32.000.000 + 8.000.000+ 8.000.000)
250
Vamos multiplicar e dividir a fração por 4. Assim, no denominador vai surgir o número
1.000, o que facilita a divisão.
σC2 =
4
× (500.000 + 32.000.000 + 8.000.000+ 8.000.000)
1.000
σ C 2 = 4 × (500 + 32.000 + 8.000+ 8.000)
σ C 2 = 4 × 48.500 = 194.000
Resposta: C.
Em resumo, temos:
A variância da união de A e B pode ser calculada pela média ponderada das variâncias
individuais, desde que:
·
as médias de A e B sejam iguais;
·
A e B não tenham elementos em comum.
A média ponderada não pode ser calculada para os desvios-padrão.
Por fim, caso as médias de A e B não sejam iguais, o cálculo da variância da união
exige a manipulação do somatório.
Abraços!
Vítor
7
www.pontodosconcursos.com.br
Download

X - Ponto dos Concursos