CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES Recebi alguns e-mails questionando uma das questões de estatística do simulado. Segue a questão: Em uma empresa há 25 homens e 75 mulheres. Os homens recebem, em média, um salário de R$ 2.751,00. O salário médio das mulheres é, também, de R$ 2.751,00. O conjunto formado pelos salários dos homens apresenta desvio padrão igual a R$ 3,60. O conjunto formado pelos salários das mulheres, por sua vez, tem desvio padrão de R$ 2,00. Assinale a alternativa que contém o valor que mais se aproxima do desvio padrão do conjunto formado pelos salários de todos os funcionários da empresa. a) 5,6 b) 2,4 c) 2,5 d) 2,8 e) 3,0 Nesse tipo de problema, o principal erro do candidato é fazer uma média ponderada com os valores de desvio-padrão. Isso não pode. A média ponderada que devemos fazer é com os valores das variâncias. Em geral, a gente só grava isso: faça a média ponderada. Abaixo vou mostrar de onde vem a média ponderada, e aí vai ficar fácil entender porque é que ela só vale quando for feita para a variância. No presente caso, sabemos que o desvio-padrão dos salários dos homens é R$ 3,60. Logo, a variância é 12,96. Portanto: 25 σH2 = ∑ (H i =1 i − H )2 25 Onde Hi representa os salários dos homens. Assim: 25 12,96 = ∑ (H i =1 − 2.751) 2 i 25 25 12,96 × 25 = ∑ ( H i − 2.751) 2 i =1 Para as mulheres, temos que a variância é igual a 4. Logo: 75 σM2 = ∑ (M i =1 i − M )2 75 1 www.pontodosconcursos.com.br CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES 75 4= ∑ (M i =1 i − 2.751) 2 75 75 4 × 75 = ∑ ( M i − 2.751) 2 i =1 Para calcular a variância de todos os funcionários, temos que calcular a soma dos quadrados de todos os desvios. Como a média feminina é igual à média masculina, então a média geral será, também, igual a 2.751. Portanto, no cálculo da variância conjunta, os desvios são calculados em relação a R$ 2.751,00. Fica assim: 25 σ2 = 75 ∑ ( H i − 2.751) 2 + ∑ (M i − 2.751) 2 i =1 i =1 100 σ2 = 25 × 12,96 + 75 × 4 100 E aí é que aparece a tal média ponderada. Fazendo os cálculos, achamos: σ 2 = 6,24 ⇒ σ ≅ 2,5 E a resposta foi letra C. E porque é que a média ponderada não vale para o desvio-padrão? É que, tanto na variância quanto no desvio-padrão, temos um somatório. Temos uma soma de desvios ao quadrado. No desvio-padrão, depois de calculada a soma, tiramos a raiz quadrada. É aí que está o detalhe. Acontece que a raiz quadrada da soma não é igual à soma das raízes. Um exemplo: 9 + 16 = 25 = 5 Pronto. Calculamos a raiz quadrada da soma. Ela foi igual a 5. Façamos agora outro cálculo: 9 + 16 = 3 + 4 = 7 Notem como a raiz quadrada da soma (=5) foi diferente da soma das raízes (=7). É por isso que a média ponderada só vale para a variância. A tentativa de “forçar” uma média ponderada com os desvios-padrão não dá certo por esse motivo. É como se fizéssemos algo parecido com: 25 σ2 = σ= 75 ∑ ( H i − 2.751) 2 + ∑ (M i − 2.751) 2 i =1 i =1 100 25 75 i =1 i =1 ∑ ( H i − 2.751) 2 + ∑ (M i − 2.751) 2 100 2 www.pontodosconcursos.com.br CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES 25 σ= ∑ ( H i − 2.751) 2 + i =1 75 ∑ (M i =1 i − 2.751) 2 10 O que é falso, pois, como vimos, a raiz da soma não é igual à soma das raízes. Aproveitando a oportunidade, vejamos um exercício de concurso sobre isso: Auditor Fiscal ICMS/BA – 2004 [FCC] Sabe-se que a altura média dos 5.000 habitantes de uma cidade X é igual à altura média de uma outra cidade Y com 10.000 habitantes, ou seja, igual a 1,70m. O desvio-padrão correspondente encontrado para a população da cidade X é 2 cm e para a população da cidade Y é 5 cm. Então, a variância das alturas da população das duas cidades reunidas é: a) 12,25 cm2 b) 16,00 cm2 c) 18,00 cm2 d) 24,50 cm2 e) 29,00 cm2 Resolução: O exercício deu o desvio padrão da cidade X. Para achar a variância, basta elevar ao quadrado. A variância da cidade X é igual a 4 cm2 (=2 ao quadrado). E como se chega na variância? Basta fazer a média dos desvios ao quadrado (média esta calculada em relação a 1,70, que é a altura média da cidade). Ou seja: σX2 = 4= 1 2 × ∑ ( X − 1,70) 5.000 1 2 × ∑ ( X − 1,70) 5.000 Multiplicando cruzado: ∑ ( X − 1,70) 2 = 4 × 5.000 A variância das alturas na cidade Y é igual a 25 cm2. Basta elevar o desvio padrão fornecido ao quadrado. Como é obtida esta variância? Esta variância é igual à média dos desvios ao quadrado (desvios esses calculados em relação a 1,70m, que é a altura média na cidade). σY 2 = 1 2 × ∑ (Y − 1,70) 10.000 3 www.pontodosconcursos.com.br CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES 25 = 1 2 × ∑ ( X − 1,70) 10.000 Multiplicando cruzado: ∑ ( X − 1,70) 2 = 25 × 10.000 Pois bem. Agora juntamos as pessoas das duas cidades. A altura média continua sendo de 1,70 (já que as duas cidades tinham médias iguais). E a variância? Fica em quanto? Para achar a variância, vamos somar todos os quadrados dos desvios (desvios estes calculados em relação a 1,70). Depois disso, dividimos o resultado por 15.000 (pois essa nova população tem 15.000 habitantes, resultado da soma dos habitantes de X e Y). Com esse procedimento, obtemos justamente a variância da nova população. σ2 = 1 × 15.000 (∑ ( X − 1,70) + ∑ (Y − 1,70) ) 2 2 Substituindo os valores dos somatórios: σ2 = 1 × (4 × 5.000 + 25 × 10.000) 15.000 σ2 = 1 × 270.000 = 18 15.000 A nova variância é de 18 cm2. Resposta: C Notem bem na fórmula a que chegamos: σ2 = 1 × (4 × 5.000 + 25 × 10.000) 15.000 Na fórmula acima temos as variâncias das duas cidades, multiplicadas pelos números de habitantes. peso da variância da cidade X: número de habitantes da cidade σ2 = peso da variância da cidade Y: número de habitantes da cidade 1 × (4 × 5 .000 + 25 × 10 .000 ) 15 .000 variância da cidade X variância da cidade Y A variância das duas cidades reunidas é uma média ponderada das variâncias de cada cidade. E os pesos de ponderação são os números de habitantes (ou número de elementos de cada conjunto). 4 www.pontodosconcursos.com.br CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES Não são raras as questões que pedem a variância da população resultante da união de dois conjuntos. Nesse caso específico, em que as médias das cidades X e Y são iguais, até que não deu tanto trabalho. Quando as médias são diferentes, encontrar a variância da união dos dois conjuntos já fica um pouco mais trabalhoso. Isto porque, quando as médias são diferentes, não basta simplesmente aplicar a média ponderada. Vejamos um exemplo. Analista BACEN/2006 – Área 3 [FCC] A média aritmética dos valores das vendas diárias realizadas pelas 50 empresas do Setor A é de R$ 1.000,00, com desvio padrão de R$ 100,00. Sabe-se ainda que a média aritmética dos valores das vendas diárias realizadas pelas 200 empresas do Setor B é de R$ 2.000,00, com desvio padrão de R$ 200,00. A variância, em R$2, dos valores das vendas diárias realizadas pelos dois setores reunidos é: a) 34.000 b) 50.000 c) 194.000 d) 207.500 e) 288.000 Resolução: Vamos chamar de A o conjunto das vendas do setor A, de B o conjunto das vendas do setor B e de C a união de A e B. A média de A é dada pela soma de todas as vendas do setor A, dividida por 50 (pois são 50 empresas no setor A). A= ∑A ⇒ 50 ∑ A = 50 × A ⇒ ∑ A = 50 × 1.000 = 50.000 A média de B é dada pela soma de todas as vendas do setor B, dividida por 200. B= ∑B ⇒ 200 ∑ B = 200 × B ⇒ ∑ B = 200 × 2.000 = 400.000 Como fica a média do conjunto C, formado pelas vendas dos dois setores? Para achar a média de C, somamos todas as vendas, tanto do setor A, quanto do B, e dividimos por 250 (são 250 empresas ao todo). C= ∑ A + ∑ B ⇒ C = 50.000 + 400.000 = 1.800 250 250 A média de venda dos dois setores juntos é de R$ 1.800,00. A variância de A é igual a 10.000 (=100 ao quadrado). Isso significa que: 5 www.pontodosconcursos.com.br CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES ∑ ( A − 1.000) 10.000 = 50 2 ⇒ ∑ ( A − 1.000 ) = 500.000 2 Para o setor B, as contas são análogas. ∑ (B − 2.000) 40.000 = 200 2 ⇒ ∑ (B − 2.000 ) = 8.000.000 2 E como fazemos para achar a variância de C? Precisamos pegar cada valor de venda diária, de cada uma das 250 empresas, e calcular o desvio em relação a 1.800. Depois disso, elevamos o desvio ao quadrado e dividimos por 250, achando a média dos quadrados dos desvios, que é a variância. 50 σC2 = σC2 = ∑(A i =1 i 200 − 1.800) 2 + ∑ ( Bi − 1.800) 2 i =1 250 200 1 ⎛ 50 ⎞ × ⎜ ∑ ( Ai − 1.800) 2 + ∑ ( Bi − 1.800) 2 ⎟ 250 ⎝ i =1 i =1 ⎠ E aqui é que está o grande problema. O que nós sabemos é o valor da soma dos quadrados dos desvios das vendas diárias do setor A, quando os desvios são calculados em relação a 1.000,00. Ou seja, nós sabemos que: ∑ ( A − 1.000) 2 = 500.000 Só que agora nós não precisamos disso. O que nós queremos agora é a soma dos quadrados dos desvios calculados em relação a 1.800,00, que é a média geral. E isso nós não temos. Para o setor B, o problema é análogo. Assim, vamos ter que fazer algumas modificações na equação acima. Justamente para tentar aproveitar as informações que já temos. σC2 = σC2 = 200 1 ⎛ 50 ⎞ × ⎜ ∑ ( Ai − 1.800) 2 + ∑ ( Bi − 1.800) 2 ⎟ 250 ⎝ i =1 i =1 ⎠ 200 1 ⎛ 50 ⎞ × ⎜ ∑ ( Ai − 1.000 − 800) 2 + ∑ ( Bi − 2.000 + 200) 2 ⎟ 250 ⎝ i =1 i =1 ⎠ Observem como nós “forçamos a barra”, fazendo com que aparecessem os termos que já conhecemos. Desenvolvendo os termos ao quadrado: σC2 = [ ] 1 ⎛ 50 2 × ⎜ ∑ ( Ai − 1.000) − 2 × ( Ai − 1.000) × 800 + 800 2 + 250 ⎝ i =1 [ ] 200 ⎞ + ∑ ( Bi − 2.000) 2 − 2 × ( Bi − 2.000) × 200 + 200 2 ⎟ i =1 ⎠ E aqui começa a manipulação do somatório. Separamos o somatório da soma em soma de somatórios: 6 www.pontodosconcursos.com.br CURSO ON-LINE – PROFESSOR: VÍTOR MENEZES σC2 = 50 1 ⎛ 50 2 × ⎜ ∑ ( Ai − 1.000) − 2 × 800 × ∑ ( Ai − 1.000) + 50 × 800 2 + 250 ⎝ i =1 i =1 200 200 ⎞ + ∑ ( Bi − 2000) 2 − 2 × 200 × ∑ ( Bi − 2.000) + 200 × 200 2 ⎟ i =1 i =1 ⎠ E aqui lembramos da propriedade da média. A soma dos desvios em relação à média é sempre igual a zero. σC2 = 1 × (50 × 10.000 − 2 × 800 × 0 + 50 × 800 2 + 250 + 200 × 40.000 − 2 × 200 × 0 + 200 × 200 2 ) Logo: σC2 = 1 × (50 × 10.000 + 50 × 800 2 + 200 × 40.000 + 200 × 200 2 ) 250 σC2 = 1 × (500.000 + 32.000.000 + 8.000.000+ 8.000.000) 250 Vamos multiplicar e dividir a fração por 4. Assim, no denominador vai surgir o número 1.000, o que facilita a divisão. σC2 = 4 × (500.000 + 32.000.000 + 8.000.000+ 8.000.000) 1.000 σ C 2 = 4 × (500 + 32.000 + 8.000+ 8.000) σ C 2 = 4 × 48.500 = 194.000 Resposta: C. Em resumo, temos: A variância da união de A e B pode ser calculada pela média ponderada das variâncias individuais, desde que: · as médias de A e B sejam iguais; · A e B não tenham elementos em comum. A média ponderada não pode ser calculada para os desvios-padrão. Por fim, caso as médias de A e B não sejam iguais, o cálculo da variância da união exige a manipulação do somatório. Abraços! Vítor 7 www.pontodosconcursos.com.br