CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
NOÇÕES DE
ESTATÍSTICA
PARA O ENEM
MEDIDAS DE DISPERSÃO
(AMPLITUDE– DESVIO MÉDIO – VARIÂNCIA – DESVIO PADRÃO)
PROFESSOR MARCELO RENATO M. BAPTISTA
AGOSTO/2012
CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
ESTATÍSTICA PARA O ENEM
Medidas de Dispersão
Professor Marcelo Renato M Baptista
Introdução: MEDIDAS DE DISPERSÃO (Variabilidade)
Vimos que média, mediana e moda são valores que podem servir de comparação, mas, fundamentalmente,
fornecem a posição de qualquer elemento do conjunto. Mas para interpretar dados estatísticos, mesmo aqueles já
convenientemente simplificados, é preciso conhecer a evolução desses dados. Um exemplo clássico para a
compreensão da importância das medidas de dispersão (ou de variabilidade) é o da comparação de temperaturas
entre cidades: saber que a temperatura média de duas cidades é de 24ºC não nos diz muita coisa a respeito da
variação dessas temperaturas.
Em uma cidade, o dia pode ter iniciado muito frio e terminado muito quente; aqui, ocorreu uma grande variação da
temperatura. Na outra cidade, o dia pode ter iniciado e terminado como 24º C; nesse caso, não haveria variação
alguma de temperatura. Embora as médias sejam importantes, elas não são suficientes para as inferências
estatísticas, por isso, precisamos de outras medidas.
Vamos reforçar a importância das medidas de dispersão, por meio de um exemplo. Consideraremos os três
conjuntos abaixo, com seus respectivos valores:
Vamos calcular a média aritmética para cada um dos três conjuntos:
Conjunto
X
Valores
70, 70, 70, 70, 70
Y
68, 69, 70, 71, 72
Z
5, 15, 50, 120, 160
70  70  70  70  70
 x1  70
5
68  69  70  71 72
 x 2  70
Para Y: x 2 
5
5  15  50  120  160
 x 3  70
Para Z: x 3 
5
Para X: x1 
Como podemos observar os três conjuntos possuem as mesmas médias aritméticas: 70.
Mas também, podemos notar que o conjunto X é mais homogêneo do que os conjuntos Y e Z; o conjunto Y, por
sua vez, é mais homogêneo que o conjunto Z; por fim, o conjunto Z é o mais heterogêneo de todos. Viu? Mesmo
possuindo a mesma média, os conjuntos apresentam comportamentos muito diferentes. A isso chamamos de
dispersão.
Dispersão (ou variabilidade) de um conjunto refere-se à maior ou menor diversificação dos valores de uma variável
em torno de um valor de tendência central tomado como ponto de comparação.
No exemplo acima, os conjuntos X, Y e Z apresentam como ponto de tendência central para fins de comparação à
média. Essa média é a mesma para os três conjuntos: 70. Assim, o conjunto X apresenta dispersão nula, pois não
há variação dos valores do conjunto em relação a essa média; o conjunto Y apresenta dispersão menor que o
conjunto Z; isso porque os valores de Y estão mais próximos que os do conjunto Z.
Em resumo, a estatística recorre às medidas de dispersão (ou de variabilidade) quando deseja qualificar os
valores de uma variável, ressaltando a maior ou menor dispersão entre esses valores e a sua medida de posição.
As principais medidas de dispersão que estudaremos (COMO BASE PARA O ENEM) são: Amplitude Total, Desvio
Médio, Variância e Desvio Padrão.
1. AMPLITUDE TOTAL
A amplitude total (At), ou amplitude absoluta, é a diferença entre o maior e o menor valor da sequência.
1.1. Dados brutos ou rol
Para o cálculo da amplitude total de um rol basta identificar o maior e o menor valor da sequência e efetuar a
diferença entre estes valores.
Exemplo: Determinar a amplitude total da sequência X: 11, 12, 9, 10, 10, 15.
O maior valor desta sequência é 15 e o menor valor é 9. Portanto At =15 −9 = 6 unidades.
–1–
CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
1.2. Dados agrupados em frequência simples
Como os valores já se apresentam ordenados, a amplitude total é a diferença entre o último e o primeiro elemento
da série.
Exemplo: Determinar a amplitude total da série.
xi
2
3
5
7
Total
fi
1
6
10
3
20
At = 7 − 2 = 5 unidades
1.3. Dados agrupados em classes
Nesta situação, por desconhecer o maior e o menor valor da série, devemos
fazer um cálculo aproximado da amplitude total da série.
Consideraremos como maior valor da série o ponto médio da última classe
e como menor valor da série o ponto médio da primeira classe. A amplitude
total é a diferença entre estes valores.
Exemplo: Determinar a amplitude total da série apresentada na figura ao
lado.
At = 11− 3 = 8 unidades
Nota: Apesar da facilidade de obtenção da amplitude total, esta medida apresenta a inconveniência de depender
apenas de dois valores da série. É possível modificar completamente a dispersão ou a concentração dos
elementos em torno da média, sem alterar a amplitude total da série. É uma medida que tem pouca sensibilidade
estatística. Portanto, a amplitude total não é considerada uma boa medida de dispersão, pois só leva em
consideração os extremos do intervalo, não sendo sensível a todo conjunto de dados.
2. DESVIO MÉDIO (DM)
O conceito estatístico de desvio corresponde ao conceito matemático de distância (módulo).
A dispersão dos dados em relação à média de uma sequência pode ser avaliada através dos desvios de cada
elemento da sequência em relação a média da sequência.
O desvio médio (também conhecido como desvio médio simples ou ainda desvio médio absoluto) é definido como
sendo a média aritmética dos desvios de cada elemento da série em relação à média da série.
2.1. Dados brutos ou rol
Calculamos inicialmente a média da sequência. Em seguida identificamos a distância (afastamento tomado em
módulo) de cada elemento da sequência para sua média. Finalmente, calculamos a média dessas distâncias.
Se a sequência for representada por X : x1, x2, ... , xn , então o DM admite como fórmula de cálculo:
DM 
 | xi  x |
n
Exemplo: Calcular o desvio médio da sequência X: 2, 8, 5, 6.
1º passo: Calcular a média aritmética( x ) dos elementos do conjunto X;
2856
x
 x  5,25
4
2º passo: Determinar as distâncias de cada elemento da série em relação à média da série:
| x1  x |  | 2  5,25 |  3,25
| x 2  x |  | 8  5,25 |  2,75
| x 3  x |  | 5  5,25 |  0,25
| x 4  x |  | 6  5,25 |  0,75
O DM é a média aritmética simples destes valores: DM 
3,25  2,75  0,25  0,75
 x  1,75
4
Ou seja, em média, cada elemento da sequência está afastado do valor 5,25 de 1,75 unidades.
–2–
CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
2.2. Dados agrupados em frequência simples
No caso da apresentação de uma variável discreta, lembramos que a frequência simples de cada elemento
representa o número de vezes que este valor figura na série. Consequentemente, haverá repetições de distâncias
iguais de cada elemento distinto da série para a média da série. Assim, a média indicada para estas distâncias é
uma média aritmética ponderada. A fórmula para o cálculo do DM é:
DM 
 | xi  x | f i
fi
Exemplo: Determinar o DM para a série apresentada na tabela abaixo:
1º passo: Calcular a média aritmética( x ) dos elementos do conjunto X;
x
 xi  f i  30  3
 f i 10
2º passo:
Calcular o DM através da fórmula DM 
DM 
 | xi  x |  f i
fi
 | xi  x |  f i  8  0,8 unidades
10
fi
Ou seja, em média, cada elemento da série está afastado do valor 3 por 0,8 unidades.
2.3. Dados agrupados em classes
Nesta situação, por desconhecer os valores individuais dos elementos componentes da série, substituiremos
esses valores pelos pontos médios das classes. Desta forma, o desvio médio simples tem por cálculo a mesma
| xi  x |  f i
fórmula utilizada no tópico anterior: DM 
;
fi


Exemplo: Determinar o DM para a série apresentada na tabela abaixo:
A tabela acima já está toda completa com os dados que necessitamos para calcular o DM . Porém, os seguintes
passos foram seguidos:
1 – cálculo dos pontos médios x i ;
2 – cálculo de x i  f i para obtermos a média que é: x 
 xi  f i  102  5,1
 f i 20
3 – para obter o DM acrescentamos a última coluna que apresenta | x i  x |  f i . Assim o DM é:
DM 
 | xi  x |  f i  23  1,15 unidades
20
fi
Ou seja, em média, cada elemento da série está afastado do valor 5,1 de 1,15 unidades.
Nota: O desvio médio depende de cada componente da série. Se mudarmos o valor de um único elemento da
série, mudamos também o DM. Portanto, o desvio médio tem perfeita sensibilidade estatística.
–3–
CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
3. VARIÂNCIA ( 2 ou Var )
A variância é também uma medida que capta a variabilidade de um conjunto de dados, e é definida como a soma
dos quadrados dos desvios divididos pelo número de observações.
Quando os dados estão associados a alguma unidade de medida o valor da variância será na unidade de medida
ao quadrado. No caso do consumo de água de uma residência, se os dados estão em litros à variância estará em
litros ao quadrado, o que em muitos casos dificulta a interpretação.
Quando a variância for utilizada apenas para descrever a variação de um conjunto de dados, esta será calculada
utilizando o número de observações (n) como denominador e será denotada da seguinte forma:

2
(
 Var 
xi  x ) 2
n
Exemplo: (UP 2012) O departamento de reprografia do UP possui cinco máquinas copiadoras, as quais tiveram
registrados os seus números de cópias produzidas no último mês (em milhares de unidades): 20, 23,
25, 27 e 30 cópias, respectivamente. Calcule o valor da variância para esta série de dados.
Resolução:
1º passo: Calcular a média aritmética( x ) para o conjunto de dados: x 
20  23  25  27  30
 x  25;
5
2º passo: Calcular a variância:
( 20  25 )2 ( 23  25 )2 ( 25  25 )2 ( 27  25 )2 ( 30  25 )2
2  Var 
5
( 25 ) ( 4 ) ( 0 ) ( 4 ) ( 25 )
2
  Var 
5
58
2
  Var 
 Var  11,6
5
ATENÇÃO: Se o objetivo for descrever a variação dos dados de uma AMOSTRA que será utilizada para inferir
(tirar uma conclusão a partir de um fato) sobre uma POPULAÇÃO, então a VARIÂNCIA, apenas esta, deverá ser
calculada com denominador (n – 1), ou seja:

2
(
 Var 
xi  x ) 2
n 1
Exemplo: (AFC adaptada) Entre os funcionários de um órgão do governo, foi retirada uma amostra de dez
indivíduos. Os números que representam as ausências ao trabalho registradas para cada um deles, no
último ano, são: 0, 0, 0, 2, 2, 2, 4, 4, 6 e 10. Sendo assim, o valor da VARIÂNCIA desta amostra é:
Resolução: Observemos que o enunciado falou, expressamente, que os dados apresentados fazem parte de uma
amostra.
1º passo: cálculo da média das faltas dos funcionários;
x
 xi  f i  0 ( 3 )  2 ( 3 )  4 (
10
fi
2 )  6  10
3
2
2º passo: cálculo da variância para a AMOSTRA .....   Var 
Var 
(
xi  x ) 2
n 1
( 0  3 ) 2 ( 3 ) ( 2  3 ) 2 ( 3 ) ( 4  3 ) 2 ( 2 ) ( 6  3 ) 2 ( 10  3 ) 2
10  1
( 9 )( 3 ) ( 1 )( 3 ) ( 1 )( 2 ) ( 9 ) ( 49 )
10  1
 atenção!
90
Var 
 Var  10
9
Var 
–4–
CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
4. DESVIO PADRÃO (   Var )
No cálculo da variância, quando elevamos ao quadrado a diferença ( x i  x ) , a unidade de medida da série fica
também elevada ao quadrado. Portanto, a variância é dada sempre no quadrado da unidade de medida da série.
Se os dados são expressos em metros, a variância é expressa em metros quadrados.
Em algumas situações a unidade de medida da variância nem faz sentido. É o caso, por exemplo, em que os
dados são expressos em litros. A variância será expressa em litros quadrados. Portanto, o valor da variância não
pode ser comparado diretamente com os dados da série, ou seja, a variância não tem interpretação.
Exatamente para suprir esta deficiência da variância é que se define o desvio padrão. Como o desvio padrão é a
raiz quadrada da variância, o desvio padrão terá sempre a mesma unidade de medida da série e portando admite
interpretação.
Exemplo: Determine o Desvio Padrão do conjunto apresentado na tabela abaixo:
Resolução:
xi
1
2
3
4
5
1º passo: cálculo da média dos dados;
x i  f i 1( 2 )  2 ( 3 )  3 ( 3 )  4 ( 2 )  5 ( 1 ) 30
x


3
10
10
fi


fi
2
3
3
2
1
n=10
2º passo: cálculo da variância;
( 1  3 )2 ( 2 ) ( 2  3 )2 ( 3 ) ( 3  3 )2 ( 3 ) ( 4  3 )2 ( 2 ) ( 5  3 )2 ( 1 )
2  Var 
10
( 8 ) ( 3 ) ( 0 ) ( 2 ) ( 4 )
2
  Var 
10
17
2  Var 
 Var  1,7
10
3º passo: cálculo do desvio padrão;
  Var    1,7 
  1,3
Nota: O desvio padrão é a medida da variação, da dispersão, de um conjunto. Assim, Assim, quanto maior for o
desvio padrão, maior será a heterogeneidade entre os valores que estão sendo analisados. Isso significa,
portanto, que quanto maior for o desvio padrão, maior será a variação entre os valores.. Vamos entender
melhor isso.
EXERCÍCIOS – DESVIO MÉDIO – VARIÂNCIA – DESVIO PADRÃO
1) (Consulplan 2008) Em um supermercado, a reposição de pacotes de arroz nesta segunda-feira, permitiu a
construção da seguinte tabela de dados:
Qual das alternativas representa o desvio médio?
a) 60
b) 64
c) 68
d) 72
e) 76
2) (UP 2012) Na distribuição de frequências abaixo, o valor do desvio médio
é:
a) 12
b) 13
c) 14
d) 15
e) 16
–5–
Classes
Frequência
90
110
2
110
130
1
130
150
2
CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
3) (ENEM 2010) Marco e Paulo foram classificados em um concurso. Para classificação no concurso o candidato
deveria obter média aritmética na pontuação igual ou superior a 14. Em caso de empate na média, o
desempate seria em favor da pontuação mais regular. No quadro a seguir são apresentados os pontos obtidos
nas provas de Matemática, Português e Conhecimentos Gerais, a média, a mediana e o desvio padrão dos
dois candidatos.
Matemática
Português
Conhecimentos Gerais
Média
Mediana
Desvio Padrão
Marco
14
15
16
15
15
0,32
Paulo
8
19
18
15
18
4,97
O candidato com pontuação mais regular, portanto mais bem classificado no concurso, é
a) Marco, pois a média e a mediana são iguais.
b) Marco, pois obteve menor desvio padrão.
c) Paulo, pois obteve a maior pontuação da tabela, 19 em Português.
d) Paulo, pois obteve maior mediana.
e) Paulo, pois obteve maior desvio padrão.
4) (UFCG–PB 2005) Em uma cooperativa está havendo campanha para a eleição de uma nova diretoria e há dois
candidatos, A e B. A cooperativa tem 5 tipos de associados e, em uma pesquisa prévia, o candidato B teve
uma média de votos igual a 14 e desvio médio igual a 3, e o candidato A obteve a seguinte distribuição de
votos:
Tipo de Cooperado
Candidato A
I
7
II
12
III
20
IV
16
V
10
Denotando por dA o desvio médio do candidato A, podemos concluir que:
a) dA = dB e não podemos afirmar quem é o mais regular usando o desvio médio.
b) dA = 4 e A é o candidato mais regular.
c) dA = 2 e B é o candidato mais regular.
d) dA = 2 e A é o candidato mais regular.
e) dA = 4 e B é o candidato mais regular.
5) (UFCG–PB 2007 adaptada) Em uma determinada região, no período de um ano, um agrônomo esteve
monitorando o uso de um determinado agrotóxico em 20 propriedades rurais, para estudar os seus efeitos nas
lavouras; obteve o quadro abaixo mostrando quantas vezes as propriedades aplicaram tal agrotóxico:
Usando
uma
distribuição
de
frequência
Número de
Número de
representada no quadro acima, o desvio médio do
número de aplicações por propriedade é igual a:
aplicações por
propriedades (Fi)
propriedade (xi)
0
1
2
a) 0,50
b) 0,54
c) 0,56
d) 0,58
e) 0,60
3
10
7
6) (FCC-AF-ICMS-BA 2004) Sabe-se que o valor de uma determinada variável Q é obtida pela expressão definida
( 2i  3 )
; sendo i um número inteiro positivo. Se i assumir os valores 1, 2, 3, 4 e 5, então, o desvio médio
por Q 
2
dessa variável é:
a) 1,8
b) 1,2
c) 0,9
d) 0,75
e) 0,5
7) (FGV-SP) Um conjunto de dados numéricos tem variância igual a zero. Podemos concluir que:
a) a média também vale zero.
b) a mediana também vale zero.
c) a moda também vale zero.
d) o desvio padrão também vale zero.
e) todos os valores desse conjunto são iguais a zero.
–6–
CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
8) (UFPEL adaptada) Em um concurso, as notas finais dos candidatos encontram-se na tabela abaixo:
Com base na tabela apresentada, é CORRETO afirmar que a variância das notas finais dos candidatos foi de:
a) 0,75.
Número de Nota Final
b) 0,65.
candidatos
c) 0,65
7
8,0
2
7,0
d) 0,85
1
9,0
e) 0,85.
9) (UP 2012) Para preencher uma única vaga de professor existente na Escola E, foi realizado um concurso onde
participaram 18 candidatos. Estes foram submetidos a uma entrevista, uma prova sobre conhecimentos
específicos na área de interesse e uma prova didática, e foram avaliados por uma banca constituída de duas
pessoas, de modo que cada candidato recebeu seis notas (duas em cada forma de avaliação). Três deles
destacaram-se com as notas descritas na tabela dada a seguir.
Como todas as formas de avaliação tinham o mesmo peso, o critério inicial para a escolha do candidato foi a
média aritmética simples das seis notas de cada um. Em caso de empate no primeiro quesito, seria escolhido o
candidato que apresentasse notas mais homogêneas, ou seja, com menor variação. Qual dos candidatos foi o
escolhido e qual a sua média aritmética das seis notas?
a) O candidato A cuja média das seis notas foi 7,9.
b) O candidato B cuja média das seis notas foi 7,9.
c) O candidato A cuja média das seis notas foi 8,0.
d) O candidato C cuja média das seis notas foi 8,0.
e) O candidato B cuja média das seis notas foi 8,0.
A
Distribuição das notas
Prova
Entrevista
escrita
1ª
2ª
1ª
2ª
nota nota nota nota
8,0
8,0
6,5
7,5
Prova
didática
1ª
2ª
nota nota
8,5
9,0
B
8,0
8,0
6,0
7,0
9,0
10,0
C
8,0
8,0
7,5
8,0
8,0
8,5
Candidato
10) (UFCG–PB 2006) O histograma de frequências abaixo mostra as vendas
de um determinado produto ao longo de 20 meses em uma loja A.
Após um estudo sobre as vendas desse produto, no mesmo período, em duas
outras lojas B e C, observou-se que a variância na loja B é 9 e o desvio
padrão na loja C é 4. Pode-se concluir que a (o):
a) variância na loja A é 15.
b) produto tem uma venda mais regular na loja B.
c) quantidade de vendas do produto na loja A ao longo do período analisado
foi de 18 unidades.
d) desvio padrão na loja B é 81.
e) produto tem uma venda mais regular na loja C.
11) (UFCG–PB 2008) Certo professor de Estatística aplicou a mesma prova nas Turmas I e II. Após corrigir essas
provas, o professor calculou a média e o desvio-padrão das notas de cada uma das turmas. O resultado desses
dados para a Turma I e para a Turma II estão na tabela abaixo:
Com essas informações, pode-se afirmar que:
a) As notas das duas turmas apresentam a mesma dispersão.
b) A turma com notas mais heterogêneas é a Turma II.
c) O desempenho dos alunos nas duas turmas foi o mesmo.
d) As notas da Turma II são mais homogêneas que as da Turma I.
e) A variância da Turma I é maior do que a variância da Turma II.
TURMA
MÉDIA
DESVIO PADRÃO
(em relação à média)
I
7,8
1,2
II
8,1
2,0
12) (UP 2012) Qual o valor da média e da variância, respectivamente, em relação ao nº de acidentes por dia em
certa rodovia, conforme dados apresentados na tabela abaixo:
a) 2,5 e 2,9.
b) 2 e 2,5.
c) 3 e 2.
d) 2 e 2,9
e) 3,5 e 1,5.
Nº de Acidentes
0
1
2
3
4
5
Nº de Dias
5
4
4
3
1
3
–7–
CENTRO EDUCACIONAL UNIÃO DOS PROFESSORES
13) (FGV adaptada) Dois atiradores x e y obtiveram, numa série de 20 tiros
num alvo da forma indicada na figura, os seguintes resultados:
Sobre os dados apresentados, assinale a alernativa verdadeira:
a) A média de pontos do atirador x foi maior que a do atirador y.
b) O atirador x é mais regular que o atirador y, pois apesar de ter a mesma média do atirador y, apresentou o
menor desvio padrão.
c) O atirador y é mais regular que o atirador x, pois apesar de ter a mesma média do atirador x, apresentou o
maior desvio padrão.
d) O atirador x apresentou a menor variância que o atirador y, sendo assim o que apresentou menor regularidade.
e) Os atiradores x e y, por apresentarem a mesma média de pontos, apresentam a mesma regularidade.
14) (UP 2011) O professor Favalessa efetuou um levantamento das
alturas (em cm) dos 100 alunos da sua escolinha de basquete do
UP, cujo resultado está apresentado na tabela de frequências
abaixo.
165
175
40
A variância (cm²) e o desvio padrão (cm) correspondente às alturas
dos alunos-atletas da turma analisada, respectivamente, são:
175
185
30
185
195
20
195
205
10
Total de alunos
100
a) 16 e 4.
b) 10 e 10 .
c) 160 e 4 10 .
d) 144 e 12.
e) 100 e 10.
Altura (cm)
Frequência
15) (UFPR-PR) O serviço de atendimento ao consumidor de uma concessionária de veículos recebe as
reclamações dos clientes via telefone. Tendo em vista a melhoria nesse serviço, foram anotados os números
de chamadas durante um período de sete dias consecutivos. Os resultados obtidos foram os seguintes:
Sobre as informações contidas nesse quadro, considere as seguintes
afirmativas:
Dia
domingo
segunda
terça
quarta
quinta
sexta
sábado
I. O número médio de chamadas dos últimos sete dias foi 6.
II. A variância dos dados é 4.
III. O desvio padrão dos dados é
2.
Assinale a alternativa correta.
a) Somente as afirmativas I e II são verdadeiras.
b) Somente as afirmativas I e III são verdadeiras.
c) Somente as afirmativas II e III são verdadeiras.
d) Somente a afirmativa I é verdadeira.
e) As afirmativas I, II e III são verdadeiras.
Número de
chamadas
3
4
6
9
5
7
8
GABARITO – MEDIDAS DE DISPERSÃO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
B
E
B
E
C
B
E
E
D
B
B
D
B
E
A
5. Bibliografia:
FERREIRA, D,F. Estatística Básica. Lavras: Editora UFLA, 2005, 664p.
RiBEIRO, J.L.D.; TEN CATEN, C.S. Estatística Industrial. Porto Alegre, Universidade Federal do Rio Grande do Sul, 2000. 135p.
SPIEGEL, M.R. Estatística. São Paulo: McGraw-Hill, 1972.520p.
–8–
Download

centro educacional união dos professores