Medidas de Dispersão ou de Variabilidade
A interpretação de dados estatísticos
exige que se realize um número maior de
estudos, além das medidas de posição.
O estudo das médias, medianas e modas
são válidos, mas não são suficientes para
estudos
comparativos
ou
conclusões
qualitativas.
As medidas de dispersão ou variabilidade
servem para verificar a representatividade das
medidas de posição.
Medidas de Dispersão ou de Variabilidade
Por exemplo, sabendo que a temperatura
média de três cidades Barra do Garças(X), Nova
Xavantina(Y) e Água Boa(Z) é a mesma, e igual
a 25ºC, ainda assim somos levados a pensar a
respeito do clima dessas cidades.
Consideremos os seguintes valores de
temperatura medidos nas cidades X, Y, Z.
125
125
Z
 25
X: 25;25;25;25;25. X 
 25
5
5
Y: 26;24;25;23;27.
125
Y
 25
Z: 8; 13;27;40;37.
5
Medidas de Dispersão ou de Variabilidade
Temos a mesma média, entretanto Barra do
Garças possui temperatura mais homogênea que
Nova Xavantina e Água Boa. Nova Xavantina, por
sua vez, apresenta temperatura mais homogênea
que Água Boa.
X: 25;25;25;25;25.
Y: 26;24;25;23;27.
Z: 8; 13;27;40;37.
Medidas de Dispersão ou de Variabilidade
Chamando de dispersão ou variabilidade, a
maior ou menor diversificação dos valores de uma
variável em torno de um valor de tendência
central, tomado como ponto de comparação.
Pode –se dizer que a temperatura em Barra
do Garças apresenta dispersão nula e que a
temperatura em Nova Xavantina apresenta uma
dispersão menor em relação a Água Boa .
Medidas de Dispersão ou de Variabilidade
Das medidas de dispersão, estudaremos a
amplitude total, a variância, o desvio padrão, o
coeficiente de variação e o erro padrão da média.
Amplitude Total: Dados não agrupados e dados
agrupados sem e com intervalos de classe.
A amplitude total (AT) é a diferença entre o maior
e o menor valor observado:
Medidas de Dispersão ou de Variabilidade
Amplitude Total: Dados não agrupados:
AT= Xmáx-Xmín
Exemplo: ATX= 25-25=0; ATY=27-23=4;
ATZ=40-8=32.
Ex: Peso em gramas, de ratos machos da raça
Wistar com 30 dias de idade.
50
62
70
86
60
64
66
77
58
55
82
74
AT= 86-50=36
Medidas de Dispersão ou de Variabilidade
Amplitude Total: Dados agrupados sem
intervalos de classe:
AT= Xmáx-Xmín
Idade (xi) Freqüência ( fi)
18
3
19
2
20
3
21
4
24
2
25
3
Total
17
AT= 25-18=7
Medidas de Dispersão ou de Variabilidade
Dados agrupados com intervalos de classe.
AT= Lmáx-lmín;
Lmáx - Limite superior da última classe
lmín – Limite inferior da primeira classe
Classe Peso (kg)
1
1,5├ 2,0
2
2,0├ 2,5
3
2,5├ 3,0
4
3,0├ 3,5
5
3,5├ 4,0
6
4,0├ 4,5
7
4,5├ 5,0
fi
3
16
31
34
11
4
1
100
AT= 5,0-1,5=3,5
Medidas de Dispersão ou de Variabilidade
A amplitude total tem o inconveniente de
só levar em conta os dois valores extremos da
série, descuidando do conjunto de valores
intermediários.
Medidas de Dispersão ou de Variabilidade
Variância e Desvio Padrão
A variância e o desvio padrão são medidas
que fogem a falha da amplitude total, pois leva
em consideração a totalidade dos valores da
variável em estudo, o que faz delas índices
bastante estáveis e, por isso mesmo, os mais
geralmente empregados.
Medidas de Dispersão ou de Variabilidade
A variância baseia-se nos desvios em torno
da média aritmética, porém determinando a
média aritmética dos quadrados dos desvios.

x  x


2
S
2
i
lembrando que
f
i
n
n
Observação: Quando nosso interesse não se
restringe à descrição dos dados mas, partindo de uma
amostra, visamos tirar inferências válidas para a
respectiva população, convém efetuar uma modificação,
que consiste em usar o divisor n-1 em lugar de n.
Medidas de Dispersão ou de Variabilidade
Podemos simplificar a fórmula da
variância:
S
2
x


n
2
i
  xi

 n





2
Podemos, ainda com o intuito de
conservar a definição, calcular a variância usando
o divisor n e, em seguida, multiplicar o resultado
n , para amostras .
por
n 1
Medidas de Dispersão ou de Variabilidade
Sendo a variância calculada a partir
dos quadrados dos desvios, ela é um número em
unidade quadrada em relação a variável em
questão, o que, do ponto de vista prático é um
inconveniente.
Medidas de Dispersão ou de Variabilidade
Por isso mesmo, imaginou-se uma
nova medida que tem utilidade e interpretação
prática, denominada desvio padrão, definido
como a raiz quadrada da variância e representada
por S:
S S
2
Medidas de Dispersão ou de Variabilidade
Propriedades do desvio padrão:
Somando-se (ou subtraindo-se) uma constante a
de todos os valores de uma variável, o desvio
padrão não se altera: y  x  a  S  S
i
i
y
x
Multiplicando-se todos os valores de uma variável
por uma constante (diferente de zero), o desvio
padrão fica multiplicado por essa constante:
yi  a  xi  S y  a  S x
Medidas de Dispersão ou de Variabilidade
Exemplo: Calcule a variância e o
desvio padrão para as temperaturas da cidade X, Y
e Z.
2
X: 25;25;25;25;25 - Y: 26;24;25;23;27 - S 2   xi  x 
 fi
Z: 8; 13;27;40;37.
(25  25)2  (25  25)2  (25  25)2  (25  25)2  (25  25)2
Sx 
0
5
(26  25)2  (24  25)2  (25  25)2  (23  25)2  (27  25)2 10


2
5
5
2
Sy
2
(8  25)2  (13  25)2  (27  25)2  (40  25)2  (37  25)2 806
Sz 

 161,2
5
5
2
Medidas de Dispersão ou de Variabilidade
Desvio padrão, definido como a raiz
quadrada da variância e representada por S:
S S
2
S x  0  0 S y  2  1,41
Sz  161,2  12,70
Medidas de Dispersão ou de Variabilidade
Partindo de uma amostra, visamos tirar
inferências válidas para a respectiva população, convém
efetuar uma modificação, que consiste em usar o divisor
n-1 em lugar de n.
Sy
2
(26  25)2  (24  25)2  (25  25)2  (23  25)2  (27  25)2 10


 2,5
4
4
Com o intuito de conservar a definição,
calcular a variância usando o divisor n e, em seguida,
multiplicar o resultado por n
n 1
 5
2
2
S 2
S 
 2  2,5
y
População
y
 
4
Amostra
Medidas de Dispersão ou de Variabilidade
Ex: Peso em gramas, de ratos machos da raça Wistar com 30 dias
de idade. Calcule a variância:
50
62
70
2500 3844 4900
86
60
64
7396 3600 4096
66
77
58
4356 5929 3364
55
82
74
3025 6724 5476
S2 
x
n
2
i
  xi

 n





2
x
 i  55210
2
2
S2 
S  111,83  10,57
x
i
 804
55210  804 

  4600,83  4489  111,83
12
 12 
Medidas de Dispersão ou de Variabilidade
Dados agrupados sem intervalos de classe.
Cálculo da variância para dados agrupados
sem intervalos de classe e com intervalos de
classe.
S
2
fx


f
2
i i
i
  f i xi 


 f 
i 

2
Medidas de Dispersão ou de Variabilidade
Suponhamos que temos a seguinte distribuição de
idades:
Idade (xi)
18
19
20
21
24
25
Total
S
2
Freqüência ( fi)
3
2
3
4
2
3
17
fx


f
2
i i
i
fi. xi
54
38
60
84
48
75
359
fi. x2i
972
722
1200
1764
1152
1875
7685
  f i xi 
7685
359







 6,10

 f 
17
 17 
i 

2
2
Medidas de Dispersão ou de Variabilidade
Exemplo: Dados agrupados com intervalos de
classe.
i
1
2
3
4
5
6
S
2
Estaturas (cm)
150├ 154
154├ 158
158├ 162
162├ 166
166├ 170
170├ 174
fx


f
2
i i
i
xi
152
156
160
164
168
172
fi
4
9
11
8
5
3
∑fi=40
fi.xi
608
1404
1760
1312
840
516
6440
fi.x2 i
92416
219024
281600
215168
141120
88752
1038080
  f i xi  1038080  6440 
 


 31

 f 
40
 40 
i 

2
2
Medidas de Dispersão ou de Variabilidade
Coeficiente de Variação
O desvio padrão por si só não diz
muita coisa. Assim um desvio padrão de duas
unidades pode ser considerado pequeno para
uma série de valores cujo valor médio é 200, no
entanto, se a média for igual a 20, o mesmo não
pode ser dito.
Medidas de Dispersão ou de Variabilidade
Coeficiente de Variação
Além disso, o fato de o desvio
padrão ser expresso na mesma unidade dos dados
limita o seu emprego quando desejamos
comparar duas ou mais séries de valores,
relativamente à sua dispersão ou variabilidade,
quando expressas em unidades diferentes.
S
CV   100
X
Medidas de Dispersão ou de Variabilidade
Coeficiente de Variação
X  161 cm
Para a tabela de estaturas temos
e S  5,57 cm
, assim temos:
S
CV   100
X
5,57
CV 
 100  3,459%
161
Medidas de Dispersão ou de Variabilidade
Coeficiente de Variação
Exemplo: Tomemos os resultados das
medidas das estaturas e dos pesos de um mesmo
grupo de indivíduos.
Estaturas
Pesos
Média
S
175 cm 5,0 cm
68 kg
2 kg
5
2
CVE 
 100  2,85% CVP 
 100  2,94%
175
68
Logo os pesos apresentam maior grau
de dispersão que as estaturas.
Medidas de Dispersão ou de Variabilidade
Erro Padrão da Média
O erro padrão da média de uma
variável X S X  dá uma idéia da precisão ou da
representatividade da estimativa obtida para a
média. Ele é inversamente proporcional ao
tamanho da amostra e diretamente proporcional
ao desvio padrão, sendo dado pela fórmula:
SX 
SX
n
Medidas de Dispersão ou de Variabilidade
Erro Padrão da Média
É usual apresentar a média e o erro
padrão da média com a seguinte indicação:
X  SX
Exemplo: Tabela de estaturas:
SX 
5,57
40
 0,88
X  S X  161 0,88
Medidas de Dispersão ou de Variabilidade
Para a tabela abaixo, calcule as medidas de
dispersão vista na aula.
Nascidos vivos, segundo o peso ao nascer, em
quilogramas.
Classe
Peso (kg)
f
i
1
2
3
4
5
6
7
1,5├ 2,0
2,0├ 2,5
2,5├ 3,0
3,0├ 3,5
3,5├ 4,0
4,0├ 4,5
4,5├ 5,0
3
16
31
34
11
4
1
100
Medidas de Dispersão ou de Variabilidade
Nascidos vivos, segundo o peso ao nascer,
em quilogramas.
Classe
1
2
3
4
5
6
7
Peso (kg)
1,5├ 2,0
2,0├ 2,5
2,5├ 3,0
3,0├ 3,5
3,5├ 4,0
4,0├ 4,5
4,5├ 5,0
fi
3
16
31
34
11
4
1
100
xi
1,75
2,25
2,75
3,25
3,75
4,25
4,75
fi.xi
5,25
36,00
85,25
110,5
41,25
17,00
4,75
300,00
fi.xi 2
9,1875
81,0000
234,4375
359,1250
154,6875
72,2500
22,5625
933,2500
Medidas de Dispersão ou de Variabilidade
AT= 5,0-1,5=3,5
2


fx
f i xi
932,25  300 


2


S 



 0,3225

 fi   fi  100  100 
2
i i
2
S  S  0,3225  0,5679
2
S
0,5679
CV   100 
 100  18,93%
3
X
S X 0,5679
SX 

 0,05679
n
100
X  S X  3  0,05679
Download

Medidas de Dispersão ou de Variabilidade