Medidas de Dispersão ou de
Variabilidade:
É a maior ou menor diversificação dos valores de
uma variável em torno de um valor de tendência
central ( média ou mediana ) tomado como ponto
de comparação.
A média - ainda que considerada como um número
que tem a faculdade de representar uma série de
valores - não pode, por si mesma, destacar o grau
de homogeneidade ou heterogeneidade que existe
entre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das
variáveis X, Y e Z:
X = { 70, 70, 70, 70, 70 }
Y = { 68, 69, 70 ,71 ,72 }
Z = { 5, 15, 50, 120, 160 }
Observamos então que os três conjuntos apresentam a
mesma média aritmética = 350/5 = 70
Medidas de dispersão
AMPLITUDE TOTAL
a) Sem intervalo de classe
AT = X(max.) – X(min.)
exemplo: 40. 45, 48, 52, 54, 62 e 70
AT = 70 – 40 = 30
b) Com intervalo de classe
AT = L(máx.) – l(min.)
i
Estatura
fi
1
150|--154
4
2
154|--158
9
3
158|--162
11
∑
24
AT = 162 – 150 = 12
Medidas de dispersão
Um aspecto importante no estudo descritivo de
um conjunto de dados, é o da determinação da
variabilidade ou dispersão desses dados,
relativamente à medida de localização do centro
da amostra.
Repare-se nas duas amostras seguintes, que
embora tenham a mesma média, têm uma
dispersão bem diferente:
Como a medida de localização mais
utilizada é a média, será relativamente
a ela que se define a principal medida
de dispersão - a variância
Medidas de dispersão Variância
Define-se a variância, e representa-se por s2,
como sendo a medida que se obtém somando os
quadrados dos desvios das observações da
amostra, relativamente à sua média, e
dividindo pelo número de observações da
amostra menos um:
Uma vez que a variância envolve a
soma de quadrados, a unidade em que
se exprime não é a mesma que a dos
dados. Assim, para obter uma medida
da variabilidade ou dispersão com as
mesmas unidades que os dados,
tomamos a raiz quadrada da variância
e obtemos o desvio padrão:
O desvio padrão é uma medida que só pode
assumir valores não negativos e quanto maior
for, maior será a dispersão dos dados.
Algumas propriedades do desvio padrão, que
resultam imediatamente da definição, são:
 o desvio padrão é sempre não negativo e será
tanto maior, quanta mais variabilidade houver
entre os dados.
 se s = 0, então não existe variabilidade, isto
é, os dados são todos iguais.
Dados agrupados
f i x
 f i xi 
s


n
 n 
2
i
2
xi
fi
fi xi
fi xi2
0
2
0
0
1
6
6
6
2
12
24
48
3
7
21
63
∑ =27
∑ = 51
∑ = 117
Na representação gráfica abaixo
visualizamos os desvios das
observações relativamente à média
Do mesmo modo que a média, também o desvio
padrão é uma medida pouco resistente, pois é
influenciado por valores ou muito grandes ou
muito pequenos (o que seria de esperar já que na
sua definição entra a média que é não
resistente). Assim, se a distribuição dos dados
for bastante enviesada, não é conveniente
utilizar a média como medida de localização, nem
o desvio padrão como medida de variabilidade.
Estas medidas só dão informação útil,
respectivamente sobre a localização do centro da
distribuição dos dados e sobre a variabilidade, se
as
distribuições
dos
dados
forem
aproximadamente simétricas.
Propriedades para dados com distribuição
aproximadamente normal:
Uma propriedade que se verifica se os dados se
distribuem de forma aproximadamente normal,
ou seja, quando o histograma apresenta uma
forma característica com uma classe média
predominante e as outras classes se distribuem
à volta desta de forma aproximadamente
simétrica e com frequências a decrescer à
medida que se afastam da classe média, é a
seguinte:
1 - Aproximadamente 68% dos dados estão no
intervalo
2 - Aproximadamente 95% dos dados estão no
intervalo
3 - Aproximadamente 100% dos dados estão
no intervalo
A informação que o desvio padrão dá sobre
a variabilidade deve ser entendida como a
variabilidade
que
é
apresentada
relativamente a um ponto de referência - a
média, e não propriamente a variabilidade
dos dados, uns relativamente aos outros.
COEFICIENTE DE VARIAÇÃO
S
CV  100
X
MEDIDAS DE ASSIMETRIA E
CURTOSE
Baseados na relação entre média
e moda pode-se determinar o tipo
de assimetria
X  Mo
Se
X – Mo = 0 assimetria nula
X-Mo < 0 assimetria negativa ou à
esquerda
X-Mo > 0 assimetria positiva ou á
direita
Pesos (kg)
fi
2|--6
6
6|--10
12
10|--14
24
14|--18
12
18|--22
6
∑ = 60
X = 12 kg
Md = 12 kg
Mo = 12 kg
s = 4,42 kg
Pesos (kg)
fi
2|--6
6
6|--10
12
10|--14
24
14|--18
30
18|--22
6
∑ = 78
X = 12,9 kg
Md = 13,5 kg
Mo = 16 kg
s = 4,2kg
assimétrica negativa
Pesos (kg)
fi
2|--6
6
6|--10
30
10|--14
24
14|--18
12
18|--22
6
∑ = 78
X = 11,1 kg
Md = 10,5 kg
Mo = 8 kg
s = 4,2 kg
assimétrica positiva
COEFICIENTE DE ASSIMETRIA
3( X  MD)
As 
S
Se 0,15 <|AS|<1 moderada
Se |AS| >1 é forte
CURTOSE
Denomina-se curtose o grau de achatamento de uma
distribuição em relação a uma distribuição em relação
a uma destituição padrão, denominada curva normal
Leptocúrtica : quando apresenta uma curva de
frequência mais fechada que a normal
Platicúrtica :
quando apresenta uma curva de
frequência mais aberta que a normal
Mesocúrtica: curva normal
Q3  Q1
C
2( P90  P10 )
c = 0,263 curva mesocúrtica
c < 0,263 curva leptocúrtica
c > 0,263 curva platicúrtica
Download

Apresentação do PowerPoint