MEDIDAS DE DISPERSÃO (VARIABILIDADE)
9.1 Introdução
Servem fundamentalmente para verificar a representatividade
das medidas de tendência central, pois, estas, por si só, não são
suficientes para caracterizar totalmente uma seqüência numérica.
Considere as seguintes séries
X 1 3
Y 12 12
Z 13 13
7
12
13
10 10 11 15 18
13 13 13 13 14
13 13 13 13 13
20 35
14 14
13 13
média
13
13
13
Análise:
Conclusão:
9.2 A Amplitude Total
É a diferença entre o maior e o menor valor de uma seqüência,
de dados,ou seja,
A = X max
X min
Como se Calcula
Amplitude
X: 9
10
11
Xi 4
fi 1
5
6
7
10
20
9
3
Amplitude
Classes 2 4 4
6 6
8 8 10 10 12
5
10
20
7
2
fi
Comentários:
Vantagem
Desvantagem
Conclusão
Medida que tem pouca sensibilidade estatística
9.3 A Variância e o Desvio-Padrão
Considerações
1. Nosso propósito é medir o grau de concentração dos dados em
torno da média;
2. Nada mais interessante de que estudarmos os desvios de cada
valor em relação à media, isto é, (Xi X)
3. Ao tomarmos o somatório de todos esses desvios, teremos que
di = 0, ou seja, di = (Xi X) = 0
4. Para solucionar esse problema, pelo menos duas soluções
foram apresentadas. Quais foram? 1
2
9.3.1 O Desvio Médio
Xi
DM =
X . fi
n
9.3.2 O Cálculo da Variância e do Desvio-padrão
Fórmula
Variância
(Xi X) fi
2
=
n
(Xi X) fi
S2 =
n 1
Desvio-padrão
Universo
2
Populacional
S2
Amostral
Aplicação
Calcular a variância, o desvio-padrão e o intervalo interquartil para
a série representativa de uma população.
Classe intervalo
1
0
4
2
4
8
3
8
12
4
12 14
5
10 12
fi
1
3
5
4
2
Cálculos e Anotações
Comentários
1. No cálculo da variância, quando elevamos os desvios ao quadrado,
a unidade de medida também ficará elevada ao quadrado, sempre;
2. Em diversas situações, a unidade de medida da variância nem faz
sentido. É o caso por exemplo, em que os dados são expressos em litros,
pizzas, salários, etc... Portanto, o valor da variância não pode ser
comparado diretamente com os dados da série, ou seja, a variância não tem
interpretação
3. Exatamente para suprir essa deficiência da variância é que
lançamos mão da definição do desvio-padrão, que por sua vez, terá sempre
a mesma unidade de medida da série e portanto admite interpretação.
9.3.3 Interpretação do Desvio-padrão
O desvio-padrão é, sem dúvida a mais importante das medidas
de dispersão e é vital que o pesquisador consiga relacionar o valor
obtido através da fórmula, com os dados da série.
Quando uma curva de freqüência representativa de uma série é
perfeitamente simétrica , podemos afirmar que:
3
Intervalo
X
X 2
X 3
2
1
X
1
2
3
(%) de valores contidos da série
68
95
99
Quando a distribuição é assimétrica, estes percentuais apresentam
pequenas variações para mais ou para menos, dependendo do caso.
Aplicação
Seja
sabe?
1.
100 e desvio-padrão
100 – O que significa?
2.
=
3.
2 =
4.
3 =
5. Como se interpreta? Você
9.4 O Coeficiente de Variação (dispersão relativa)
Considere as séries abaixo e suas respectivas estatísticas:
X
Y
Média Desvio-padrão
10
2
100
5
CV
Análise
1. Qual série possui maior dispersão?
2. E, que tipo de dispersão?
3. Levando-se em consideração as médias das duas séries, o desviopadrão de Y que é
em relação a sua média que é
é menos
significativo que o desvio-padrão de X que é
em relação a
.
4. Este fato nos leva a definir uma medida de dispersão relativa, que
é o Coeficiente de Variação, ou seja,
CV =
x
Conclusão
1. O coeficiente de variação é um número puro, portanto pode ser
expresso em percentual.
2. O coeficiente de variação leva em consideração tanto a média
quanto a dispersão absoluta da série, portanto é uma medida mais
completa que a dispersão absoluta isoladamente.
3 . Para nosso exemplo, comparando os CV de X e Y conclui-se que
Y tem menor dispersão relativa do que X. Será que podemos
concluir?
Download

9.1 Introdução Servem fundamentalmente para verificar a