UNIVERSIDADE FEDERAL
DA PARAÍBA
MEDIDAS
DESCRITIVAS
Departamento de Estatística
Tarciana Liberal
MEDIDAS DE DISPERSÃO
 As
medidas de posição apresentadas fornecem a
informação dos dados apenas a nível pontual, sem
ilustrar outros aspectos referentes à forma como os
dados estão distribuídos na amostra.
 As
medidas de dispersão são utilizadas para avaliar
o grau de variabilidade, ou dispersão, dos valores
em torno da média.
MEDIDAS DE DISPERSÃO
Exemplo 1: Notas de três turmas de Estatística Vital - UFPB
Observações importantes
i)
As três turmas possuem a mesma média.
ii)
As notas estão distribuídas sob diferentes formas.
iii)
A média resume o conjunto de dados apenas posição central.
iv)
A média não fornece informações sobre a variabilidade dos dados.
Solução: Apresentar junto da média uma medida que sumarize a
variabilidade do conjunto de dados.
MEDIDAS DE DISPERSÃO

Amplitude Total: Uma forma simples de medir a
dispersão em um conjunto de observações é
através da amplitude total:
AT = max(X1, . . . ,Xn) − min(X1, . . . ,Xn)
Verifica-se que a amplitude como medida de
dispersão é limitada. Essa medida só depende
dos valores extremos, ou seja, não é afetada pela
dispersão dos valores internos
EXEMPLO 1: Calcule as amplitudes das notas das turmas.
EXEMPLO 2
MEDIDAS DE DISPERSÃO - VARIÂNCIA

A variância de um conjunto de dados (amostra ou população) é uma
medida de “VARIABILIDADE ABSOLUTA”. Ela mede a variabilidade do
X
conjunto em termos de desvios quadrados em relação à média
aritmética. É uma quantidade sempre não negativa e expressa em
unidades quadradas do conjunto de dados, sendo de difícil
interpretação.
MEDIDAS DE DISPERSÃO

b) Para dados agrupados:
Na prática não conhecemos toda a população. Logo, utilizamos a
variância amostral,dada por:
ou
Obs: Xi é o ponto médio das classes.
 Xi  fi
2
S2 
X f



i
n 1
n
i
2
MEDIDAS DE DISPERSÃO – DESVIO PADRÃO
É uma outra medida de dispersão mais comumente empregada do
que a variância, por ser expressa na mesma unidade de medida do
conjunto de dados. Mede a "DISPERSÃO ABSOLUTA" de um
conjunto de valores e é obtida a partir da variância.
S

S
2
Esta definição vale tanto para dados agrupados como para dados não
agrupados.
EXEMPLO 3:
MEDIDAS DE DISPERSÃO – DESVIO PADRÃO
EXERCÍCIO 1: Obtenha a variância e o desvio padrão das
notas das turmas.
MEDIDAS DE DISPERSÃO – COEFICIENTE DE VARIAÇÃO

É uma medida de “VARIABILIDADE RELATIVA”, útil para comparar a
variabilidade de observações com diferentes unidades de medida.
Exemplo 4:
VALORES
MÉDIA
D.P.
C.V.
1-2-3
2
1
50 %
100 - 200 - 300
200
100
50 %
101 - 102 - 103
102
1
1%

É importante expressar a variabilidade em termos relativos porque, por exemplo,
um desvio-padrão igual a 1 pode ser muito pequeno se a magnitude dos dados é
da ordem de 1.000, mas pode ser considerado muito elevado se esta magnitude
for da ordem de 10.

Observe também que o coeficiente de variação é adimensional e por este motivo
permite a comparação das variabilidades de diferentes conjuntos de dados.
MEDIDAS DE DISPERSÃO – EXEMPLO 5
MEDIDAS DE DISPERSÃO – EXEMPLO 5

EXERCÍCIO 2: Obtenha o coeficiente de variação das
notas das turmas.


EXERCÍCIO 3: Na tabela abaixo encontra-se a estrutura do
produto interno bruto do Brasil, em bilhões de reais,
segundo as atividades econômicas. Em qual dos setores
ocorre a maior variabilidade?
PERÍODO
AGROPECUÁRIA
INDÚSTRIA
SERVIÇOS
2002
6,6
27,1
66,3
2003
7,4
27,8
64,8
2004
6,9
30,1
63
2005
5,7
29,3
65
2006
5,5
28,8
65,8
2007
5,6
27,8
66,6

EXERCÍCIO 2:


EXERCÍCIO 3:
CONSIDERAÇÕES GERAIS

O conjunto de todos os possíveis elementos de uma determinada
pesquisa constitui uma população estatística. Sua média é a média
populacional, usualmente representada pela letra grega μ. Na grande
maioria das situações práticas, a média populacional é desconhecida e
deve ser estimada a partir de dados amostrais. Se a amostra for extraída
de forma adequada, a média amostral X é uma boa estimativa de μ.

A amplitude, apesar de ser muito fácil de calcular, tem a desvantagem de
levar em consideração apenas os dois valores extremos (máximo e
mínimo) da massa de dados, desprezando os demais.

A variância populacional é representada por σ2. Usualmente, a variância
populacional é desconhecida e deve ser estimada a partir dos dados
amostrais. Se a amostra foi extraída de forma adequada, a variância
amostral S2 é uma boa estimativa de σ2.

As medidas X
, S2 e S tomadas na amostra, denominadas
ESTATÍSTICAS, são estimativas dos PARÂMETROS POPULACIONAIS
μ, σ2 e σ (supostos desconhecidos).
CONSIDERAÇÕES GERAIS
X
Download

Aula 5 - DE/UFPB - Universidade Federal da Paraíba