UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Tarciana Liberal MEDIDAS DE DISPERSÃO As medidas de posição apresentadas fornecem a informação dos dados apenas a nível pontual, sem ilustrar outros aspectos referentes à forma como os dados estão distribuídos na amostra. As medidas de dispersão são utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. MEDIDAS DE DISPERSÃO Exemplo 1: Notas de três turmas de Estatística Vital - UFPB Observações importantes i) As três turmas possuem a mesma média. ii) As notas estão distribuídas sob diferentes formas. iii) A média resume o conjunto de dados apenas posição central. iv) A média não fornece informações sobre a variabilidade dos dados. Solução: Apresentar junto da média uma medida que sumarize a variabilidade do conjunto de dados. MEDIDAS DE DISPERSÃO Amplitude Total: Uma forma simples de medir a dispersão em um conjunto de observações é através da amplitude total: AT = max(X1, . . . ,Xn) − min(X1, . . . ,Xn) Verifica-se que a amplitude como medida de dispersão é limitada. Essa medida só depende dos valores extremos, ou seja, não é afetada pela dispersão dos valores internos EXEMPLO 1: Calcule as amplitudes das notas das turmas. EXEMPLO 2 MEDIDAS DE DISPERSÃO - VARIÂNCIA A variância de um conjunto de dados (amostra ou população) é uma medida de “VARIABILIDADE ABSOLUTA”. Ela mede a variabilidade do X conjunto em termos de desvios quadrados em relação à média aritmética. É uma quantidade sempre não negativa e expressa em unidades quadradas do conjunto de dados, sendo de difícil interpretação. MEDIDAS DE DISPERSÃO b) Para dados agrupados: Na prática não conhecemos toda a população. Logo, utilizamos a variância amostral,dada por: ou Obs: Xi é o ponto médio das classes. Xi fi 2 S2 X f i n 1 n i 2 MEDIDAS DE DISPERSÃO – DESVIO PADRÃO É uma outra medida de dispersão mais comumente empregada do que a variância, por ser expressa na mesma unidade de medida do conjunto de dados. Mede a "DISPERSÃO ABSOLUTA" de um conjunto de valores e é obtida a partir da variância. S S 2 Esta definição vale tanto para dados agrupados como para dados não agrupados. EXEMPLO 3: MEDIDAS DE DISPERSÃO – DESVIO PADRÃO EXERCÍCIO 1: Obtenha a variância e o desvio padrão das notas das turmas. MEDIDAS DE DISPERSÃO – COEFICIENTE DE VARIAÇÃO É uma medida de “VARIABILIDADE RELATIVA”, útil para comparar a variabilidade de observações com diferentes unidades de medida. Exemplo 4: VALORES MÉDIA D.P. C.V. 1-2-3 2 1 50 % 100 - 200 - 300 200 100 50 % 101 - 102 - 103 102 1 1% É importante expressar a variabilidade em termos relativos porque, por exemplo, um desvio-padrão igual a 1 pode ser muito pequeno se a magnitude dos dados é da ordem de 1.000, mas pode ser considerado muito elevado se esta magnitude for da ordem de 10. Observe também que o coeficiente de variação é adimensional e por este motivo permite a comparação das variabilidades de diferentes conjuntos de dados. MEDIDAS DE DISPERSÃO – EXEMPLO 5 MEDIDAS DE DISPERSÃO – EXEMPLO 5 EXERCÍCIO 2: Obtenha o coeficiente de variação das notas das turmas. EXERCÍCIO 3: Na tabela abaixo encontra-se a estrutura do produto interno bruto do Brasil, em bilhões de reais, segundo as atividades econômicas. Em qual dos setores ocorre a maior variabilidade? PERÍODO AGROPECUÁRIA INDÚSTRIA SERVIÇOS 2002 6,6 27,1 66,3 2003 7,4 27,8 64,8 2004 6,9 30,1 63 2005 5,7 29,3 65 2006 5,5 28,8 65,8 2007 5,6 27,8 66,6 EXERCÍCIO 2: EXERCÍCIO 3: CONSIDERAÇÕES GERAIS O conjunto de todos os possíveis elementos de uma determinada pesquisa constitui uma população estatística. Sua média é a média populacional, usualmente representada pela letra grega μ. Na grande maioria das situações práticas, a média populacional é desconhecida e deve ser estimada a partir de dados amostrais. Se a amostra for extraída de forma adequada, a média amostral X é uma boa estimativa de μ. A amplitude, apesar de ser muito fácil de calcular, tem a desvantagem de levar em consideração apenas os dois valores extremos (máximo e mínimo) da massa de dados, desprezando os demais. A variância populacional é representada por σ2. Usualmente, a variância populacional é desconhecida e deve ser estimada a partir dos dados amostrais. Se a amostra foi extraída de forma adequada, a variância amostral S2 é uma boa estimativa de σ2. As medidas X , S2 e S tomadas na amostra, denominadas ESTATÍSTICAS, são estimativas dos PARÂMETROS POPULACIONAIS μ, σ2 e σ (supostos desconhecidos). CONSIDERAÇÕES GERAIS X