MEDIDAS DE DISPERSÃO (VARIABILIDADE) 9.1 Introdução Servem fundamentalmente para verificar a representatividade das medidas de tendência central, pois, estas, por si só, não são suficientes para caracterizar totalmente uma seqüência numérica. Considere as seguintes séries X 1 3 Y 12 12 Z 13 13 7 12 13 10 10 11 15 18 13 13 13 13 14 13 13 13 13 13 20 35 14 14 13 13 média 13 13 13 Análise: Conclusão: 9.2 A Amplitude Total É a diferença entre o maior e o menor valor de uma seqüência, de dados,ou seja, A = X max X min Como se Calcula Amplitude X: 9 10 11 Xi 4 fi 1 5 6 7 10 20 9 3 Amplitude Classes 2 4 4 6 6 8 8 10 10 12 5 10 20 7 2 fi Comentários: Vantagem Desvantagem Conclusão Medida que tem pouca sensibilidade estatística 9.3 A Variância e o Desvio-Padrão Considerações 1. Nosso propósito é medir o grau de concentração dos dados em torno da média; 2. Nada mais interessante de que estudarmos os desvios de cada valor em relação à media, isto é, (Xi X) 3. Ao tomarmos o somatório de todos esses desvios, teremos que di = 0, ou seja, di = (Xi X) = 0 4. Para solucionar esse problema, pelo menos duas soluções foram apresentadas. Quais foram? 1 2 9.3.1 O Desvio Médio Xi DM = X . fi n 9.3.2 O Cálculo da Variância e do Desvio-padrão Fórmula Variância (Xi X) fi 2 = n (Xi X) fi S2 = n 1 Desvio-padrão Universo 2 Populacional S2 Amostral Aplicação Calcular a variância, o desvio-padrão e o intervalo interquartil para a série representativa de uma população. Classe intervalo 1 0 4 2 4 8 3 8 12 4 12 14 5 10 12 fi 1 3 5 4 2 Cálculos e Anotações Comentários 1. No cálculo da variância, quando elevamos os desvios ao quadrado, a unidade de medida também ficará elevada ao quadrado, sempre; 2. Em diversas situações, a unidade de medida da variância nem faz sentido. É o caso por exemplo, em que os dados são expressos em litros, pizzas, salários, etc... Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja, a variância não tem interpretação 3. Exatamente para suprir essa deficiência da variância é que lançamos mão da definição do desvio-padrão, que por sua vez, terá sempre a mesma unidade de medida da série e portanto admite interpretação. 9.3.3 Interpretação do Desvio-padrão O desvio-padrão é, sem dúvida a mais importante das medidas de dispersão e é vital que o pesquisador consiga relacionar o valor obtido através da fórmula, com os dados da série. Quando uma curva de freqüência representativa de uma série é perfeitamente simétrica , podemos afirmar que: 3 Intervalo X X 2 X 3 2 1 X 1 2 3 (%) de valores contidos da série 68 95 99 Quando a distribuição é assimétrica, estes percentuais apresentam pequenas variações para mais ou para menos, dependendo do caso. Aplicação Seja sabe? 1. 100 e desvio-padrão 100 – O que significa? 2. = 3. 2 = 4. 3 = 5. Como se interpreta? Você 9.4 O Coeficiente de Variação (dispersão relativa) Considere as séries abaixo e suas respectivas estatísticas: X Y Média Desvio-padrão 10 2 100 5 CV Análise 1. Qual série possui maior dispersão? 2. E, que tipo de dispersão? 3. Levando-se em consideração as médias das duas séries, o desviopadrão de Y que é em relação a sua média que é é menos significativo que o desvio-padrão de X que é em relação a . 4. Este fato nos leva a definir uma medida de dispersão relativa, que é o Coeficiente de Variação, ou seja, CV = x Conclusão 1. O coeficiente de variação é um número puro, portanto pode ser expresso em percentual. 2. O coeficiente de variação leva em consideração tanto a média quanto a dispersão absoluta da série, portanto é uma medida mais completa que a dispersão absoluta isoladamente. 3 . Para nosso exemplo, comparando os CV de X e Y conclui-se que Y tem menor dispersão relativa do que X. Será que podemos concluir?