Medidas de Dispersão ou de Variabilidade A interpretação de dados estatísticos exige que se realize um número maior de estudos, além das medidas de posição. O estudo das médias, medianas e modas são válidos, mas não são suficientes para estudos comparativos ou conclusões qualitativas. As medidas de dispersão ou variabilidade servem para verificar a representatividade das medidas de posição. Medidas de Dispersão ou de Variabilidade Por exemplo, sabendo que a temperatura média de três cidades Barra do Garças(X), Nova Xavantina(Y) e Água Boa(Z) é a mesma, e igual a 25ºC, ainda assim somos levados a pensar a respeito do clima dessas cidades. Consideremos os seguintes valores de temperatura medidos nas cidades X, Y, Z. 125 125 Z 25 X: 25;25;25;25;25. X 25 5 5 Y: 26;24;25;23;27. 125 Y 25 Z: 8; 13;27;40;37. 5 Medidas de Dispersão ou de Variabilidade Temos a mesma média, entretanto Barra do Garças possui temperatura mais homogênea que Nova Xavantina e Água Boa. Nova Xavantina, por sua vez, apresenta temperatura mais homogênea que Água Boa. X: 25;25;25;25;25. Y: 26;24;25;23;27. Z: 8; 13;27;40;37. Medidas de Dispersão ou de Variabilidade Chamando de dispersão ou variabilidade, a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central, tomado como ponto de comparação. Pode –se dizer que a temperatura em Barra do Garças apresenta dispersão nula e que a temperatura em Nova Xavantina apresenta uma dispersão menor em relação a Água Boa . Medidas de Dispersão ou de Variabilidade Das medidas de dispersão, estudaremos a amplitude total, a variância, o desvio padrão, o coeficiente de variação e o erro padrão da média. Amplitude Total: Dados não agrupados e dados agrupados sem e com intervalos de classe. A amplitude total (AT) é a diferença entre o maior e o menor valor observado: Medidas de Dispersão ou de Variabilidade Amplitude Total: Dados não agrupados: AT= Xmáx-Xmín Exemplo: ATX= 25-25=0; ATY=27-23=4; ATZ=40-8=32. Ex: Peso em gramas, de ratos machos da raça Wistar com 30 dias de idade. 50 62 70 86 60 64 66 77 58 55 82 74 AT= 86-50=36 Medidas de Dispersão ou de Variabilidade Amplitude Total: Dados agrupados sem intervalos de classe: AT= Xmáx-Xmín Idade (xi) Freqüência ( fi) 18 3 19 2 20 3 21 4 24 2 25 3 Total 17 AT= 25-18=7 Medidas de Dispersão ou de Variabilidade Dados agrupados com intervalos de classe. AT= Lmáx-lmín; Lmáx - Limite superior da última classe lmín – Limite inferior da primeira classe Classe Peso (kg) 1 1,5├ 2,0 2 2,0├ 2,5 3 2,5├ 3,0 4 3,0├ 3,5 5 3,5├ 4,0 6 4,0├ 4,5 7 4,5├ 5,0 fi 3 16 31 34 11 4 1 100 AT= 5,0-1,5=3,5 Medidas de Dispersão ou de Variabilidade A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários. Medidas de Dispersão ou de Variabilidade Variância e Desvio Padrão A variância e o desvio padrão são medidas que fogem a falha da amplitude total, pois leva em consideração a totalidade dos valores da variável em estudo, o que faz delas índices bastante estáveis e, por isso mesmo, os mais geralmente empregados. Medidas de Dispersão ou de Variabilidade A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. x x 2 S 2 i lembrando que f i n n Observação: Quando nosso interesse não se restringe à descrição dos dados mas, partindo de uma amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n-1 em lugar de n. Medidas de Dispersão ou de Variabilidade Podemos simplificar a fórmula da variância: S 2 x n 2 i xi n 2 Podemos, ainda com o intuito de conservar a definição, calcular a variância usando o divisor n e, em seguida, multiplicar o resultado n , para amostras . por n 1 Medidas de Dispersão ou de Variabilidade Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação a variável em questão, o que, do ponto de vista prático é um inconveniente. Medidas de Dispersão ou de Variabilidade Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio padrão, definido como a raiz quadrada da variância e representada por S: S S 2 Medidas de Dispersão ou de Variabilidade Propriedades do desvio padrão: Somando-se (ou subtraindo-se) uma constante a de todos os valores de uma variável, o desvio padrão não se altera: y x a S S i i y x Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante: yi a xi S y a S x Medidas de Dispersão ou de Variabilidade Exemplo: Calcule a variância e o desvio padrão para as temperaturas da cidade X, Y e Z. 2 X: 25;25;25;25;25 - Y: 26;24;25;23;27 - S 2 xi x fi Z: 8; 13;27;40;37. (25 25)2 (25 25)2 (25 25)2 (25 25)2 (25 25)2 Sx 0 5 (26 25)2 (24 25)2 (25 25)2 (23 25)2 (27 25)2 10 2 5 5 2 Sy 2 (8 25)2 (13 25)2 (27 25)2 (40 25)2 (37 25)2 806 Sz 161,2 5 5 2 Medidas de Dispersão ou de Variabilidade Desvio padrão, definido como a raiz quadrada da variância e representada por S: S S 2 S x 0 0 S y 2 1,41 Sz 161,2 12,70 Medidas de Dispersão ou de Variabilidade Partindo de uma amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n-1 em lugar de n. Sy 2 (26 25)2 (24 25)2 (25 25)2 (23 25)2 (27 25)2 10 2,5 4 4 Com o intuito de conservar a definição, calcular a variância usando o divisor n e, em seguida, multiplicar o resultado por n n 1 5 2 2 S 2 S 2 2,5 y População y 4 Amostra Medidas de Dispersão ou de Variabilidade Ex: Peso em gramas, de ratos machos da raça Wistar com 30 dias de idade. Calcule a variância: 50 62 70 2500 3844 4900 86 60 64 7396 3600 4096 66 77 58 4356 5929 3364 55 82 74 3025 6724 5476 S2 x n 2 i xi n 2 x i 55210 2 2 S2 S 111,83 10,57 x i 804 55210 804 4600,83 4489 111,83 12 12 Medidas de Dispersão ou de Variabilidade Dados agrupados sem intervalos de classe. Cálculo da variância para dados agrupados sem intervalos de classe e com intervalos de classe. S 2 fx f 2 i i i f i xi f i 2 Medidas de Dispersão ou de Variabilidade Suponhamos que temos a seguinte distribuição de idades: Idade (xi) 18 19 20 21 24 25 Total S 2 Freqüência ( fi) 3 2 3 4 2 3 17 fx f 2 i i i fi. xi 54 38 60 84 48 75 359 fi. x2i 972 722 1200 1764 1152 1875 7685 f i xi 7685 359 6,10 f 17 17 i 2 2 Medidas de Dispersão ou de Variabilidade Exemplo: Dados agrupados com intervalos de classe. i 1 2 3 4 5 6 S 2 Estaturas (cm) 150├ 154 154├ 158 158├ 162 162├ 166 166├ 170 170├ 174 fx f 2 i i i xi 152 156 160 164 168 172 fi 4 9 11 8 5 3 ∑fi=40 fi.xi 608 1404 1760 1312 840 516 6440 fi.x2 i 92416 219024 281600 215168 141120 88752 1038080 f i xi 1038080 6440 31 f 40 40 i 2 2 Medidas de Dispersão ou de Variabilidade Coeficiente de Variação O desvio padrão por si só não diz muita coisa. Assim um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200, no entanto, se a média for igual a 20, o mesmo não pode ser dito. Medidas de Dispersão ou de Variabilidade Coeficiente de Variação Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. S CV 100 X Medidas de Dispersão ou de Variabilidade Coeficiente de Variação X 161 cm Para a tabela de estaturas temos e S 5,57 cm , assim temos: S CV 100 X 5,57 CV 100 3,459% 161 Medidas de Dispersão ou de Variabilidade Coeficiente de Variação Exemplo: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos. Estaturas Pesos Média S 175 cm 5,0 cm 68 kg 2 kg 5 2 CVE 100 2,85% CVP 100 2,94% 175 68 Logo os pesos apresentam maior grau de dispersão que as estaturas. Medidas de Dispersão ou de Variabilidade Erro Padrão da Média O erro padrão da média de uma variável X S X dá uma idéia da precisão ou da representatividade da estimativa obtida para a média. Ele é inversamente proporcional ao tamanho da amostra e diretamente proporcional ao desvio padrão, sendo dado pela fórmula: SX SX n Medidas de Dispersão ou de Variabilidade Erro Padrão da Média É usual apresentar a média e o erro padrão da média com a seguinte indicação: X SX Exemplo: Tabela de estaturas: SX 5,57 40 0,88 X S X 161 0,88 Medidas de Dispersão ou de Variabilidade Para a tabela abaixo, calcule as medidas de dispersão vista na aula. Nascidos vivos, segundo o peso ao nascer, em quilogramas. Classe Peso (kg) f i 1 2 3 4 5 6 7 1,5├ 2,0 2,0├ 2,5 2,5├ 3,0 3,0├ 3,5 3,5├ 4,0 4,0├ 4,5 4,5├ 5,0 3 16 31 34 11 4 1 100 Medidas de Dispersão ou de Variabilidade Nascidos vivos, segundo o peso ao nascer, em quilogramas. Classe 1 2 3 4 5 6 7 Peso (kg) 1,5├ 2,0 2,0├ 2,5 2,5├ 3,0 3,0├ 3,5 3,5├ 4,0 4,0├ 4,5 4,5├ 5,0 fi 3 16 31 34 11 4 1 100 xi 1,75 2,25 2,75 3,25 3,75 4,25 4,75 fi.xi 5,25 36,00 85,25 110,5 41,25 17,00 4,75 300,00 fi.xi 2 9,1875 81,0000 234,4375 359,1250 154,6875 72,2500 22,5625 933,2500 Medidas de Dispersão ou de Variabilidade AT= 5,0-1,5=3,5 2 fx f i xi 932,25 300 2 S 0,3225 fi fi 100 100 2 i i 2 S S 0,3225 0,5679 2 S 0,5679 CV 100 100 18,93% 3 X S X 0,5679 SX 0,05679 n 100 X S X 3 0,05679