Medidas de Dispersão ou de Variabilidade: É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central ( média ou mediana ) tomado como ponto de comparação. A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 } Observamos então que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70 Medidas de dispersão AMPLITUDE TOTAL a) Sem intervalo de classe AT = X(max.) – X(min.) exemplo: 40. 45, 48, 52, 54, 62 e 70 AT = 70 – 40 = 30 b) Com intervalo de classe AT = L(máx.) – l(min.) i Estatura fi 1 150|--154 4 2 154|--158 9 3 158|--162 11 ∑ 24 AT = 162 – 150 = 12 Medidas de dispersão Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra. Repare-se nas duas amostras seguintes, que embora tenham a mesma média, têm uma dispersão bem diferente: Como a medida de localização mais utilizada é a média, será relativamente a ela que se define a principal medida de dispersão - a variância Medidas de dispersão Variância Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão: O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são: o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre os dados. se s = 0, então não existe variabilidade, isto é, os dados são todos iguais. Dados agrupados f i x f i xi s n n 2 i 2 xi fi fi xi fi xi2 0 2 0 0 1 6 6 6 2 12 24 48 3 7 21 63 ∑ =27 ∑ = 51 ∑ = 117 Na representação gráfica abaixo visualizamos os desvios das observações relativamente à média Do mesmo modo que a média, também o desvio padrão é uma medida pouco resistente, pois é influenciado por valores ou muito grandes ou muito pequenos (o que seria de esperar já que na sua definição entra a média que é não resistente). Assim, se a distribuição dos dados for bastante enviesada, não é conveniente utilizar a média como medida de localização, nem o desvio padrão como medida de variabilidade. Estas medidas só dão informação útil, respectivamente sobre a localização do centro da distribuição dos dados e sobre a variabilidade, se as distribuições dos dados forem aproximadamente simétricas. Propriedades para dados com distribuição aproximadamente normal: Uma propriedade que se verifica se os dados se distribuem de forma aproximadamente normal, ou seja, quando o histograma apresenta uma forma característica com uma classe média predominante e as outras classes se distribuem à volta desta de forma aproximadamente simétrica e com frequências a decrescer à medida que se afastam da classe média, é a seguinte: 1 - Aproximadamente 68% dos dados estão no intervalo 2 - Aproximadamente 95% dos dados estão no intervalo 3 - Aproximadamente 100% dos dados estão no intervalo A informação que o desvio padrão dá sobre a variabilidade deve ser entendida como a variabilidade que é apresentada relativamente a um ponto de referência - a média, e não propriamente a variabilidade dos dados, uns relativamente aos outros. COEFICIENTE DE VARIAÇÃO S CV 100 X MEDIDAS DE ASSIMETRIA E CURTOSE Baseados na relação entre média e moda pode-se determinar o tipo de assimetria X Mo Se X – Mo = 0 assimetria nula X-Mo < 0 assimetria negativa ou à esquerda X-Mo > 0 assimetria positiva ou á direita Pesos (kg) fi 2|--6 6 6|--10 12 10|--14 24 14|--18 12 18|--22 6 ∑ = 60 X = 12 kg Md = 12 kg Mo = 12 kg s = 4,42 kg Pesos (kg) fi 2|--6 6 6|--10 12 10|--14 24 14|--18 30 18|--22 6 ∑ = 78 X = 12,9 kg Md = 13,5 kg Mo = 16 kg s = 4,2kg assimétrica negativa Pesos (kg) fi 2|--6 6 6|--10 30 10|--14 24 14|--18 12 18|--22 6 ∑ = 78 X = 11,1 kg Md = 10,5 kg Mo = 8 kg s = 4,2 kg assimétrica positiva COEFICIENTE DE ASSIMETRIA 3( X MD) As S Se 0,15 <|AS|<1 moderada Se |AS| >1 é forte CURTOSE Denomina-se curtose o grau de achatamento de uma distribuição em relação a uma distribuição em relação a uma destituição padrão, denominada curva normal Leptocúrtica : quando apresenta uma curva de frequência mais fechada que a normal Platicúrtica : quando apresenta uma curva de frequência mais aberta que a normal Mesocúrtica: curva normal Q3 Q1 C 2( P90 P10 ) c = 0,263 curva mesocúrtica c < 0,263 curva leptocúrtica c > 0,263 curva platicúrtica