Estatística Experimental Estatística Descritiva 2: - Medidas de Variabilidade (Medidas de Dispersão) Bibliografia Consultada Martins, G. A. & Donaire, D. Princípios de Estatística. 1990. (Cap. 9) Dante, L. R. Matemática: contexto e (Cap. 29) aplicações . Vol. Único, 2009. Apostila: Regazzi, A. J., Curso de iniciação à estatística. (Apostila Item 5.3) Profº: Glauco Vieira de Oliveira AGR/ICET/CUA/UFMT Medidas de Dispersão (Variabilidade) Introdução Média, Moda e mediana: concentra em um único número os diversos valores de uma variável quantitativa Obs: Muitas vezes estas informações não são suficientes. Exemplo: Educador físico irá propor atividades de lazer para um grupo cujo a média de idade é 20 anos. Exemplo de alguns grupos possíveis: – Grupo A: 20 anos, 20 anos, 20 anos, 20 anos, 20 anos, 20 anos. – Grupo B: 22 anos, 23 anos, 18 anos, 19 anos, 20 anos, 18 anos. – Grupo C: 6 anos, 62 anos, 39 anos, 4 anos, 8 anos, 1 anos. x grupoA 20 20 20 20 20 20 120 20 anos 6 6 x grupoB 22 23 18 19 20 18 120 20 anos 6 6 x grupoC 6 62 39 4 8 1 120 20 anos 6 6 Para refletir. Observe a dispersão dos dados em relação a média. Medidas de Dispersão (Variabilidade) Introdução Medidas de dispersão (Variabilidade): Idéia básica: Medir o grau de concentração ou dispersão dos dados em torno da média. – 1ª Idéia: Tomar os desvios dos valores xi em relação a média aritmética (xi – MA), em que MA= média aritmética Calcule os desvios em relação a média aritmética (MA) de cada grupo do exemplo anterior (xi-MA) Xi Grupo A Grupo B Grupo C X1 (20 –20) = 0 (22 –20)=+2 (6 –20)= -14 X2 (20 –20) = 0 (23 -20)=+3 (62 –20)= +42 X3 (20 –20) = 0 (18 –20)=-2 (39 –20)= +19 X4 (20 –20) = 0 (19 –20)=-1 (4 –20)= -16 X5 (20 –20) = 0 (20 –20)= 0 (8 –20)= -12 X6 (20 –20) = 0 (18 –20)=-2 (1 –20)= -19 0 0 0 Propriedade: (xi – MA) = 0 Medidas de Dispersão (Variabilidade) Introdução Solução possível: (xi – MA)2 Variância (V): média dos quadrados dos desvios fórmula: n V Xi X1 X2 X3 X4 X5 X6 (xi-MA)2 Variância x i MA 2 ou 2 i 1 n (desvios)2 = (xi-MA)2 Grupo A Grupo B Grupo C 02 (+2)2 (-14)2 02 (+3)2 (+42)2 02 (-2)2 (+19)2 02 (-1)2 (-16)2 02 (0)2 (-12)2 02 (-2)2 (-19)2 0 0 22 3,6 n 3082 513,6 2 x x i i 1 n Para refletir. “ Se os desvios são elevados ao quadrado, como fica a representação das unidades? ” Aplicação do uso das médias, variâncias e desvio padrão Média arit mét ica: x x n ; variância: 2 desvio padrão: 2 ( x x ) i n ; 2 Exemplos de aplicação: 1) Em um treinamento de salto em altura, os atletas realizaram 4 saltos cada um. Veja as marcas obtidas por 3 atletas: – – – Atleta A: 148 cm, 170 cm, 155 cm e 131 cm; Atleta B: 145 cm, 151 cm, 150 cm e 152 cm; Atleta C: 146 cm, 151 cm, 143 cm e 160 cm; Com base nos dados responda os seguintes itens: a) Qual deles obteve melhor média? b) Qual deles foi mais regular? Aplicação do uso das médias, variâncias e desvio padrão x Média arit mét ica: x ; variância: n 2 (x i x )2 n ; desvio padrão: 2 Exemplos de aplicação: 2) O histograma mostra o resultado de uma pesquisa sobre altura entre os alunos de uma classe. Calcule o desvio padrão desta variável Classes |--|--|--|--- |--Total () PM Fi POPULACÃO vs AMOSTRA Variância: É dada pela soma dos quadrados dos desvios em relação a média aritmética, dividida pelo número de graus de liberdade. Variância Populacional n 2 x i 1 Variância Amostral n x Fi 2 i s 2 ˆ 2 n Desenvolvendo temos: 2 1 x i2 Fi n x F 2 i n Qdo Fi = 1 para todo i 2 2 x 1 i 2 x i n n i x i 1 x Fi 2 i n -1 Desenvolvendo temos: 1 2 x i2 Fi s n 1 x F 2 i i n Qdo Fi = 1 para todo i 1 2 x i2 s n 1 x 2 i n Desvio Padrão: 2 é o desvio padrão populacional S S 2 é o desvio padrãoamostral Desvio Médio: | xi x | Fi DM g.l. obs: xi x di g.l. : grausde liberdade n: Populacional n 1 : Am ostral Populacão vs amostra Ex: Calcular o a variância, o desvio padrão e o desvio médio da seguinte distribuição amostal. Xi Fi xiFi xi2Fi | xi – x | = | di | |di| Fi 5 2 10 50 |5 – 8,06| = 3,06 6,12 7 3 21 147 |7 – 8,06| = 1,06 3,18 8 5 40 320 |8 – 8,06| = 0,06 0,30 9 4 36 324 |9 – 8,06| = 0,94 3,76 11 2 22 242 |11 – 8,06| = 2,94 5,88 129 1.083 Cálculo do desvio médio DM | d | F 19,24 i n 1 19,24 Calculo da variância amostral (S2) 1 2 x i2 Fi s n 1 x F 2 i n i 2 1 129 1.083 2,86 16 1 16 Calculo do desvio padrão amostral (S) s s 2 , logo, s 2,86 1,69 i 15 Dispositivo Prático: Uso de tabela auxiliar Ex2: Dada a distribuição abaixo, encontrar a média, o desvio médio e o desvio padrão amostral Tabela Auxiliar Classes Fi 2 |--- 4 2 4 |--- 6 4 6 |--- 8 7 8 |--- 10 4 10 |--- 12 3 xi xiFi | xi – x | = | di | |di| Fi xi Fi Total () Nota xi = Ponto Médio (quando dividido em classes) x 144 7, 2 20 DM 37,2 1,86 20 2 1 144 s 1.148 5,85 20 1 20 2 s 5,85 2,41 Coeficiente de Variação (CV) Definição: Trata-se de uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. Fórmula: - Utilizado para avaliação de precisão de experimentos s CV ou CV x x - Utilizado para comparar homogeneidade de amostras Exemplo: Numa empresa, o salário médio dos homens é de $4.000 com desvio padrão de $1.500 e o das mulheres é em média de $3.000, com desvio padrão de $1.200. Homens : CV 1500 0,375 x 4000 Mulheres : CV x 1200 0,4 3000 Conclusão: Pode-se concluir que os salários das mulheres apresentam maior dispersão relativa que os dos homens Obs: Costuma-se expressar o valor de CV em porcentagens. Para isso basta multiplicar o resultado por 100. Assim: CV(H)= 37,5% e CV(M)= 40% Erro Padrão da Média (EP) Definição: è uma medida utilizada para avaliar a precisão da média. Fórmula: s(X) s X n Note que o erro padrão da média é: – Inversamente proporcional ao tamanho da amostra; – Diretamente proporcional à variância da amostra Amplitude Total (AT) Definição: é a diferença entre o maior e o menor valor de uma amostra ou de um conjunto de dados. Fórmula: AT = Xmáx - Xmín Coeficiente de Correlação Amostral Definição: è uma medida utilizada para avaliar a precisão da média. Símbolo: ˆ r ou Dado duas variáveis X e Y: Xi X1 X2 ... Xn Yi Y1 Y2 ... Yn Fórmula: rxy ˆ V ( X ,Y ) CO Vˆ ( X ).Vˆ (Y ) SPxy SQDx SQDy - Resolução no quadro Pode ser Positiva, Negativa ou aproximadamente igual a zero - Gráfico no quadro Coeficiente de Correlação Amostral Exemplo: Amostra A 4 8 3 9 7 5 Amostra B 1 5 2 14 3 11