V – Medida de Dispersão Prof. Herondino Medidas de posição ou tendência central Propriedades da média aritmética 1. A média é um valor típico, ou seja, ela é o centro de gravidade da distribuição, um ponto de equilíbrio. Seu valor pode ser substituído pelo valor de cada item na série de dados sem mudar o total. Simbolicamente temos: n X xi x i 1 i n n 2. A soma dos desvios das observações em relação a média é igual a zero. ( x X ) 0 i 3. A soma dos desvios elevados ao quadrado das observações em relação a média é menor que qualquer soma de quadrados de desvios em relação a qualquer outro número. Em outras palavras, 2 é um mínimo. ( x X ) i Exemplo 1 xi X xi X ( x X ) 0 i n X xi n x i 1 n i ( xi X ) 2 ( x X ) i 2 Exemplo 2 4 alunos, José, Carlos, Antônio e Pedro, obtiveram as notas e medias, conforme mostra a tabela: Alunos Notas Média Antônio 5 5 5 5 5 Carlos 6 4 5 4 6 José 10 5 5 5 0 Pedro 10 10 5 0 0 Qual deles se saiu melhor? Exemplo 2 Alunos Notas Média Antônio 5 5 5 5 5 Carlos 6 4 5 4 6 José 10 5 5 5 0 Pedro 10 10 5 0 0 Mediana Moda 1º As nota de Antônio não variaram (dispersão nula) 2º As notas de Carlos variaram menos que as de José 3º As notas de Pedro variou mais que as dos outros três alunos. Encontrando a variância (Nº de Ordem) (Nota de Carlos) i xi 01 6 02 4 03 5 04 4 05 6 Total ( Média) X (Desvios) xi X ( x X ) 0 i (Quadrado dos desvios) 2 x X i ( x X ) i 2 A variância amostral A variância amostral é o somatório do quadrado dos desvios dividido pelo somatório das frequências menos um. x X 2 s2 Exemplo: i n 1 ou n x i n 2 i 1 x i n s 2 i 1 n 1 2 Variância pelos quadrados (Nº de Ordem) (Nota de Carlos) i xi 01 6 02 4 03 5 04 4 05 6 x i xi 2 xi 2 n x i n 2 i 1 x i n s 2 i 1 n 1 2 Variância (Nº de Ordem) (Nota de Carlos) xi 2 i xi 01 6 36 02 4 16 03 5 25 04 4 16 05 6 36 xi 25 xi 129 2 n x i n 2 i 1 x i n s 2 i 1 n 1 252 129 2 5 s 5 1 s2 129 125 4 s2 4 4 s2 1 2 Alunos Notas Média Antônio 5 5 5 5 5 5 Carlos 6 4 5 4 6 5 José 10 5 5 5 0 5 Pedro 10 10 5 0 0 5 Variância 1 Desvio Padrão Classes Agrupadas (Nº de Ordem) (Altura em cm) xi i ( Nº de alunos) fi 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total ( Ponto médio) xm xm fi X xm X x m X 2 f 30 i n x i 1 m . fi x m X 2 Classes Agrupadas (Nº de Ordem) (Altura em cm) xi i ( Nº de alunos) fi ( Ponto médio) xm 01 152 158 9 155 02 158 164 8 161 03 164 170 5 167 04 170 176 4 173 05 176 182 3 179 06 182 188 1 185 Total xm fi X xm X x m X 2 f 30 i n x i 1 m . fi x m X 2 Classes Agrupadas (Nº de Ordem) (Altura em cm) xi i ( Nº de alunos) fi ( Ponto médio) xm xm fi 01 152 158 9 155 1395 02 158 164 8 161 1288 03 164 170 5 167 835 04 170 176 4 173 692 05 176 182 3 179 537 06 182 188 1 185 185 Total f 30 X xm X x m X 2 4932 i n x i 1 m . fi x m X 2 Classes Agrupadas (Nº de Ordem) (Altura em cm) xi i ( Nº de alunos) fi ( Ponto médio) xm xm fi X 01 152 158 9 155 1395 164 02 158 164 8 161 1288 164 03 164 170 5 167 835 164 04 170 176 4 173 692 164 05 176 182 3 179 537 164 06 182 188 1 185 185 164 Total f 30 xm X x m X 2 4932 i n x i 1 m . fi x m X 2 Classes Agrupadas (Nº de Ordem) (Altura em cm) xi i ( Nº de alunos) fi ( Ponto médio) xm xm fi X xm X 01 152 158 9 155 1395 164 -9 02 158 164 8 161 1288 164 -3 03 164 170 5 167 835 164 3 04 170 176 4 173 692 164 9 05 176 182 3 179 537 164 15 06 182 188 1 185 185 164 21 Total f 30 x m X 2 4932 i n x i 1 m . fi x m X 2 Classes Agrupadas (Nº de Ordem) (Altura em cm) xi i ( Nº de alunos) fi ( Ponto médio) xm xm fi X xm X x m X 2 01 152 158 9 155 1395 164 -9 81 02 158 164 8 161 1288 164 -3 9 03 164 170 5 167 835 164 3 9 04 170 176 4 173 692 164 9 81 05 176 182 3 179 537 164 15 225 06 182 188 1 185 185 164 21 441 Total f 30 4932 846 i n x i 1 m . fi x m X 2 Encontrando a variância x X 2 s2 x m X 846 2 n fi 30 i n 1 Encontrando a variância x X 2 s2 x m X 846 2 n fi 30 i n 1 846 s 30 1 2 s2 846 29 s 2 29,17 O desvio Padrão amostral O desvio padrão é a raiz quadrada da variância. x X 2 s Exemplo: i n 1 O desvio Padrão amostral O desvio padrão é a raiz quadrada da variância. x X 2 s i n 1 Exemplo: s 2 29,17 s 29,17 s 5,4 Estudo de Caso (utilizando a 2ª Formula) Alunos Notas Média Antônio 5 5 5 5 5 5 Carlos 6 4 5 4 6 5 José 10 5 5 5 0 5 Pedro 10 10 5 0 0 5 x i n 2 i 1 x i n s 2 i 1 n 1 n Desvio Padrão Variância x X 2 2 s i n 1 Nome da Medida média aritmética Notação da Estatística adotada X e mediana Md moda Mo Variância s2 e 2 Desvio Padrão s e A variância Populacional A população é finita e consiste de N valores e uma estimativa da média da população 2 2 x i N O desvio Padrão Populacional Observou-se anteriormente que a média da amostra pode ser utilizada como uma estimativa da média da população. 2 x i N Coeficiente de Variação É a razão entre o desvio padrão e a média. O seu resultado é multiplicado por 100, para que o Coeficiente de Variação seja dado em porcentagem. s CV .100 X Coeficiente de Variação Alunos Notas Média Variância Desvio Padrão Antônio 5 5 5 5 5 5 0 0,0 Carlos 6 4 5 4 6 5 1 1,0 José 10 5 5 5 0 5 12,5 3,5 Pedro 10 10 5 0 0 5 25 5,0 s CV .100 X CV (%) Estudo de Caso – ATIVIDADE V Pesquisa de Resíduos Industriais - Análise de Dados Os dados de demanda bioquímica de oxigênio (DBO) (5 dias) apresentados na Tabela 5.1 foram obtidos a partir de uma pesquisa de águas residuais industriais (EPA dos EUA, 1973). A DBO de uma água é a quantidade de oxigênio necessária para oxidar a matéria orgânica por decomposição microbiana aeróbia para uma forma inorgânica estável. Na legislação do Estado de São Paulo, no Decreto Estadual n.º 8468, a DBO de cinco dias é padrão de emissão de esgotos diretamente nos corpos d’água, sendo exigidos uma DBO máxima de 60 mg/L ou uma eficiência global mínima do processo de tratamento igual a 80%. Concentrações e contribuições unitárias típicas de DBO de esgoto doméstico e efluentes industriais. Estudo de Caso - U.S. EPA 1973 Há 99 observações, cada medida de uma amostra composta, retirada num intervalo de 4 horas, dando seis observações diariamente por 16 dias, mais três observações sobre o 17º dia. O estudo foi realizado para avaliar a DBO média e para estimar a concentração que é excedida uma pequena fração do tempo (por exemplo, 10%). Esta informação é necessária para planejar um processo de tratamento. O padrão de variação também precisa ser visto porque vai influenciar a viabilidade de utilização de um processo de compensação para reduzir a variação da carga DBO. Referência BERTHOUEX, Paul Mac; BROWN, Linfield C.. Statistics for Environmental Engineers. 2ª Boca Raton London New York Washington, D.c: Lewis Publishers, 2002. MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. São Paulo: Saraiva, 2006. TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 1999.