UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Tarciana Liberal Vimos que é possível sintetizar os dados sob a forma de distribuições de freqüências e gráficos. Pode ser de interesse apresentar esses dados através de medidas descritivas que sintetizam as características da distribuição. Para representar um conjunto de dados de forma condensada utilizaremos algumas medidas de posição e de dispersão. MEDIDAS DE POSIÇÃO - MÉDIA Média Aritmética Simples: É a soma das observações dividida pelo número de observações. Em geral é a medida de tendência central mais comum para um conjunto de dados e é denotada por µ ou X a) Para dados não agrupados: Sejam X1,X2, . . . ,XN, um conjunto de valores da variável X. Temos então que a média aritmética de X é dada por: Na prática não conhecemos toda a população. Logo, utilizamos a média amostral,dada por: MEDIDAS DE POSIÇÃO - MÉDIA b) Para dados agrupados: Uma vez que os valores da variável estão agrupados em tabelas de freqüências, temos que onde k é o número de classes. No caso de distribuição de frequências por classes, Xi, para i = 1, . . . , k são os respectivos pontos médios das classes. EXEMPLO: Determinar a média aritmética dos pesos de 5 alunos da turma. PROPRIEDADES DA MÉDIA ARITMÉTICA i) A soma algébrica dos desvios de um conjunto de números em relação a média aritmética é zero. ii) Quando somamos ou subtraímos uma constante aos valores de uma variável, a média fica aumentada ou diminuída dessa constante. iii) Quando multiplicamos ou dividimos todos os valores de uma variável por uma constante, a média fica multiplicada ou dividida por essa constante. PROPRIEDADES DA MÉDIA ARITMÉTICA IMPORTANTE: Quando um conjunto de dados contém valores extremos não é aconselhável o uso da média para representação dos dados. EXEMPLO: A partir da distribuição de renda calcule a renda média dos Engenheiros de Produção em uma Empresa. 2500 3300 5500 2700 4200 6000 3000 4800 7000 3200 5000 80000 MEDIDAS DE POSIÇÃO - MEDIANA Mediana: Ocupa a posição central de uma série de observações ordenadas, ou seja, é o valor que divide os dados em duas partes iguais. É denotada por Me. a) Para dados não agrupados: Caso 1: “n” ímpar: A mediana será o elemento central de ordem (n+1)/2; Caso 2: “n” par: A mediana será a média entre os elementos de ordens n/2 e (n/2)+1 MEDIDAS DE POSIÇÃO - MEDIANA b) Para dados agrupados por valor: É necessário construir a freqüência acumulada para encontrar o elemento mediano através da sua ordem c) Para dados agrupados por classes: 1º Passo: Calcula-se a ordem do elemento central (n/2). 2º Passo: Pela freqüência acumulada identifica-se a classe que contém a mediana. 3º Passo: Utiliza-se a fórmula Onde: lme é o limite inferior da classe mediana; n é o tamanho da amostra; FANT é a soma das freqüências anteriores à classe mediana; hme é a amplitude da classe mediana; fme é a freqüência da classe mediana. MEDIDAS DE POSIÇÃO - MEDIANA A mediana não é sensível a valores extremos de um conjunto de dados. Pode ser calculada para dados agrupados em classes extremas indefinidas. EXEMPLO: Obtenha o peso mediano dos 5 alunos observados. Depois obtenha mais uma observação para a sua amostra e calcule novamente o peso mediano. EXEMPLO: A partir da distribuição de renda calcule a renda mediana. Compare com o valor obtido para a média. MEDIDAS DE POSIÇÃO - MODA Moda: É o valor (valores) mais freqüente na distribuição de valores, e será denotado por MO. a) Para dados não agrupados ou agrupados por valor: 1. Se nenhum dado se repete, dizemos que não há moda, ou seja, a distribuição é amodal; 2. Se dois valores ocorrem com a mesma freqüência, dizemos que a distribuição é bimodal; 3. Se mais de dois valores ocorrem com a mesma freqüência, dizemos que a distribuição é multimodal. MEDIDAS DE POSIÇÃO - MODA b) Para dados agrupados em classes 1º Passo: Identifica-se a classe modal. 2º Passo: Uma forma de obtenção da moda é dada pela fórmula de Czuber: onde: lmo é o limite inferior da classe modal; Δ1 é a diferença entre a freqüência da classe modal e a classe anterior; Δ2 é a diferença entre a freqüência da classe modal e a classe posterior; hmo é a amplitude da classe que contém a moda; Exemplo: De acordo com informações obtidas de uma multinacional, o salário dos funcionários que possuem curso superior são: R$ 2500,00 – 3200,00 – 1800,00 – 1600,00 – 1900,00 – 2100,00 – 2500,00 – 2000,00 – 4500,00 – 4900,00 – 1500,00 – 3300,00 – 2500,00. Baseado nas informações da empresa determine: a) Qual o salário médio dos funcionários que possuem curso superior? b) Qual o salário mais freqüente? c) Qual o salário abaixo do qual ficaram 50% dos funcionários? RELAÇÕES ENTRE MÉDIA, MEDIANA E MODA Média = mediana = moda -> distribuição simétrica Média > Mediana > Moda -> distribuição assimétrica positiva Média < Mediana < Moda -> distribuição assimétrica negativa IMPORTANTE: A média é uma medida de tendência central adequada quando se supões que os valores têm uma distribuição razoavelmente simétrica.. EXERCÍCIOS 1) Calcule a média, mediana e moda dos seguintes dados. Interprete os resultados. a) Erros cometidos por um estagiário. Qual medida você escolheria para apresentar ao seu chefe se você fosse o estagiário? a) b) Gastos com reparos em máquinas. O que você pode concluir? a) Notas da turma 03 de CPE I. EXERCÍCIOS 2) Após um levantamento do número de faltas dos alunos um professor obteve uma média de 3 faltas. Contudo seu filho brincando apagou a freqüência de uma das classes dos valores obtidos. Obtenha esta freqüência que está faltando. No Faltas 0 2 3 Frequência 2 16 8 4 6 4 3) Calcule a medida de tendência central mais recomendável para os valores amostrais dados a seguir (JUSTIFIQUE): 1 33 35 37 39 39 40 40 41 42 42 43 43 43 44 759 4) Um professor para ajudar uma turma com média 5,2 na primeira prova resolveu dar a cada aluno 0,8 décimos de acréscimo por participação na aula. Qual será agora a nota média da turma?