O estudo que fizemos sobre distribuições de frequências, até agora, permite-nos descrever, de modo geral, os grupos de valores que uma variável pode assumir. Podemos localizar a maior concentração de valores, se ela se localiza no início, no meio ou no final, ou ainda, se há uma distribuição por igual. Porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se expressem através de números, que nos permitam traduzir essas tendências. Esses conceitos são denominados elementos típicos da distribuição e são: 1. Medidas de posição; 2. Medidas de variabilidade ou dispersão; 3. Medidas de assimetria; 4. Medidas de curtose. Na verdade esses elementos típicos da distribuição são parâmetros numéricos que podem fornecer informações sobre uma dada população. Em nosso estudo vamos priorizar: 1. Medidas de tendência central – MÉDIA, MODA e MEDIANA; 2. Medidas de separatrizes – MEDIANA, DERCIL, QUARTIL, PERCENTIL; 3. Medidas de dispersão – DESVIO MÉDIO, VARIÂNCIA, DESVIO PADRÃO e o COEFICIENTE DE VARIAÇÃO. Uma forma de descrever um grupo como um todo, utilizando uma única representação deste grupo é se servir de um valor em torno do qual os elementos do grupo se encontrem (MÉDIA). Outra maneira de realizar esta tarefa é escolher o elemento que mais se repete (MODA) neste grupo. Pode-se também organizar de forma crescente os elementos de grupo em questão e utilizar o elemento central (MEDIANA) como representante típico. •somam-se os n valores e divide-se o resultado por n; •só pode ser usada para dados quantitativos; •pode ser sempre calculada e é única; •é sensível a todos os valores do conjunto; •representa um ponto de equilíbrio/centro de gravidade: a soma dos desvios dos números, a contar da média é 0. •tem-se também as médias ponderada, geométrica e harmônica. Média Aritmética é o quociente da soma dos valores da variável pelo quantidade de valores somados: x x i n EXEMPLO 1: Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, qual a média diária de produção durante essa semana? x x i n 98 x 7 x 14 10 14 13 15 16 18 12 7 EXEMPLO 2: Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcule a média dessa distribuição. Nº de Meninos fi 0 2 1 6 2 10 3 12 4 4 Total 34 Neste caso, calculamos a média ponderada, em que além de levarmos em conta os valores da variável, também incluímos no cálculo a frequência com que cada um deles aparece na distribuição. Nº de Meninos fi 0 2 1 6 2 10 3 12 4 4 Total 34 x f x f i i i 0 2 1 6 2 10 3 12 4 4 x 34 78 x 34 x 2,3 meninos EXEMPLO 3: Consideremos a distribuição relativa a 40 estaturas. Calcule a média dessa distribuição. ESTAT. (cm) Freq. (fi) 128 134 1 134 140 3 140 146 6 146 152 6 152 158 12 158 164 5 164 170 3 170 176 1 176 182 1 182 188 2 Total 40 Neste caso, calculamos a média ponderada, apenas com a observação de que cada intervalo passa a ser representado pelo seu ponto médio. ESTATURA (cm) xi Freq. (fi) 128 134 131 1 134 140 137 3 140 146 143 6 146 152 149 6 152 158 155 12 158 164 161 5 164 170 167 3 170 176 173 1 176 182 179 1 182 188 185 2 Total 40 x f x f i i i 131 1 137 3 185 2 x 40 6182 x 40 x 154,55 cm •Quando desejamos obter uma medida de posição que possui a maior estabilidade; •Quando houver necessidade de um tratamento algébrico posterior; •Quando houver a necessidade de se adotar um valor representativo do conjunto de forma que este valor seja sensível a todos os demais (todos entram no cálculo da média); •é o valor de maior freqüência, aquele que mais se repete; •existem distribuições bimodais, com 3 modas, etc.; •nem sempre é única; •quando todos os valores ocorrem com freqüências semelhantes, a moda nada acrescenta à descrição; Por exemplo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa indústria. Quando lidamos com dados não agrupados, a moda é facilmente reconhecida, de acordo com a definição, basta procurar o valor que mais se repete. EXEMPLO 4: Qual a moda da série de dados 7, 8, 9, 10, 10, 10, 11, 12, 13, 15? Mo 10 EXEMPLO 5: Qual a moda da série de dados 3, 5, 8, 10, 12, 13, 14, 17, 19, 21? A série não apresentamoda AMODAL EXEMPLO 6: Qual a moda da série de dados 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9? Mo 4 e 7 BIMODAL EXEMPLO 7: Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcule a moda dessa distribuição. Nº de Meninos fi 0 2 1 6 2 10 3 12 4 4 Total 34 Mo 3 Cuidado! O que buscamos não é a maior frequência, mas sim, o valor da variável que tem a maior frequência. EXEMPLO 8: Consideremos a distribuição relativa a 40 estaturas. Calcule a moda dessa distribuição. Neste caso, primeiro identificamos a classe de maior frequência, a classe modal, depois calculamos o seu ponto médio, esse valor será a moda (também chamada de moda bruta). l5 L5 152 158 Mo 2 2 Mo 155 ESTAT. (cm) Freq. (fi) 128 134 1 134 140 3 140 146 6 146 152 6 152 158 12 158 164 5 164 170 3 170 176 1 176 182 1 182 188 2 Total 40 Para o cálculo da moda de distribuição de dados com intervalos de classe, há métodos mais elaborados, que nos dão valores mais exatos, como é o caso do FÓRMULA DE CZUBER. f i f ant Mo i h fi f ant fi f post li : limite inferior da classe modal h : amplitude da classe modal fi : frequência da classe modal fant : frequência da classe anterior à classe modal fpost : frequência da classe posterior à classe modal Também neste caso, primeiro temos que achar a classe modal (de maior frequência) EXEMPLO 9: Consideremos a distribuição relativa a 40 estaturas. Calcule a moda dessa distribuição. ESTAT. (cm) Freq. (fi) 128 134 1 134 140 3 140 146 6 146 152 6 152 158 12 158 164 5 6 Mo 152 6 67 164 170 3 170 176 1 176 182 1 36 Mo 152 13 182 188 2 Classe modal: 152 a 158. 12 6 Mo 152 6 12 6 12 5 Mo 154,76 cm Total 40 EXEMPLO 10: Calcule a moda da distribuição: Classe modal: 55 a 65. 18 12 Mo 55 10 18 12 18 14 6 Mo 55 10 64 Mo 55 6 Mo 61 O escore com maior número de alunos foi o 61 pontos. •Quando desejamos obter uma medida rápida e aproximada de posição; •Quando a medida de posição deve ser o valor mais típico da distribuição; •divide um conjunto ordenado de dados em dois grupos de igual quantidade: de um lado, valores maiores, de outro, menores; •pode ser sempre calculada e é única; •é insensível aos valores extremos do conjunto; •para número par de dados a mediana é a média entre os dois valores centrais. A Mediana é definida como o número que se encontra no centro de uma série de números, estando dispostos segundo uma ordem. Quando lidamos com dados não agrupados, a mediana é facilmente reconhecida, basta, de acordo com a definição, colocar os valores da variável em ordem e identificar aquele que fica no centro. EXEMPLO 10: Qual a mediana da série de dados 5, 13, 10, 2, 18, 15, 6, 16, 9? 2,5,6,9,10,13,15,16,18 Md 10 valor central EXEMPLO 11: Qual a mediana da série de dados 2, 6, 7, 10, 12, 13, 18, 21? 2 valores centrais :10 e 12 10 12 Md 2 Md 11 Nesse caso devemos determinar previamente as FREQUÊNCIAS ACUMULADAS, e após, determinar um valor tal que divida a distribuição de frequências em dois grupos que contenham o mesmo número de elementos. Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por: f i 2 Neste caso, é o bastante identificar a frequência acumulada onde está incluso o valor equivalente a metade da soma das frequências, e valor seguinte a esse número encontrado. EXEMPLO 12) Calcule a mediana da distribuição abaixo. Nº de Meninos fi 0 2 1 6 2 10 3 12 4 4 Total 34 Primeiro vamos determinar frequências acumuladas. as Nº de Meninos fi Fi f 0 2 2 2 1 6 8 2 10 18 3 12 30 4 4 34 O valor encontrado (17) está incluso na classe 3 (valor da variável 2) e o seguinte também. Total 34 - Md 2 i 34 17 2 No caso de existir uma frequência acumulada (Fi), tal que: Fi f i 2 Ou seja, o valor que corresponde à metade da soma cai numa classe, e o valor seguinte a ele cai noutra classe, a mediana será dada por: xi xi 1 Md 2 Isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa frequência acumulada e o seguinte. EXEMPLO 13) Calcule a mediana da distribuição abaixo. xi fi 12 1 14 2 15 1 16 2 17 1 20 1 Total 8 Primeiro vamos determinar frequências acumuladas. xi fi Fi f 12 1 1 2 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 Total 8 - i as 8 4 2 Esse valor (4) cai na classe 3 e o seguinte (5) na classe 4. 15 16 Md 2 Md 15,5 Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – CLASSE MEDIANA. Essa classe será aquela correspondente à frequência acumulada imediatamente superior a: f i 2 Depois de identificarmos a classe mediana, o próximo passo é definir em que ponto dessa classe está a mediana. Para isso, valor adotar a seguinte fórmula: fi Fant 2 h m d li fi Onde: li : limite inferior da classe mediana; Fant : frequência acumulada da classe anterior à classe mediana; fi : frequência simples da classe mediana; h : amplitude do intervalo da classe mediana; EXEMPLO 14: Consideremos a distribuição relativa a 40 estaturas. Calcule a mediana dessa distribuição. ESTAT. (cm) Freq. (fi) 128 134 1 134 140 3 140 146 6 146 152 6 152 158 12 158 164 5 164 170 3 170 176 1 176 182 1 182 188 2 Total 40 ESTAT. (cm) Freq. (fi) Fi f 2 128 134 1 1 134 140 3 4 140 146 6 10 146 152 6 16 152 158 12 28 158 164 5 33 164 170 3 36 170 176 1 37 176 182 1 38 182 188 2 40 Total 40 50% dos alunos possuem estatura máxima de 154 cm. i 40 20 2 Classe mediana: 152 a 158. fi Fant 2 h Md li fi Md 20 16 152 6 12 4 Md 152 6 12 Md 152 2 Md 154 EXEMPLO 15: A tabela abaixo representa os escores (pontuação) obtidos por um grupo de 58 alunos, matriculados em uma determinada disciplina. f 2 i 58 29 2 Classe mediana: 55 a 65. fi Fant 2 h Md li fi Md 50% dos alunos possuem escore máximo de 61,67 pontos. 29 17 55 10 18 120 Md 55 18 Md 55 6,67 Md 61,67 •Quando desejamos obter o ponto que divide a distribuição em partes iguais; •Quando há valores extremos que afetam de uma maneira acentuada a média; •A variável em estudo é salário.