2ª Edição D I S C I P L I N A Matemática e Realidade Medidas de tendência central: média, mediana e moda Autores Ivone da Silva Salsa Jeanete Alves Moreira Marcelo Gomes Pereira aula 08 Revisoras de Língua Portuguesa Janaina Tomaz Capistrano Sandra Cristinne Xavier da Câmara Governo Federal Presidente da República Luiz Inácio Lula da Silva Ministro da Educação Fernando Haddad Ilustradora Carolina Costa Secretário de Educação a Distância – SEED Ronaldo Motta Editoração de Imagens Adauto Harley Carolina Costa Universidade Federal do Rio Grande do Norte Diagramadores Bruno Cruz de Oliveira Maurício da Silva Oliveira Júnior Mariana Araújo Brito Thaisa Maria Simplício Lemos Reitor José Ivonildo do Rêgo Vice-Reitor Nilsen Carvalho Fernandes de Oliveira Filho Secretária de Educação a Distância Vera Lúcia do Amaral Secretaria de Educação a Distância- SEDIS Coordenadora da Produção dos Materiais Célia Maria de Araújo Projeto Gráfico Ivana Lima Revisores de Estrutura e Linguagem Eugenio Tavares Borges Marcos Aurélio Felipe Pedro Daniel Meirelles Ferreira Tatyana Mabel Nobre Barbosa Imagens Utilizadas Banco de Imagens Sedis (Secretaria de Educação a Distância) - UFRN MasterClips IMSI MasterClips Collection, 1895 Francisco Blvd, East, San Rafael, CA 94901,USA. MasterFile – www.masterfile.cpom MorgueFile – www.morguefile.com Pixel Perfect Digital – www.pixelperfectdigital.com FreeImages – www.freeimages.co.uk FreeFoto.com – www.freefoto.com Free Pictures Photos – www.fre-pictures-photos.com BigFoto – www.bigfoto.com FreeStockPhotos.com – www.freestockphotos.com OneOddDude.net – www.oneodddude.net Divisão de Serviços Técnicos Catalogação da publicação na Fonte. UFRN/Biblioteca Central “Zila Mamede” Salsa, Ivone da Silva. Matemática e realidade: interdisciplinar / Ivone da Silva Salsa, Jeanete Alves Moreira, Marcelo Gomes Pereira. – Natal, RN: EDUFRN Editora da UFRN, 2005. 292 p. 1. Métodos estatísticos. 2. Análise estatística. 3. Proporção e porcentagem. 4. Dados estaísticos. 5. Medidas de dispersão. I. Moreira, Jeanete Alves. II. Pereira, Marcelo Gomes. III. Título. ISBN 85-7273-287-X RN/UF/BCZM 2005/47 CDD 519.5 CDU 519.22 27/06/2007 Copyright © 2007 Todos os direitos reservados. Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização expressa da UFRN - Universidade Federal do Rio Grande do Norte. Apresentação J á vimos como é indispensável condensar adequadamente dados estatísticos para termos uma compreensão maior das informações sobre o fato ou fenômeno estudado. Agora, aprenderemos uma nova forma de resumi-los ainda mais através de medidas estatísticas conhecidas como medidas de tendência central, as quais são usadas para representar a série pesquisada. Elas nos informam sobre o comportamento da variável que a originou, isto é, nos dão uma idéia da tendência de todo um conjunto de dados. Nesta aula, você aprenderá a calculá-las e interpretá-las. Estudaremos a média aritmética, a mediana e a moda, que são muito importantes na fundamentação de análises e interpretações de observações estatísticas. Objetivos Nosso propósito é que você aprenda a calcular, interpretar e compreender a utilização das medidas de tendência central na análise exploratória de um conjunto de dados. Esperamos também que seja capaz de saber escolher, dependendo da situação, qual dessas medidas deve ser usada. 2ª Edição Aula 08 Matemática e Realidade 1 Média, mediana e moda: conceitos e cálculos s medidas de tendência central são valores que, de certa forma, e de maneira condensada, trazem consigo informações contidas nos dados estatísticos – sejam eles, populacionais ou amostrais. Elas funcionam como uma espécie de “medidas-resumo”, pois nos passam a idéia, digamos, do comportamento geral das observações estudadas. Podemos dizer ainda que elas são como valores de referência, em torno dos quais, os outros se distribuem. Quando estão associadas aos dados populacionais, são chamadas de parâmetros; quando são calculadas a partir de amostras, são denominadas estatísticas. Essa diferença ocorre porque os parâmetros são valores constantes (fixos), pois são calculados a partir de todos os dados de um certo conjunto, isto é, a população de interesse. Porém, se trabalhamos com amostras, as medidas estatísticas obtidas variarão de acordo com as observações que foram selecionadas. Por isso, elas não são valores fixos, pois dependem dos elementos da amostra particular que foi escolhida. A Veremos, agora, os conceitos e os cálculos de cada uma delas. Média Aritmética, ou simplesmente média, é uma medida que funciona como o ponto de “equilíbrio” de um conjunto de dados, é representada pela letra grega (devemos ler “mi”), quando seu cálculo é feito a partir de todos os valores de uma população. Se usamos dados amostrais para obtê-la, é referida como (lemos “Xis barra”). É a medida de tendência central mais popular (desde o início de nossa vida escolar, já nos habituamos com seu cálculo) e pelas suas propriedades matemáticas é bastante usada na Estatística Inferencial. Média Aritmética Há dois casos a serem considerados no cálculo da média. 1º Caso – Quando tratamos com dados isolados ou não tabelados. Por exemplo: suponha que suas notas em uma seleção para um curso de aperfeiçoamento foram 5,6; 4,8; 8,0; 8,6; 6,8; 9,4. Então, se todas têm o mesmo peso, sua média será: Portanto, sua média foi 7,2, concorda? Formalizando o que fizemos, definiremos a média da seguinte forma: 2 Aula 08 Matemática e Realidade 2ª Edição se representam as observações de uma amostra da variável X, então, sua média aritmética simples é definida como: Podemos escrever essa expressão de forma simplificada, utilizando a letra grega maiúscula sigma , devemos ler “sigma”, que é a notação usada para somatório. Ou seja, representa a soma de todos os valores assumidos pela variável X, desde até . Isso significa que o primeiro índice de é 1 e segue até o , este se encontra na parte superior do . Assim, podemos escrever a fórmula da média como: (equação 1) OBS.: preste atenção à sutileza: Quando nos referimos à variável de interesse, a notação utilizada é X (maiúsculo). Quando são valores assumidos por ela, denotamos por x (minúsculo). 2º Caso – Quando os dados estão organizados em uma tabela de freqüências. Começaremos com um exemplo, no qual as observações estatísticas são tabeladas, porém não agrupadas em intervalos. Retome a seguinte tabela, apresentada na aula 5. Tabela 1 – Pontuação no teste objetivo de Matemática, na amostra das turmas da 8a série/manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004. Pontuação (Xi) Nº de alunos (fi) (Freqüência observada) xi fi 4 2 4.2=8 5 8 5.8=40 6 10 60 7 15 105 8 12 96 9 7 63 Total 54 372 Fonte: Dados fictícios. Vimos que para calcular a média aritmética de um conjunto devemos somar todos os valores deste e dividir o resultado dessa adição pelo número de observações/valores. 2ª Edição Aula 08 Matemática e Realidade 3 Observe nessa tabela que a pontuação 4 (formalmente, temos, ) apareceu duas vezes . Assim, temos (isso é exibido na 3a coluna). Em relação à pontuação 5 (ou seja, ), observamos 8 ocorrências ( ). Daí, de modo similar, obtemos (confira na 3a coluna). Dessa forma, sucessivamente, calculamos todos os produtos . Isso é necessário porque a soma desses produtos representa a soma de todos os valores da distribuição, sendo, assim, indispensável para obtermos a média. Portanto, nesse caso, para essa amostra a pontuação média, é dada por: logo, pontos ou, arredondando, temos pontos. Para facilitar o cálculo da média, criamos, nessa tabela, uma coluna na qual registramos o produto de cada um dos valores assumidos pela variável X por suas respectivas freqüências. Quando somarmos esses produtos , o total representa a soma de todos os valores da distribuição (nesse exemplo, o resultado foi 372). A média será obtida dividindo-se esse total pelo número de observações da amostra, n , ou seja, pelo . somatório das freqüências, Formalizando esse processo de cálculo da média, quando os dados estão tabelados, mas não agrupados, teremos: sejam valores assumidos pela variável X e suas respectivas freqüências. Nesse caso, a média é dada por: De forma mais simplificada, podemos escrever: sendo (equação 2) 4 Aula 08 Matemática e Realidade 2ª Edição Atividade 1 Vamos ver o que aprendemos? Calcule a pontuação média no teste objetivo para a amostra das turmas da noite, cujos dados se encontram na aula 5, quando estudamos distribuição de freqüências. Agora, exploraremos o cálculo da média para dados tabelados e agrupados em intervalos de classe. Como não temos mais os valores originais, pois estes estão diluídos nas respectivas classes, usamos os pontos médios dos intervalos de classe, (xi’s,) para substituí-los. Nesse caso, o cálculo da média é basicamente o mesmo para dados tabelados e não agrupados que acabamos de expor. A única diferença é que os xi’s não são os valores originais, uma vez que quando agrupamos em intervalos, perdemos essa informação. Então, como fazemos para encontrar a média? Nós calculamos o ponto médio (xi) e o consideramos como representante de todos os valores da classe correspondente i. A partir daí, teremos, pois, como calcular a média: tomamos os valores teóricos da variável, xi’s, e suas respectivas freqüências e aplicamos a mesma fórmula utilizada para dados tabelados não agrupados em classes. Para ilustrar esse cálculo, considere a Tabela 2 a seguir, referente às médias trimestrais de Matemática da amostra das turmas da 8a série da manhã. Tabela 2 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8a série/ manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004. Notas (médias) Nº de alunos (fi) Ponto médio Xi xi fi 3 ` 4 2 3,5 7,0 4 ` 5 3 4,5 13,5 5 ` 6 7 5,5 38,5 6 ` 7 8 6,5 52,0 7 ` 8 14 7,5 105,0 8 ` 9 12 8,5 102,0 9 ` 10 8 9,5 76,0 Total 54 394,0 Fonte: Dados fictícios. 2ª Edição Aula 08 Matemática e Realidade 5 Assim, nesse exemplo, teremos: . Daí: Atividade 2 Calcule a média das notas trimestrais para a amostra das turmas da 8a série/ manhã, na E. E. Nair Burégio, município de Carapeba cujos dados estão na tabela a seguir. Compare esse resultado com o que calculamos para a turma da manhã. O que você pode concluir sobre o desempenho dessas turmas? Tabela 3 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8a série/noite, na E. E. Nair Burégio, município de Carapeba, em abril de 2004. Notas (médias) Nº de alunos (fi) 3 ` 4 6 4 ` 5 12 5 ` 6 14 6 ` 7 8 7 ` 8 5 8 ` 9 4 9 ` 10 3 Total 52 Fonte: Dados fictícios. Atenção! A média, apesar de ser uma medida bastante utilizada para representar um conjunto de dados, tem uma desvantagem: ela é afetada por valores extremos. O que isso significa? Para calcular a média , é necessário somarmos todos os dados da série, ou seja, essa medida leva em conta todas as observações. Por isso, quando temos uma situação em que aparecem alguns valores, ou muito baixos, ou muito altos, se comparados com os demais elementos da série (esses são os que chamamos de “extremos”), a média é influenciada por eles. 6 Aula 08 Matemática e Realidade 2ª Edição Atividade 3 Considere os conjuntos que se seguem: A={2,3,5,6} e B={2,3,5,26}. Calcule a média para cada um deles e observe como o valor 26, no conjunto B, “puxou” a média para cima. Mediana (Md) Mediana (Md) é definida como o valor que ocupa a posição central em um conjunto de dados ordenados. Conseqüentemente, ela tem a propriedade de dividir um conjunto de observações em duas partes iguais quanto ao número de seus elementos: o número de dados que são menores ou iguais à mediana é o mesmo que o número de dados que são maiores ou iguais a ela. Dessa maneira, afirmamos que 50% das observações que compõem um conjunto qualquer de dados estatísticos são menores ou iguais à observação correspondente à sua mediana, e, conseqüentemente os 50% restantes, são observações maiores ou iguais a essa medida. Ao contrário da média, a mediana não é influenciada por valores extremos, visto que ela é uma medida essencialmente vinculada à posição que ocupa no conjunto ordenado. Assim, se algum valor for demasiado grande ou pequeno – valores extremos –, estes não afetarão o cálculo da mediana, já que não alterarão a ordem. Por exemplo, sejam os conjuntos A e B: A = { 1, 2, 1000 } e B = { 1, 2, 10 }. Em ambos, a mediana é 2, ou seja, ao se trocar o 10 por 1000, ela não sofreu alteração. Por isso, quando trabalhamos com observações que apresentam valores extremos, optamos por usar a mediana ao invés da média, pois ela representará melhor dados que têm essa característica. Para encontrar a mediana em um conjunto qualquer de dados estatísticos, precisamos conhecer a posição que ela ocupa em relação aos n elementos ordenados desse conjunto. Para tal, devemos considerar duas situações para as quais adotaremos distintos procedimentos: 1o Caso – Quando os dados se apresentam isolados ou então quando estão tabelados, porém não agrupados em intervalos de classes. Em tais circunstâncias, estamos diante de dados discretos, ou pelo menos, tratados como tal, e, para encontrar a mediana, precisamos primeiramente construir o rol. Em seguida, devemos calcular o elemento mediano ( ). O que é isso? É a posição que a mediana ocupa no conjunto ordenado. Para obtê-la, é indispensável verificar se n (o número de observações do conjunto de dados) é par ou ímpar, pois, dependendo dessa informação, procederemos de maneira distinta. 2ª Edição Aula 08 Matemática e Realidade 7 Veremos cada caso: • se n for ímpar Quando n é ímpar haverá apenas um valor central no conjunto ordenado, cuja posição é calculada pela fórmula: A mediana que representamos por Md será exatamente o valor que está nessa posição, considerando-se os n valores ordenados. Escrevemos assim: (equação 03) . Desse modo, para encontrá-la, deveremos apenas localizar a observação que, na série ordenada, ocupa essa posição. Não há, portanto, nenhum cálculo a mais a ser feito. Essa expressão nos diz que a mediana é o valor x que se encontra na posição Acompanhe agora os seguintes exemplos: Exemplo 1 – Para dados isolados Suponha que estivéssemos interessados em calcular a mediana em relação ao resultado de um teste objetivo de conhecimentos gerais aplicado a um grupo de 7 alunos da 8a série/ noite da E. E. Nair Burégio, município de Carapeba, em abril de 2004, cujas pontuações foram: 5, 8, 6, 3, 7, 5, 9. Começamos ordenando os valores. Eis o rol: 3, 5, 5, 6, 7, 8, 9. Em seguida, calculamos a posição da mediana neste conjunto, ou seja, o elemento mediano (EMd). Nesse caso, n=7 (há sete observações portanto n é ímpar); então teremos: Atenção: esse número 4 não é a mediana, ele significa que a pontuação mediana desse grupo de alunos será exatamente o 4o elemento no conjunto de dados ordenados, isto é: 1o, 2o, 3o, 4o Concluímos então que nesse conjunto, a mediana será: . Observe, ainda, que esse valor divide o conjunto, de modo que há tantos valores menores (ou iguais) quanto maiores (ou iguais) do que ele. 8 Aula 08 Matemática e Realidade 2ª Edição Exemplo 2 – Veremos agora como obter a mediana para dados tabelados, não agrupados em intervalos de classe. Vamos encontrar a idade mediana dos 75 alunos que a Tabela 4, logo a seguir, exibe. Tabela 4 – Distribuição das idades de uma amostra de alunos do Ensino Fundamental II do turno matutino da E. E. Nair Burégio, município de Carapeba, em abril de 2004. Idades (Xi) Nº de alunos (fi) F# 10 5 5 do 1º até o 5º 11 15 20 do 6º até o 20º 12 20 40 do 20º até o 40º 13 14 54 14 18 72 15 3 75 Total 75 Fonte: Dados fictícios. Temos um conjunto com as idades de 75 crianças (n = 75, logo, n é ímpar). OBS.: A variável idade é contínua. Porém, ela está sendo tratada como discreta, supondo-se que houve muitas repetições nos valores relacionados. O procedimento para calcular o elemento mediano (a posição da mediana) é o mesmo utilizado no exemplo 1. No entanto, como os dados estão tabelados, localizamos a mediana por meio das freqüências acumuladas (3a coluna dessa tabela), uma vez que, ao acumularmos as freqüências, estamos ordenando os dados. Para n = 75 (n ímpar), o elemento mediano é: Esse resultado significa que, nessa série, a idade que ocupa a 38a posição é a mediana. Como localizamos o 38o valor? Analise a coluna das freqüências acumuladas “abaixo de” . Você observará que a menor idade “10 anos" se repetiu 5 vezes, logo, o valor 10 ocupou da 1a até a 5a posição nessa série ; além disso, 11 anos se repetiu 15 vezes, dado que se encontra do 6o ao 20o lugar ; o número de alunos com 12 anos foi 20 e sua freqüência acumulada foi , significando que essa idade aparece desde a 21a até a 40a colocação. Portanto, a mediana, o valor que se encontra na 38a posição é 12 anos. Escrevemos anos. Atenção! O elemento mediano, EMd , nos informa apenas sobre a posição da mediana na série ordenada. Ele não é o valor dessa medida. Assim, somente após calculá-lo, podemos localizar tal posição no conjunto de dados ordenados. 2ª Edição Aula 08 Matemática e Realidade 9 se n for par Nesse caso, haverá dois valores centrais, os quais se encontram nas posições: e A mediana em tais situações é definida como a média aritmética desses dois valores centrais. Portanto, quando n é par, devemos calcular essas duas posições e depois encontrar, na série ordenada, os dados a elas correspondentes, isto é, e ; com esses dois valores, calculamos a média e obtemos a mediana: (equação 4) ATENÇÃO! O cálculo dessa medida é feito tomando-se as duas observações centrais da série ordenada de dados. Não se confunda: você não deve calculá-la com os valores obtidos pelas expressões e , pois os resultados fornecidos por essas fórmulas representam apenas as posições centrais e não os valores que buscamos. Para um melhor entendimento, acompanhe os exemplos a seguir: Exemplo 3 Suponha a mesma situação do exemplo 1, acrescentando mais um dado: 5, 8, 6, 3, 7, 5, 9, 10. Portanto, agora temos um número par de observações (n = 8), logo, teremos dois elementos centrais nesse conjunto. Como antes, primeiro ordenamos os dados: 3, 5, 5, 6, 7, 8, 9, 10 Depois, calculamos as duas posições centrais. Teremos então: e Para tanto, precisamos localizar o 4o e o 5o elemento. Nesse conjunto ordenado, a posição 4 corresponde ao valor 6 e em relação ao 5o elemento encontramos o valor 7. Conhecendo esses dois valores centrais, finalmente, calculamos a pontuação mediana: 10 Aula 08 Matemática e Realidade pontos. 2ª Edição Exemplo 4 Consideraremos novamente a pontuação no teste objetivo de Matemática na amostra das turmas da manhã, exibida na Tabela 5 a seguir: Tabela 5 - Pontuação no teste objetivo de Matemática, na amostra das turmas da 8a série/manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004. Idades (Xi) Nº de alunos (fi) F# 4 2 2 5 8 10 6 10 20 7 15 35 8 12 47 9 7 54 Total 54 Fonte: Dados fictícios. Sendo n par , precisaremos calcular as duas posições centrais. Em seguida, identificaremos quais valores correspondem a elas. Isso é feito a partir das freqüências acumuladas (3a coluna). Essas posições são: 27a e 28a . Com essas informações, examinamos na tabela, as freqüências acumuladas para localizar essas posições (faremos isso de maneira análoga ao que fizemos no exemplo 2). A Tabela 5 nos informa que 4 (o menor valor observado) se repetiu 2 vezes, assim, ele está associado aos dois primeiros lugares: 1o e 2o . Em seguida, aparece 5, que ocorreu 8 vezes e, portanto, ficou da 3a até a 10a posição (a freqüência acumulada desse dado, , quer dizer “até o 10o lugar”). Prosseguindo, temos o 6 que apareceu 10 vezes, ficando da 11a a 20a posição. Veja que . Depois, observamos que o 7 teve freqüência 15 e ocupou todas as posições desde a 21a até a 35a . Isto é: 21a , 22a , 23a . . . 35a . Portanto, nessa série, a pontuação 7 é tanto o 27o , como o 28o elemento. Assim, 2ª Edição pontos. Aula 08 Matemática e Realidade 11 2º Caso – Dados tabelados agrupados em intervalos de classes. Para este caso, não importa se n é par ou ímpar, pois estamos considerando a variável estudada como sendo contínua. Nessa condição, a distribuição terá um único valor central ). que será a mediana, cuja posição é dada por (lembre-se de que Após calcular esse elemento mediano ( ), podemos, então, localizar na tabela, através das freqüências acumuladas , a classe na qual se encontra a referida medida de tendência central. Esse procedimento é fundamental para o cálculo da mediana, pois é exatamente essa classe (intervalo) que devemos ter como referência para obter as informações numéricas necessárias, usadas na fórmula da mediana, que tem a seguinte expressão: equação 5 O que significam essas notações? Preste bem atenção: é o limite inferior dessa classe; é a freqüência acumulada anterior a esse intervalo; é a freqüência simples dessa classe; é a amplitude desse intervalo. Conhecendo todos esses valores e ainda sabendo quanto vale o , já calculado, podemos finalmente encontrar a mediana. A seguir, com o exemplo 5, mostraremos o que acabamos de expor e calcularemos a mediana, para esses casos. 12 Aula 08 Matemática e Realidade 2ª Edição Exemplo 5 Considere os dados da Tabela 6, apresentada a seguir. Tabela 6 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8a série/ manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004. Classe Mediana Idades (Xi) Nº de alunos (fi) F# 3 ` 4 2 2 4 ` 5 3 5 5 ` 6 7 12 6 ` 7 8 20 7 ` 8 14 8 ` 9 12 46 9 ` 10 8 54 Total 54 FMd Fant 34 Fonte: Dados fictícios. Para determinar a nota mediana desses alunos, devemos inicialmente, de modo análogo ao que fizemos antes, encontrar a posição dessa medida, isto é, calcular o . Teremos que , independentemente de n ser par ou ímpar. Portanto, encontramos: . (Não esqueça, n é o tamanho da amostra, logo ) Como os dados estão distribuídos por intervalos, esse resultado nos informa que a mediana é o valor que, nessa distribuição, está situado no 27o lugar. Com essa indispensável informação, procuramos localizar a classe em que está a mediana (a que contém a mediana) por intermédio das freqüências acumuladas . Analisando a terceira coluna dessa tabela, descobrimos que a mediana está no intervalo . Como chegamos a essa conclusão? Porque, de acordo com as freqüências acumuladas, há 20 alunos com notas abaixo de 7, ou seja, o vigésimo valor está no intervalo e depois vêm os 14 elementos da classe que ocupam, portanto, as posições seguintes; isto é, desde a 21a até a 34a posição. Logo, a 27a (que é a da mediana) faz parte do intervalo de . Agora que já sabemos desse fato (o intervalo onde está a mediana), voltamos à Tabela 6 e, em relação a esse intervalo, encontramos os valores: , limite inferior da classe (onde está a mediana); , freqüência acumulada da classe (essa é a classe anterior à que contém a mediana); , freqüência simples do intervalo ; , tamanho do intervalo de classe. Substituindo todos esses valores, e também aquele referente ao , na fórmula , teremos que a nota mediana em Matemática na amostra das turmas da manhã é 2ª Edição Aula 08 Matemática e Realidade 13 Concluímos, portanto, que metade da turma (50%) obteve uma média igual ou inferior a 7,5 e o restante (os outros 50%) apresentou nota igual ou superior a 7,5 pontos. Atividade 4 Calcule a nota mediana para a amostra da turma da noite (Tabela 3) e compare o resultado com a turma da manhã. Moda (Mo) Por definição, a moda de um conjunto de dados é o valor que aparece mais vezes, ou seja, é aquele que apresenta a maior freqüência observada. Há situações nas quais ela não é única, pois pode acontecer de se ter, em uma série estatística, duas ou mais observações que tenham se destacado de forma idêntica, isto é, que tenham ocorrido com a mesma freqüência máxima. Então, conforme o caso, teremos distribuições bimodais (duas modas), trimodais ou multimodais. Também é possível acontecer que todos os elementos tenham apresentado exatamente o mesmo número de ocorrências. Isso significa que não há moda, pois nenhum dado se destacou; o conjunto é, então, chamado amodal. Dentre as três medidas de tendência central, a moda é a única que pode ser usada quando as variáveis são qualitativas nominais (vimos isto na aula 2, lembra?). Por exemplo, se distribuíssemos os alunos da amostra da turma da manhã (do exemplo que estamos trabalhando) por sexo e obtivéssemos que 70% são meninas, poderíamos dizer que a moda é o sexo feminino, pois essa categoria apresentou a maior freqüência. Da mesma forma que a mediana e a média, para se obter a moda, devemos considerar dois casos que a seguir especificamos. 1o Caso – Dados isolados não tabelados ou tabelados, porém não agrupados em intervalos de classes. Nesses casos, a moda é obtida apenas por uma simples inspeção em relação às repetições dos valores. No caso das tabelas, observaremos as freqüências absolutas simples ( ). Procuramos, então, qual(is) o(s) valor(es) que apresenta(m) o maior número de ocorrências (repetições). Este(s) valor(es) é (são) denominado(s) moda. 14 Aula 08 Matemática e Realidade 2ª Edição Exemplo 7 Vamos considerar os seguintes conjuntos e verificar se em cada um existe moda, especificando o seu valor: A = {2, 2, 2, 3, 3, 4, 5, 5, 6, 6, 7, 7, 7, 7, 7, 8, 8, 9, 9, 9} B = {1, 3, 4, 5, 7, 8} C = {2, 2, 2, 2, 4, 4, 5, 5, 5, 5, 7, 8, 8, 9, 9} D = {2, 2, 4, 4, 5, 5, 6, 6, 7, 7} Observe que em A, o dado que mais se repetiu foi 7 (ele apareceu mais vezes). Assim, 7 é a moda. Escrevemos . Em B e em D, nenhum valor se destacou, pois em cada um deles seus respectivos elementos se apresentaram com a mesma freqüência (em B, todos têm apenas uma ocorrência e em D, todos se repetem duas vezes). Logo, B e D não têm moda; são chamados de amodais. Em C, há dois valores que apareceram com a (mesma) maior freqüência: o 2 e o 5 (cada um deles se repetiu 4 vezes). Portanto, o conjunto é bimodal com modas: e Exemplo 8 Retornaremos agora à Tabela 5, apresentada nesta aula. Qual a pontuação modal dos alunos? Para responder a essa pergunta, basta apenas você examinar a coluna das freqüências absolutas simples, e verificar qual foi a maior delas. Observe que a freqüência máxima observada ( ) foi 15. Esse valor (15) não é a moda, ele apenas indica que a moda é igual a 7,0 ( ). Isso quer dizer que a nota 7,0 foi a que mais ocorreu no conjunto de dados, ou seja, foi a mais repetida entre as notas obtidas pelos alunos no teste objetivo de Matemática. 2º Caso – Dados tabelados agrupados em intervalos de classes Nesse caso, tem sentido falar em Classe Modal – É aquela que apresenta a maior freqüência em uma distribuição. Moda Bruta ( ) – É definida como o ponto médio da classe modal. Essa é a maneira mais simples para se encontrar a moda e, em geral, nos dá um valor aproximado dela. Moda calculada pelo método de Czuber – Esse método considera, além da freqüência simples da classe modal ( ), as freqüências dos intervalos adjacentes ao modal (anterior e posterior). A fórmula proposta por Czuber para obter a moda é: 2ª Edição Aula 08 Matemática e Realidade 15 (equação 6) O símbolo é a letra grega chamada delta. Temos aí (lemos: “delta um”) e (“delta dois”). Vamos ver o que eles significam, nessa equação? Tomando-se o intervalo que contém a moda, como referência, temos: é o limite inferior dessa classe; é a diferença entre a freqüência simples desse intervalo e a freqüência simples do intervalo anterior à da classe modal . Isto é: ; é a diferença entre a freqüência simples da classe modal e a freqüência simples do intervalo posterior à da classe modal . Ou seja: ; é o tamanho desse intervalo. Vamos encontrar a moda pelos dois métodos, bruta e Czuber, a partir dos dados da Tabela 6. Ela exibe as notas de Matemática da amostra da 8a série/manhã. Para ambos os métodos, o primeiro passo é identificar a classe modal. Não esqueça que a classe modal é aquela na qual está registrada a maior freqüência simples. Faça agora uma inspeção na coluna dessas freqüências e verifique qual é a máxima. Confira: o resultado foi 14, você concorda? Concluímos que a classe modal é , pois esse intervalo apresenta essa maior ocorrência. Tomando-o como referência, temos todos os elementos necessários para obtermos a moda pelos dois processos, ou seja, Moda Bruta (o método mais simples) é o ponto médio da classe . Temos que: (limite inferior) e (limite superior). Logo, o ponto médio desse intervalo será: . Conseqüentemente, a pontos; Moda por Czuber (o mais elaborado) Sabendo que é o intervalo modal (de referência), então, o anterior é e o posterior é . Consultando a tabela, temos as freqüências de cada uma dessas classes, as quais são: . 16 Aula 08 Matemática e Realidade 2ª Edição Daí, é o limite inferior da classe ; é o tamanho do intervalo. Aplicando-se a fórmula, temos que a moda nessa amostra é: Teoricamente, a interpretação que damos é que 7,75 foi a nota que mais se repetiu nessa amostra. Atividade 5 Calcule a nota modal para a amostra da turma da noite (Tabela 3) e compare o resultado com a da manhã. O que você pode concluir sobre o desempenho dos alunos, a partir desses dois resultados? Qual medida de tendência central devemos usar? Acabamos de explicar três medidas estatísticas conhecidas como Medidas de Tendência Central ou Medidas de Posição. Elas têm a finalidade, como já comentamos no início desta aula, de sintetizar as informações de um conjunto de dados resumindo-as em um único valor. Uma vez que o objetivo das três é semelhante, talvez você agora esteja se perguntando: quando devo usar a média? E a moda? E a mediana? Se estamos diante de uma situação na qual essas três medidas apresentam o mesmo valor, tal fato nos informa que a distribuição dos dados é simétrica; quando resultam em valores diferentes, porém muito próximos, indica que a forma dessa distribuição é aproximadamente simétrica. Nesses casos, optaremos por qualquer uma das três: média, moda ou mediana. Nos demais casos, devemos analisar as especificidades da situação estudada e escolher entre elas a mais adequada. A seguir, apresentamos um quadro de resumo que irá ajudá-lo a optar por uma das três, embora nada o impeça de calcular todas elas. 2ª Edição Aula 08 Matemática e Realidade 17 Média Mediana Moda • Quando a distribuição dos • Quando há valores • Quando trabalhamos dados é aproximadamente discrepantes no com variáveis qualitativas simétrica e não apresenta conjunto de dados, nominais, a moda é a única valores extremos, devemos devemos preferir a medida de tendência central escolher a média, pois essa mediana, pois ela é que podemos obter. Além medida possui propriedades uma medida que não disso, quando queremos matemáticas mais fortes e é é afetada por valores evidenciar o valor que mais muito usada para estimar a extremos.Podendo apareceu (se repetiu) em um média da população quando se assim representar conjunto de dados, também faz inferências. Além disso, é bem esses valores. usamos a Moda. fácil de ser calculada e a mais popular dentre essas medidas Resumo Nesta aula, conhecemos as medidas de tendência central: média aritmética, mediana e moda. Vimos que elas servem para resumir informações sobre um conjunto de dados ajudando-nos a descrevê-los. Estudamos seu cálculo, considerando valores isolados e também quando estão organizados em tabelas de freqüências (agrupados ou não). Além disso, enfatizamos a interpretação de tais medidas, explicando, inclusive, as peculiaridades de cada uma e orientando a escolha adequada, de acordo com as especificidades da situação pesquisada. Auto-avaliação 18 Aula 08 1 Pergunte a vinte pessoas entre seus familiares e/ou vizinhos, a idade de cada um e forme uma amostra (de tamanho n = 20). Organize esses dados em uma tabela e calcule a idade média, a mediana e a idade modal dessa amostra. 2 Procure saber a temperatura mensal do seu município durante todos os meses do ano de 2004. Com esses 12 dados, determine as temperaturas média, mediana e modal do referido ano. Matemática e Realidade 2ª Edição 3 Responda, justificando com seus argumentos, às questões seguintes: a) quando você não deve escolher a média para representar seu conjunto de observações estatísticas? b) toda distribuição tem moda e mediana? c) quando seus dados forem qualitativos nominais, podemos usar como medida de tendência central: a média? a mediana? a moda? d) em que situação acontece de se ter a média, a moda e a mediana iguais? Dê um exemplo. Referências BARBETTA, P. A. Estatística aplicada às ciências sociais. Florianópolis: Ed. da UFSC, 2002. BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 4.ed. São Paulo: Atual, 1987. (Métodos quantitativos). LARSON, R.; FARBER, B. Estatística aplicada. Tradução de Cyro de C. Patarra. São Paulo: Prentice Hall, 2004. TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2.ed. São Paulo: Atlas, 1986. TRIOLA, M. F. Introdução à estatística. Tradução Alfredo Alves de Farias. 7.ed. Rio de Janeiro: LTC, 1999. VIEIRA, S. Introdução à bioestatística. 3.ed. Rio de Janeiro: Campus, 1980. 2ª Edição Aula 08 Matemática e Realidade 19