Probabilidade e Estatística I – Antonio Roque – Aula 5 Média, Mediana e Moda para Dados Agrupados Se, por algum motivo, não se tiver acesso aos dados de uma amostra, mas apenas à sua tabela de freqüências ou ao seu histograma não será possível calcular exatamente os valores da sua média, da sua mediana e da sua moda. Neste caso, o melhor que se pode fazer é calculá-las aproximadamente. Tomemos como exemplo a tabela a seguir: Medidas da capacidade vital de 50 adultos do sexo masculino entre 18 e 27 anos de idade (Santa Casa de São Paulo, 1974). Capacidade Vital Freqüência Freqüência ( ) Acumulada 4,0 ├ 4,5 8 8 4,5 ├ 5,0 11 19 5,0 ├ 5,5 5 24 5,5 ├ 6,0 15 39 6,0 ├ 6,5 6 45 6,5 ├ 7,0 2 47 7,0 ├ 7,5 2 49 7,5 ├ 8,0 1 50 Total 50 Fonte: Depto. de Provas Funcionais Pulmonares - Santa Casa/SP. Para se calcular a média das medidas acima, que só são fornecidas na forma de uma tabela de freqüências, vai-se supor que todas as medidas que caem dentro de um intervalo de classe são iguais ao ponto médio daquele intervalo. Portanto, para cada intervalo calcula-se o seu ponto médio e considera-se que ele ocorre com a mesma freqüência da classe. Desta maneira, a aproximação que se faz para os dados desconhecidos deste problema é a seguinte: Dados (pontos médios das classes) Freqüências 4,25 4,75 5,25 5,75 6,25 6,75 7,25 7,75 Total 8 11 5 15 6 2 2 1 50 Considerando os dados da tabela aproximada como sendo os dados verdadeiros para o problema, basta agora usar a fórmula da média aritmética para obter a média da distribuição: 1 Probabilidade e Estatística I – Antonio Roque – Aula 5 8 ∑fx i x= i =1 8 ∑f i = 4,25 ⋅ 8 + 4,75 ⋅ 11 + 5,25 ⋅ 5 + 5,75 ⋅ 15 + 6,25 ⋅ 6 + 6,75 ⋅ 2 + 7,25 ⋅ 2 + 7,75 ⋅ 1 272 = = 5,44ℓ 8 + 11 + 5 + 15 + 6 + 2 + 2 + 1 50 i i =1 Para calcular a mediana, também teremos que fazer uma aproximação. Inicialmente, temos que determinar o intervalo de classe no qual ela se encontra. Como existem 50 dados, a mediana será a média entre o 25o e o 26o dado, portanto será o "dado" de ordem 25,5. Olhando na coluna das freqüências acumuladas da tabela, vemos que o dado de ordem 25,5 cai dentro do quarto intervalo de classe, que vai de 5,5 a 6,0. Portanto, já sabemos que a mediana tem que valer entre 5,5 e 6,0. Para encontrar um valor único, vamos fazer o seguinte raciocínio: Dentro do intervalo que vai de 5,5 a 6,0 temos 15 dados (veja na tabela). Não sabemos os valores exatos desses dados, mas vamos supor que eles varrem o intervalo de 5,5 a 6,0 de maneira uniforme. Como este intervalo tem 6,0 - 5,5 = 0,5 unidades, para distribuir 15 dados uniformemente por ele temos que por um dado a cada 0,5/15 unidades. O primeiro dado do intervalo é o 25o do total de 50 e será colocado em 5,5 + 1.(0,5/15). O segundo dado do intervalo é o 26o e será colocado em 5,5 + 2.(0,5/15). Os demais dados são posicionados de maneira equivalente até o 15o, que ficará em 5,5 + 15.(0,5/15) = 6,0. Como o dado correspondente à mediana é o 25,5, ou seja é o de ordem 1,5 dentro da série dos 15 dados a serem postos dentro do intervalo, o seu posicionamento será: 5,5 + 1,5.(0,5/15) = 5,5 + 0,05 = 5,55. De maneira genérica, podemos estimar a mediana de uma distribuição de dados agrupados a partir da fórmula: Md = Li + (P − f ai ). h fm , onde Li é o limite inferior da classe onde está a mediana, P é a posição da mediana no conjunto total dos dados (chamado de posto da mediana), fai é a freqüência acumulada até a classe anterior à classe onde está a mediana, h é a largura do intervalo de classe e fm é a freqüência da classe onde está a mediana. 2 Probabilidade e Estatística I – Antonio Roque – Aula 5 Usando esta fórmula para calcular a mediana para o exemplo dado, temos: Md = 5,5 + (25,5 − 24 ). 0,5 0,5 = 5,5 + 1,5. = 5,5 + 0,05 = 5,55 ℓ 15 15 Para se calcular a moda, basta obter o ponto central do intervalo de maior freqüência. No caso do exemplo, o intervalo de maior freqüência é o quarto, que vai de 5,5 a 6,0. Seu ponto central é 5,75 ℓ . Também pode-se falar de intervalo ou classe modal. Neste caso, a classe modal seria a classe de maior freqüência: 5,5 ├ 6,0 ℓ . Exemplo: Calcular a média, a mediana e a moda para a seguinte distribuição de freqüências. Medidas das larguras dos pulsos dos braços esquerdos de 45 alunos de ambos os sexos da turma de Estatística I (Biologia) do prof. Roque (2 o semestre de 1996). Largura do Pulso (cm) Freqüência 4,8 ├ 5,1 5,1 ├ 5,4 5,4 ├ 5,7 5,7 ├ 6,0 6,0 ├ 6,3 6,3 ├ 6,6 Total 8 16 3 5 9 4 45 Freqüência Acumulada 8 24 27 32 41 45 Média: 6 x= ∑ PM i i =1 i = 6 ∑f f 4,95 ⋅ 8 + 5,25 ⋅ 16 + 5,55 ⋅ 3 + 5,85 ⋅ 5 + 6,15 ⋅ 9 + 6,45 ⋅ 4 = 8 + 16 + 3 + 5 + 9 + 4 i i =1 = 250,65 = 5,57 cm 45 Mediana: A mediana é o 23 o dado, que cai na 2a classe, que vai de 5,1 a 5,4. Esta classe tem 16 elementos e a mediana é o 15 o deles. Portanto: 3 Probabilidade e Estatística I – Antonio Roque – Aula 5 Md = Li + (P − f ai ) h 0,3 0,3 = 5,1 + (23 − 8). = 5,1 + 15. = 5,1 + 0,28 = fm 16 16 = 5,38 cm Moda: A moda é o ponto médio da classe de maior freqüência. Portanto: Moda = 5,25 cm. A classe modal é a classe de maior freqüência. Logo: Classe modal = (5,1 a 5,4) cm. 4