Centro Universitário Franciscano Material elaborado por: Professora Leandra Anversa Fioreze e Professor Clandio Timm Marques. Distribuição de Freqüências Por constituir-se o tipo de tabela importante para a Estatística Descritiva, faremos um estudo completo da distribuição de freqüências. Uma distribuição de freqüências condensa um grande número de dados numa tabela, de modo que 100, 200, 500 ou um número qualquer de valores pode ser representado em poucas linhas. É uma série estatística específica em que os dados encontram-se dispostos em classes ou categorias juntamente com suas freqüências correspondentes. Podemos dividir as distribuições de freqüências em dois tipos: Tipo A ou Tipo I Usada para variáveis qualitativas ou quantitativas discretas com poucos valores diferentes. As observações são representadas em uma tabela de freqüências, não agrupadas em classes. Exemplos: número de acidentes de trabalho na Empresa X; quantidade de livros de estatística na biblioteca da UNIFRA. Eis um exemplo de distribuição de freqüências para variável discreta (tipo A): Tabela 1 - Número de acidentes de trabalho em pequenas empresas da cidade de Porto Alegre - 2008 Número de Acidentes (Xi) 0 1 2 3 4 5 ou mais Total Número de Empresas (fi) 35 20 13 6 4 2 80 Xi = identifica as categorias em que o fato se subdivide. fi = corresponde a freqüência absoluta, isto é, o número de vezes que cada uma das categorias ocorre. N = soma dos fi = total de elementos observados na população. n = soma dos fi = total de elementos observados na amostra. Tipo B ou Tipo II Usada para variáveis quantitativas contínuas ou discretas com muitos valores diferentes, sendo as variáveis observadas representadas sob a forma de intervalos. Geralmente esta variável provém de medições. 13 Centro Universitário Franciscano Material elaborado por: Professora Leandra Anversa Fioreze e Professor Clandio Timm Marques. Exemplos: peso dos alunos de uma classe; tempo de duração de um transistor; nota de aproveitamento dos alunos. Eis um exemplo de distribuição de freqüências para variável contínua (Tipo B) X = Notas finais de 50 estudantes da disciplina de estatística 22 46 9 40 57 22 22 13 50 42 35 2 15 41 34 52 32 75 69 44 26 42 60 56 30 3 17 79 45 37 0 12 62 50 45 41 59 11 66 39 43 33 70 50 47 20 36 40 67 29 Então a distribuição de freqüência será expressa pela tabela: Tabela 2 – Notas finais dos estudantes da disciplina de Estatística – 2009/1 Notas 0 10 10 20 20 30 30 40 40 50 50 60 60 70 70 80 Total fi 4 5 6 8 12 7 5 3 50 Onde fi é a freqüência absoluta das classes. 1. Dados Brutos São os dados originais conforme eles foram coletados, não estando, portanto, numericamente organizados ou tabelados. Como exemplo tem-se as 50 notas dos alunos. 2. Rol É uma lista, onde os valores são dispostos em ordem crescente ou decrescente. No exemplo das notas, o rol é: 0 2 3 9 11 12 13 15 17 20 22 22 22 26 29 30 32 33 34 35 36 37 39 40 40 41 41 42 42 43 44 45 45 46 47 50 50 50 52 56 57 59 60 62 66 67 69 70 75 79 3. Amplitude Total (H) É a diferença entre o maior valor e o menor valor observado da variável em estudo. 14 Centro Universitário Franciscano Material elaborado por: Professora Leandra Anversa Fioreze e Professor Clandio Timm Marques. H = Xmáx - Xmín No nosso caso, a nota maior é 79 é a menor é 0; logo, nossa amplitude total é H = 79 - 0 = 79. Cumpre observar que, quando não dispusermos dos dados, o cálculo da amplitude se fará levando-se em consideração a diferença entre o limite superior da última classe e o limite inferior da primeira classe. 4. Limites de Classe: São os números extremos de cada intervalo: sendo assim, temos um limite inferior e um superior. Se a primeira classe tiver um intervalo de notas de 0 até 10, o 0 será o limite inferior enquanto que o 10 será o limite superior desta classe. 5. Classe: É cada um dos intervalos em que os dados são agrupados. Existem várias maneiras de apresentarmos o intervalo de classes: iguais ou diferentes entre si. Porém, sempre que possível, deveremos optar por intervalos iguais, o que facilitará os cálculos posteriores. Mas mesmo com intervalos iguais, as distribuições poderão apresentar-se da seguinte forma: 0 —10: compreende todos os valores entre 0 e 10, exclusive os extremos. 0 10: compreende todos os valores entre 0 e 10, inclusive os extremos. 0 10: compreende todos os valores entre 0 e 10, inclusive o 10 e exclusive o 0. 0 10: compreende todos os valores entre 0 e 10, inclusive o 0 e exclusive o 10. Como optaremos por este último tipo (0 10), poderemos definir como intervalo de classe a diferença entre o limite superior e o limite inferior da classe. Portanto, no exemplo, 10 – 0 = 10 é o intervalo ou amplitude da classe que será representado pela letra h. 6. Ponto médio das classes (Xi): É a média aritmética entre o limite superior e o limite inferior da classe. Assim, se a classe for 0 10, teremos classe. 0 + 10 = 5, que será o ponto médio da 2 7. Número de Classes Quantas classes serão necessárias para representar o fato? Existem vários critérios que podem ser utilizados a fim de determinar o número de classes, porém tais critérios servirão apenas como indicação e nunca como regra fixa, pois caberá sempre ao pesquisador estabelecer o melhor número, levando-se em conta o intervalo de classe e a facilidade para os posteriores cálculos numéricos. Neste estudo, destacaremos a Fórmula de Sturges, que estabelece que o número de classes K é calculado por: K = 1 + 3,3 log n onde n = número de elementos observados. No nosso exemplo, teríamos: 15 Centro Universitário Franciscano Material elaborado por: Professora Leandra Anversa Fioreze e Professor Clandio Timm Marques. K = 1 + 3,3 log n K = 1 + 3,3 log 50 arredondando: 7 classes. K = 1 + 3,3(1,69897) K = 1 + 5,6 = 6,6 ou 8. Amplitude das Classes (h) h=H k No exemplo anterior, a amplitude de cada classe será: amplitude total 79 h= 11,29 12 número de classes 7 Obs. 1: Na amplitude das classes (h), observe que aumentamos uma unidade, não seguindo, portanto, as regras de arredondamento. Esta é uma regra que deve ser sempre seguida no cálculo da amplitude da classe. Você saberia me dizer por quê? Obs. 2: Deve-se conservar o número de casas decimais dos dados observados. Por exemplo, se os dados se referem à massa de indivíduos em kg e forem expressos com uma casa após a vírgula (por exemplo, 60,5 kg), então a amplitude deverá ter uma casa após a vírgula. Obs. 3: Usando o bom-senso e a experiência, poderá ser conveniente , quando possível, a utilização da amplitude de um intervalo de classe igual a 10 ou 5, facilitando as operações posteriores. 9. Freqüência acumulada (Fi): Corresponde à soma das freqüências de determinada classe com as anteriores. No exemplo, a freqüência acumulada da 4a classe será: f1 + f2 + f3 + f4 = 4 + 5 + 6 + 8 = 23. 10. Freqüência relativa (fri): Corresponde ao quociente entre a freqüência absoluta da classe e o total de elementos. No exemplo, a freqüência relativa da 7a classe é: f7 5 f r7 0,1 n 50 EXERCÍCIOS 01. Uma indústria embala peças em caixas com 100 unidades. O controle de qualidade selecionou 48 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Obteve os seguintes dados: 2 0 0 4 3 0 0 1 0 0 1 0 1 0 2 3 1 0 1 0 1 0 1 2 1 0 1 0 0 1 0 0 1 2 0 2 0 0 0 0 0 0 0 0 0 0 1 0 Agrupe, por freqüência estes dados. 16 Centro Universitário Franciscano Material elaborado por: Professora Leandra Anversa Fioreze e Professor Clandio Timm Marques. 02. Abaixo temos o quadro que compõe os dados brutos. Responda: a) Quantas indústrias foram investigadas? b) Qual a menor tempo de produção registrado? c) Qual a maior tempo de produção registrado? d) Qual o tempo de produção diária que detêm o maior numero de indústrias? e) Identifique: X2 = f5 = Σ fi = X8 = n= f7 = 03. Considere as notas de um teste de inteligência aplicado a alunos de um estabelecimento de ensino: Construa a distribuição de freqüências com intervalo de classes e responda: a) Quantos alunos participaram do teste? b) Qual a menor nota registrada? c) Qual é o numero de classes? d) Qual é a terceira classe? e) Qual é a amplitude total da amostra? f) Qual é a amplitude total da distribuição? g) Qual é o limite superior da quarta classe? h) Qual é o limite inferior da sétima classe? i) Qual é a amplitude da quinta classe? 17 Centro Universitário Franciscano Material elaborado por: Professora Leandra Anversa Fioreze e Professor Clandio Timm Marques. 04. Complete a tabela de acordo com os cabeçalhos das colunas. QUESTÃO DE UMA PROVA DE PÓS-GRADUAÇÃO EM AUDITORIA FISCAL. 05. Uma empresa procurou estudar a ocorrência de acidentes com seus empregados e realizou um levantamento por um período de 36 meses. As informações apuradas estão na tabela a seguir: A porcentagem de meses em que houve menos de 5 empregados acidentados é: a) 50% b) 45% c) 35% d) 33% e) 30% 06. Antes de enviar um lote de aparelhos elétricos para venda, o Departamento de Inspeção da empresa produtora selecionou uma amostra casual de 32 aparelhos avaliando o desempenho através de uma medida especifica, obtendo os seguintes resultados: Construa uma tabela de freqüências. 07. Os dados a seguir são de peso (kg) de 80 mulheres. Apresente-os em uma tabela. 18 Centro Universitário Franciscano Material elaborado por: Professora Leandra Anversa Fioreze e Professor Clandio Timm Marques. Fonte: Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979. (adaptado) 8. Os dados abaixo são de um estudo de prevalência de doença cardíaca e investigação de fatores de risco associados de funcionários que trabalham na Bolsa de Valores. Calcular os valores relativos (percentuais). 9. Uma auditoria em uma grande empresa observou o valor de 50 notas fiscais emitidas durante um mês. Esta amostra apresentou os seguintes valores em dólares: Agrupe, por freqüência simples (ou absoluta) e percentual estes dados e monte uma tabela. _____________________________________________________________________________________ 11. Gráficos especiais de uma distribuição de freqüência do tipo B: Histograma: É a representação gráfica de uma distribuição de freqüência por meio de retângulos justapostos, cujas alturas são proporcionais às freqüências absolutas e cujas bases correspondem ao intervalo de classe da distribuição. 19 Centro Universitário Franciscano Material elaborado por: Professora Leandra Anversa Fioreze e Professor Clandio Timm Marques. fi 6543210 2 4 6 8 10 12 x Polígono de Freqüências: É um gráfico em linhas formado por de segmentos de retas; os pontos extremos dos segmentos correspondem ao par ordenado formado pelo ponto médio de cada classe da distribuição (eixo x) e pela freqüência absoluta (eixo y). fi 6543210 1 3 5 7 9 11 13 x Ogiva: É um gráfico em linhas formado por de segmentos de retas; os pontos extremos dos segmentos correspondem ao par ordenado formado pelo limite inferior de cada classe (eixo x) e pela freqüência acumulada (eixo y). Fi 252015105- 0 2 4 6 8 10 12 x 20