Para cursos de Pedagogia e Formação de Professores Apostila 1 UNIVERSIDADE SEVERINO SOMBRA Prof. Ilydio Pereira de Sá Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 2 ÍNDICE 1) Introdução 2) Conceitos Iniciais: População, Amostra, Censo, Variáveis Exercícios (lista 1) Gabarito 3) Arredondamento e ajuste de dados em Estatística 4) Noções de amostragem Exercícios (lista 2) Gabarito 5) Tabulação e Distribuição de Freqüências Exercícios (lista 3) Gabarito "Nunca se afaste de seus sonhos, porque se eles se forem você continuará vivendo, mas terá deixado de existir." (Mark Twain) 3 4 8 9 10 11 14 16 17 30 35 Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 3 UNIDADE I – CONCEITOS INICIAIS E TABULAÇÃO População; Censo; Amostra; Experimento aleatório; Variáveis e atributos; Variáveis aleatórias discretas e contínuas; Normas para apresentação tabular de dados. Organização de Dados Estatísticos. Quadros e tabelas; Distribuição de freqüências; Intervalos de classe; Ponto médio; Freqüências absolutas e relativas; Freqüências acumuladas 1) Introdução: A Estatística, que é um ramo da Matemática Aplicada, teve suas origens na Antiguidade, relacionando-se basicamente, aos registros e negócios do Estado (daí a origem do nome Estatística). Diversos povos tinham o hábito de registrar a população, os nascimentos, os óbitos, as riquezas pessoais, as terras, os impostos, etc. Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século XVI , de uma maneira mais sistemática, começaram a surgir as primeiras tabelas e os primeiros números relativos, associados a fatos sociais. A palavra ESTATÍSTICA vem do termo latino “STATUS”. Sob essa palavra acumularam-se descrições e dados relativos ao Estado. A ESTATÍSTICA, nas mãos dos estadistas, constitui-se uma verdadeira ferramenta administrativa. No século XVIII o estudo foi adquirindo feições verdadeiramente científicas e Godofredo Achenwall definiu efetivamente seus objetivos relacionando a Estatística com as demais ciências. As tabelas tornaram-se mais complexas, surgiram as representações gráficas e o cálculo de probabilidades, e a Estatística deixou de ser uma simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (População), partindo de observações de partes desse todo (Amostras). “Feliz aquele que transfere o que sabe e aprende o que ensina.” (Cora Coralina) Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 4 2) Conceitos Iniciais: Definições, População, Amostra, Censo, Variáveis. a) Estatística -" É um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos." "A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões." b) Estatística Descritiva X Estatística Indutiva: A Estatística Descritiva ou Dedutiva é o ramo da Estatística que tem por objetivo descrever e analisar fatos relacionados a determinado grupo ou população, sem pretender tirar conclusões de caráter mais genérico. A Estatística Indutiva ou Inferência Estatística , baseando-se nos resultados obtidos da análise de amostra de uma população, procura inferir ou estimar as leis de comportamento de toda a população. População Amostra Estatística Descritiva Características populacionais Estudo da amostra: Estatística - tabelas - gráficos - medidas -… Indutiva Características amostrais c) Fases do Método Estatístico: Metodologia, normalmente usada na Estatística descritiva, que visa estruturar e organizar as fases que devem ser estabelecidas num estudo estatístico qualquer. As principais fases do método estatístico são: Coleta de Dados, Crítica dos Dados, Apuração dos Dados, Apresentação dos Dados e Análise dos resultados. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 5 d) População e Amostra: População é um conjunto de elementos portadores de, pelo menos, uma característica comum. Devemos tomar cuidado, pois o termo População, em estatística não tem o mesmo significado usual, relacionado apenas a pessoas. Uma população estatística é um conjunto de informações que tenham entre si alguma característica comum. Por exemplo, o conjunto de toas as cores de olhos constitui a população de cores de olhos. O que importa, nesses casos, é a VARIÁVEL estudada. Por exemplo, uma variável estatística pode ser a RELIGIÃO das pessoas que responderam a uma pesquisa. Amostra é qualquer subconjunto finito, representativo de uma população. Usamos as técnicas de amostragem quando for muito trabalhoso ou mesmo impossível o estudo completo da população. Uma amostra, para ser boa, tem de ser representativa, ou seja, deve conter proporcionalmente uma imagem qualitativa e quantitativa o que a população possui. A amostra deve ser imparcial, isto é, todos os elementos da população devem ter as mesmas chances de fazerem parte da amostra. Constituída uma amostra, os elementos que a compõem passam a ser tratados como dados estatísticos e podem dar origem as diversas relações ou medidas estatísticas, como, por exemplo: média aritmética, mediana, moda, variância, desvio padrão, coeficiente de variação, etc. As relações estatísticas possibilitam DESCREVER, sob diversos ângulos, o conjunto de dados representado pela amostra. Por isso, o estudo dessas relações pertence ao campo da ESTATÍSTICA DESCRITIVA. DESCRITIVA. Costumamos, para facilitar, adotar a seguinte convenção de nomenclatura: sempre que fizermos algum cálculo estatístico tendo por base os dados de uma amostra, teremos as chamadas ESTATÍSTICAS; sempre que essas relações se referirem à população, teremos os chamados PARÂMETROS. Adotaremos ainda a convenção de usar um n (minúsculo) para o tamanho da amostra e um N (maiúsculo) para o tamanho da população. Para as relações ou conceitos estatísticos, relacionados às amostras, é usual usarmos letras do nosso alfabeto, enquanto que para os resultados provenientes de toda a população, como nos censos, usamos letras do alfabeto grego. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 6 Vamos tomar como exemplo o importante conceito de DESVIO PADRÃO. Se ele for calculado a partir dos dados da amostra, usaremos o símbolo s (x), entretanto, se for calculado a partir dos dados de toda a população, teremos o símbolo σ (x). Por exemplo, num bairro com 5000 habitantes, poderíamos compor uma amostra com 500 pessoas, nesse caso, pela convenção adotada, teríamos: N = 5000 n = 500 N seria um parâmetro e n seria uma estatística. É claro que trabalhar com amostras pode ser bastante vantajoso, mesmo que o resultado apresente alguma pequena margem de erro. Por exemplo, sem usar amostras, como poderíamos saber a taxa de defeitos de fabricação de uma fábrica de fósforos, será que seria riscando todos os que foram produzidos? Para a maioria das pessoas a palavra censo ou recenseamento encontra-se associada à enumeração dos elementos da população de um País. O recenseamento geral de uma população é uma prática que remonta à antiga Roma e Egito, onde temos conhecimento de recenseamentos da população, feitos a intervalos regulares, com o objetivo principal de obter informação para a coleta de impostos, chamada para o serviço militar e outros assuntos governamentais. Apesar disso, a sua prática corrente, com caráter periódico, só teve lugar, na maioria dos Países, a partir do séc. XIX. Esses censos periódicos são feitos em geral de 10 em 10 anos e, em princípio, todos os Países são encorajados a cumprir certas normas internacionais ao elaborar um censo. PARA VOCÊ RESPONDER ... Classifique cada um dos exemplos abaixo como sendo casos de Estatística Descritiva ou de Inferência Estatística. Comente brevemente cada caso. 1. Um lote de 100 aparelhos de televisão considera-se em bom estado para venda se, ao serem testados 10 deles, eles não apresentarem qualquer defeito. 2. Uma pesquisa de opinião revelou que 65% da população brasileira apoiava um determinado candidato para Presidente da República. Se esse candidato se apresentar às eleições, é de esperar que ele ganhe. 3. Os 120 empregados de um fábrica ganha em média 400 reais por mês. 4. Baseados numa amostra de 500 trabalhadores de uma empresa de construção civil, acredita-se que a média dos salários dos trabalhadores desse ramo é de 400 reais. 5. Verificadas todas as 5000 peças fabricadas em um dia, por uma Indústria, verificou-se que 4% apresentavam defeitos. “É possível mentir usando estatísticas, mas se mente mais, e melhor, sem estatísticas. É preciso entender que as amostras podem levar a conclusões erradas. Contudo, as opiniões pessoais, sem base em dados, levam, em geral, a conclusões muito mais erradas.” (Frederick Mosteller - Professor em Harvard) Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 7 e) Variáveis: Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. A variável pode ser: Qualitativa ou Atributo (Nominal) ex: sexo, raça, religião, escolaridade, etc. ou Quantitativa, quando seus valores podem ser expressos por dados numéricos (medidas ou contagem). A variável quantitativa poderá ser contínua, se os seus valores puderem assumir quaisquer resultados dentro de um intervalo qualquer (normalmente decorrente de medidas) ou poderá ser discreta, se os seus valores pertencerem a um conjunto enumerável (normalmente decorrente de contagens). Por exemplo, a quantidade de alunos de um colégio constitui variável discreta, enquanto que o peso desses alunos constitui variável contínua. De um modo geral as contagens dão origem a variáveis discretas, enquanto que as medições dão origem a variáveis contínuas. Variável aleatória. Uma variável é denominada aleatória quando ela só assume valores decorrentes de experimentos aleatórios. Um experimento é dito aleatório quando, mesmo repetido nas mesmas condições iniciais, pode gerar resultados diferentes e, se o experimento for uniforme todos os valores distintos da variável aparecem em quantidades iguais. Por exemplo a variável que representa os pontos obtidos no lançamento de um dado (honesto) é aleatória pois os pontos obtidos após cada lançamento poderão ser diferentes, mesmo repetindo-se indefinidamente o experimento de lançar o dado. Matematicamente, podemos conceituar variável aleatória de uma forma mais precisa: • Variável Aleatória: É o resultado numérico da observação de um fenômeno influenciado por um determinado mecanismo probabilístico. Trata-se da quantificação do resultado produzido por um fenômeno incerto. Podemos ainda dizer que uma variável aleatória é uma função que associa cada elemento da amostra a um número real qualquer. Por exemplo, ao atirar os dados e registrar os resultados estaremos produzindo uma variável aleatória com extensão total { 1, 2, 3, 4, 5, 6 }. Outro exemplo seria a experiência de escolher uma pessoa ao acaso entre os passantes e medir a sua altura. É no campo da Estatística Indutiva que o conceito de variável aleatória tem a sua maior aplicação. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 8 Exercícios (Lista 1) 1) Das variáveis abaixo, indique a discreta: a) O número de "caras" que se pode obter jogando ao ar dez moedas. b) O tempo de duração de um disco, tomando como unidade o minuto. c) A temperatura de uma sala, medida em graus Celsius. d) As alturas dos alunos de uma turma, expressas em cm. e) As notas dos alunos, em um teste de Matemática. 2) As variáveis discretas são de natureza: a) quantitativa b) qualitativa c) fracionária d) contínua e) racional 3) As fases básicas do método Estatístico são: a) Coleta, Crítica, Representação e Análise dos dados. b) Censo, Planejamento, Representação dos dados. c) Coleta, Crítica, Apuração, Apresentação dos dados e Análise dos resultados. d) Planejamento, Divulgação e Análise dos dados. e) Coleta, Apuração Crítica e Análise dos resultados. 4) Numere a segunda coluna, de acordo com a primeira, e registre a opção correta: 1) Estudo de números associados a fenômenos. 2) Parte da população observada. 3) Denominação dada a atributos ou a quantidades, que variam quanto à grandeza. 4) Grupo de indivíduos ou coisas cujas características são estudadas em forma de um todo, não interessando um elemento em particular. 5) Cada valor observado de uma variável. ( ) Amostra a) 5 -1 -4 -3 -2 ( ) Estatística b) 2 -3 -4 -1 -5 ( ) População c) 3 -1 -4 -2 -5 ( ) Variável d) 2 -1 -4 -5 -3 ( ) Dado e) 2 -1 -4 -3 -5 5) População ou Universo é: a) Conjunto de pessoas b) Conjunto de indivíduos que apresentam características especiais. c) Conjunto de elementos que apresentam uma característica comum. d) Subconjunto confiável para um estudo qualquer. e) Nada disso. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 9 6) O método aplicado por Institutos de Pesquisa, nas prévias eleitorais, pertence ao ramo da: a) Estatística Descritiva b) Estatística Indutiva c) Estatística Aplicada d) Estatística Geral e) Estatística Dedutiva. 7) Ao nascer, os bebês são pesados e medidos, para saber se estão dentro das tabelas padrão. Estas duas variáveis são: a) qualitativas b) discretas c) contínuas d) contínua e discreta, respectivamente 8) Parcela da população convenientemente escolhida para representá-la: a) variável b) rol c) dados d) amostra e) atributo 9) É exemplo de atributo: a) número de filhos b) estado civil c) altura d) peso e) idade 10) É exemplo de variável discreta: a) Número médio de filhos, por família de uma localidade. b) Salário de uma pessoa em dólares. c) Altura média das montanhas de uma cidade. d) Votos anulados em uma seção eleitoral. e) Porcentagem de acertos ao alvo, de um atirador. 11) Qual dos exemplos a seguir não apresenta um caso de variável aleatória? a) número de gols feitos por um artilheiro, após cada partida de um campeonato de futebol. b) nota de um aluno nas prova de matemática que irá realizar ao longo de um ano letivo. c) taxa de inflação mensal brasileira. d) número de dias do mês de março, ao longo de uma determinada década. e) número de dias chuvosos ao longo do mês de janeiro de 2006. GABARITO 01) A 02) A 03) C 04) E 05) C 06) B 07) C 08) D 09) B 10) D 11) E Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 10 3) Arredondamento e Ajuste de Dados em Estatística: Quando for necessário, em cálculos e tabelas estatísticas, o arredondamento de dados, devemos proceder de acordo com a resolução número 886/66, da Fundação IBGE. I) Quando o primeiro algarismo a ser abandonado for 0, 1,2,3 ou 4, fica inalterado o último algarismo a permanecer. exemplos: a) 53,24 arredondado ao décimo mais próximo será 53,2. b) 12,473 arredondado ao centésimo mais próximo será 12,47. II) Quando o primeiro algarismo a ser abandonado for 6,7,8 ou 9, aumenta-se de uma unidade o último algarismo a permanecer. exemplos: a) 42,87 arredondado ao décimo mais próximo será 42,9. b) 13,7 arredondado ao inteiro mais próximo será 14. III) Quando o primeiro algarismo a ser abandonado for o 5, há duas situações a considerar: A) Se ao 5 seguir, em qualquer ordem, um algarismo diferente de zero, aumentase de uma unidade o algarismo a permanecer. exemplos: a) 2,352 arredondado a décimos será 2,4 b) 14,325004 arredondado a centésimos será 14,33. B) Se o 5 for o último algarismo , ou ao 5 só se seguirem zeros, o último algarismo a ser conservado só será aumentado de uma unidade se for ímpar. exemplos: a) 24,75 arredondado a décimos será 24,8. b) 14,7850 arredondado a centésimos será 14,78. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 11 Compensação ou Ajuste de Dados: Quando houver arredondamento em somatórios e precisarmos "ajustar" alguns elementos, de modo a acertar a soma, usamos "descarregar" a diferença na maior ou nas maiores parcelas. exemplo: 25,32 + 17,85 + 10,44 + 31,17 = 84,78. Se arredondássemos todas as parcelas e a soma, para décimos, teríamos: 25,3 + 17,8 + 10,4 + 31,2 = 84,8. No entanto esta soma agora é 84,7 que não é o arredondamento correto de 84,78. A compensação faríamos na maior parcela (31,2), tornando-a 31,3, logo, teríamos: 25,3 + 17,8 + 10,4 + 31,3 = 84,8. 4) Noções de Amostragem: Para a escolha de uma amostra representativa de uma população, devemos utilizar técnicas especiais, de modo a garantir, tanto quanto possível , o acaso na escolha. Sendo assim, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade. As principais técnicas de amostragem são: A) Amostragem Casual, Aleatória Simples ou Randômica: Este tipo de amostragem é equivalente a um sorteio lotérico. Na prática, a amostragem casual pode ser realizada numerando-se a população de 1 a n e sorteando-se por um método confiável qualquer os k elementos que constituirão a amostra. Quando o número de elementos da amostra for muito grande, esse tipo de sorteio se torna muito trabalhoso. A fim de facilitá-lo foi elaborada uma tabela - A tabela de números aleatórios - construída de modo que os 10 algarismos do nosso sistema de numeração são distribuídos ao acaso nos números formadores das linhas e das colunas. Obs: Modernamente, os computadores possuem programas de seleção aleatória ou randômica, que substituem com vantagem o uso da tabela. B) Amostra Proporcional Estratificada: Muitas vezes a população divide-se em subpopulações, - os estratos-. Na técnica de amostragem proporcional, considera-se a existência de tais estratos e obtém-se os elementos da amostra como uma divisão proporcional direta ao número de elementos de tais estratos. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 12 Exemplo: Como ficaria a divisão da amostra de 10% de uma população de 90 alunos, com 54 meninos e 36 meninas, por amostragem proporcional estratificada. Solução: Como a amostra é de 10 % da população, teremos de calcular 10 % de cada um dos estratos, levando-se em conta os arredondamentos adequados. Meninos : 10 % de 54 = 5,4 logo 5 meninos. Meninas : 10 % de 36 = 3,6 logo 4 meninas. C) Amostragem Sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os fichários de um médico, os prédios de uma rua, as linhas de produção, etc. Nestes casos , a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. O método mais usado na amostragem sistemática é a formação de progressões aritméticas de razão k, sendo k = N : A, onde N é o número de elementos da população e A é a quantidade de elementos da amostra.. O primeiro elemento da P.A fica determinado por sorteio. Exemplo: Num consultório médico, os clientes estão cadastrados em fichas numeradas de 1 a 500. Compor uma amostragem sistemática com 10 elementos, começando pela ficha número 12. Solução: Razão da P.A: k = 500 : 10 = 50. Amostra: Clientes números: 12, 62, 112, 162, 212, 262, 312, 362, 412, 462. Uma questão importante ... Qual o tamanho ideal que deve ter uma amostra? Um problema relevante que temos, a partir da escolha de uma amostra é o de saber qual a dimensão desejada para a amostra a recolher. Este é um problema para o qual nesta fase, não é possível avançar nenhuma teoria, já que depende de estudos referentes à Estatística Indutiva. Pode começar por dizer que, para se obter uma amostra que permita calcular estimativas suficientemente precisas dos parâmetros a estudar, a sua dimensão depende muito da variabilidade da população estudada. Por exemplo, se relativamente à população constituída pelos alunos da 7º série de uma escola de ensino fundamental, estivermos interessados em estudar a sua média de idades, a dimensão da amostra a recolher não necessita de ser muito grande já que a variável idade apresenta valores muito parecidos, numa classe etária muito restrita. No entanto se a característica a se estudar fosse o tempo médio que os Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 13 alunos levam a chegar de casa à escola, a amostra teria de ter uma dimensão maior, uma vez que a variabilidade da população é muito maior. Cada aluno pode apresentar um valor diferente para esse tempo. Chamamos a atenção para a existência de técnicas que permitem obter valores mínimos para os tamanhos das amostras a recolher e que garantem estimativas com uma determinada precisão desejada. Uma vez garantida essa precisão, a opção por escolher uma amostra de maior dimensão, é uma questão a ponderar entre os custos envolvidos e o ganho com o acréscimo de precisão. Convém ainda observar que a dimensão da amostra a recolher não é diretamente proporcional à dimensão da população a estudar. Se,por exemplo para uma população de dimensão 1000 uma amostra de dimensão 100 for suficiente para o estudo de determinada característica, não significa necessariamente uma amostra de dimensão 200 para estudar a mesma característica de uma população análoga, mas de dimensão 2000. Um exemplo: O Senhor R, candidato à Câmara da cidade do Rio de Janeiro, pretende saber, qual a percentagem de eleitores que pensam votar nele nas próximas eleições. Havendo algumas limitações de tempo e dinheiro, a empresa encarregada de fazer o estudo pretendido decidiu recolher uma amostra de dimensão 1000, perguntando a cada eleitor se pensava em votar no senhor R. Como resultado da amostragem obteve-se um conjunto de sim's e não's, cujo aspecto não é muito agradável, pois à primeira vista não conseguimos concluir nada: Não Sim Sim Não Sim Sim … Procede-se à redução dos dados, resumindo a informação sobre quantos sim's se obtiveram, chegando-se à conclusão que nas 1000 respostas, 635 foram afirmativas. Então dizemos que a percentagem de eleitores que pensam votar no candidato, de entre os consultados, é de 63,5%. A função da Estatística Descritiva acabou aqui! (Se toda a População tivesse sido inquirida, este estudo descritivo seria suficiente para dar a resposta à consulta feita). Poderemos agora inferir que 63,5% dos eleitores da cidade do Rio de Janeiro pensam votar no Senhor R? A resposta a esta pergunta nem é sim, nem não, mas talvez. É agora que temos necessidade de utilizar o conceito de Probabilidade, para quantificar a incerteza associada à inferência. Assim, existem processos de inferência estatística que, do resultado obtido a partir da amostra, nos permitirão concluir que o intervalo [60,5%, 66,5%] contém o valor exato para a percentagem de eleitores da cidade que pensam votar no Senhor R, com uma confiança de 95%. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 14 Nota - A confiança de 95% deve ser entendida no seguinte sentido: se recolhermos 100 amostras, cada uma de dimensão 1000, então poderemos construir 100 intervalos; destes 100 intervalos esperamos que 95 contenham o verdadeiro valor da percentagem (desconhecida) de eleitores da cidade do Rio de Janeiro, que pensam votar no senhor R. Exercícios (Lista 2) 12) (Fiscal do ICMS - 89) Em uma amostragem sistemática, de tamanho 50, de uma população de 2000 elementos, o primeiro elemento selecionado é o 16. Os dois elementos seguintes a serem escolhidos são: a) 32 e 48 b) 50 e 66 c) 50 e 100 d) 56 e 96 56 e 106 13) Numa escola estão matriculados 280 meninos e 320 meninas (não existindo alunos irmãos). O diretor da escola, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento por amostragem proporcional estratificada, composta de 50 alunos. As famílias de quantos meninos serão entrevistadas? a) 23 b) 42 c) 25 d) 27 e) 28 14) Uma cidade A , apresenta o seguinte quadro, relativo ao número de estudantes de suas escolas de Ensino Fundamental. Escolas Masculino Feminino X 120 130 Y 240 360 Z 180 420 T 300 200 Total 840 1110 Obtenha uma amostra proporcional estratificada de 120 estudantes e indique quantos meninos representarão a escola Z a) 15 b) 11 c) 14 d) 20 e) 32 "É impossível a existência de uma sociedade formada por pessoas que não sonham. Elas estariam mortas em duas semanas." William Burroughs - escritor americano Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 15 15) Tendo-se os números: 2,483 ; 48,6 e 368, arredonde-os, utilizando-se dos seguintes critérios, respectivamente: - centésimo mais próximo - unidade mais próxima - centena mais próxima (a) 2,48 - 48 - 400 (b) 2,49 - 49 - 300 (c) 2,4 - 48 -300 (d) 2,48 - 48 - 300 (e) 2,48 - 49 – 400 16) Arredondando-se para inteiros, e devendo o total ser 100 %, na distribuição percentual imaginária abaixo, qual será o valor correspondente ao estado do Amazonas? Amazonas 48,4 % Pará 15,3 % Maranhão 13,8 % Piauí 9,1 % Ceará 13,3 % Total 99,9 % a) 48 % b) 47 % c) 49 % d) 50 % e) 45% 17) Entre as afirmativas seguintes, assinale a que é FALSA. (a) Faz-se um levantamento por censo quando todos os elementos da população são pesquisados. (b) Faz-se um levantamento por amostragem quando se pesquisa parte de uma população e, com base no subconjunto pesquisado, pode-se tirar conclusões sobre toda a população. (c) A decisão entre os tipos de levantamento a serem realizados, censo ou amostragem, dependerá, entre outras coisas, do prazo de realização da pesquisa e dos recursos financeiros disponíveis. (d) As afirmativas I, II e III são falsas. 18) (TCU) Assinale a opção correta: (a) Estatística inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos. (b) O processo utilizado para se medir as características de todos os elementos de uma dada população recebe o nome de censo. (c) A Estatística Descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população com base na observação de uma amostra. (d) Uma população só pode ser caracterizada se forem observados todos os seus componentes. (e) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 16 19) Uma amostragem sistemática será constituída de 6 elementos, para uma população de 360 elementos. O primeiro elemento sorteado para a amostra foi o 45. Se todos os elementos do universo são numerados de 1 a 360, qual será o terceiro elemento dessa amostra? a) 165 b) 105 c) 205 d) 245 e) 145 20) Assinale a alternativa FALSA: (a) A Estatística é constituída de um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos. (b) A população constituída por todos os parafusos produzidos numa fábrica em um certo dia é finita, enquanto que a população constituída de todos os resultados (cara ou coroa) em sucessivos lances de uma moeda é infinita. (c) Um censo constitui-se pelo exame de todas as unidades de uma população finita. (d) No estudo de determinada característica associada a uma população, deve-se recorrer a uma amostra quando for impraticável (ou mesmo impossível) observar todo o grupo. (e) Experimento aleatório é o conjunto de todos os resultados possíveis de uma experiência aleatória. GABARITO 12) D 13) A 14) B 15) E 16) C 17) D 18) B 19) A 20) E Dificuldades reais podem ser resolvidas; apenas as imaginárias são insuperáveis." Theodore N. Vail Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 17 5) Tabulação Introdução: Feita a coleta e a crítica dos dados, com a respectiva apuração, devemos efetuar a apresentação desses dados, o que é feito normalmente através de tabelas ou gráficos. Trataremos inicialmente das tabelas, e, um postulado básico que se deve obedecer é que: "Uma tabela deve propiciar um máximo de esclarecimentos com um mínimo de espaço e tempo." Estruturação: No Brasil as regras para construção de tabelas e gráficos são regidas pelo IBGE. Uma tabela é constituída de título, cabeçalho, corpo, coluna indicadora e rodapé. No cabeçalho devemos ter as informações sobre o que está apresentado na tabela (o que, onde e quando...). No corpo da tabela temos as células, onde estarão os dados representativos do fenômeno estudado. No rodapé, recomendase que se coloque a fonte das informações. Consta ainda da norma específica que as tabelas não sejam fechadas nas extremidades (esquerda e direita). Cabeçalho Coluna indicadora Exemplo: Tabela 1 Casos registrados de intoxicação humana, segundo a causa dominante. Brasil, 1993. Causa Casos Acidente 29 601 Abuso 2 604 Suicídio 7 965 Profissional 3 735 Outras 1 959 Ignorada 1 103 Fonte: MS/FIOCRUZ/SINITOX Título Corpo Rodapé No corpo de uma tabela , que é representado por uma série de colunas e subcolunas, estão colocados os dados apurados. O corpo pode ser dos tipos: Entrada Simples; Dupla Entrada (contingência) e de Múltipla Entrada. No rodapé da tabela devemos colocar as legendas e convenções usadas, fornecer a fonte dos dados, de modo a dar maior autenticidade à tabela e, se necessário, as observações que se fizerem necessárias. "Ter razão é fácil. Perceber que os outros a têm - eis o problema." (M. Silva Brito) Estatística Descritiva Básica – prof. Ilydio Pereira de Sá Exemplos: Entrada Simples 18 Previsão populacional Cidade de São Paulo: 1984 - 2020. Anos 1984 1990 1995 2000 2010 2020 População 9 439 000 11 160 000 12 224 000 13 410 000 14 910 000 15 532 000 Fonte: Sabesp Entrada Dupla Número de Funcionários Empresa X - 1984 Homens Maiores Menores Total 160 140 300 Mulheres 130 110 240 Total 290 250 540 Observação: De acordo com a deliberação 886, da fundação IBGE, nas casas ou células de uma tabela valem as convenções: - Um traço horizontal ( - ) quando o valor do dado for zero. Três pontos ( ... ) quando não temos os dados. Um ponto de interrogação(?) quando temos dúvida quanto à exatidão de determinado valor. Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Séries Estatísticas: Denominamos série estatística a toda tabela que apresenta a distribuição de um conjunto de dados estatísticos, em função da época, do local ou da espécie dos dados. Disso, podemos concluir que as variáveis: tempo, local e espécie são os componentes fundamentais de tais séries, e elas poderão ser denominadas:Históricas, Geográficas ou Específicas, respectivamente, dependento do elemento variável. Série Histórica, Cronológica , Temporal ou Marcha .. A variável é o tempo. SérieGeográfica, Espacial, Territorial ou de localização. ..A variável é o local. Série Específica , Qualitativa ou Categórica .. A variável é o fato ou categoria, permanecendo fixos o local e o tempo. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 19 Séries Mistas ou Conjugadas. São composições de duas ou mais das anteriores. Exemplo: Classificar as séries estatísticas, representadas pelas tabelas seguintes: A)Produção Brasileira /Carvão Mineral Bruto (79/81) ANO QUANTIDADE (x 1000 t) 1979 13 943 1980 16 006 1981 17 434 Fonte: Ministério das Minas e Energia. Resposta: É uma série do tipo................................................................................. B)Avicultura no Brasil (1980) Espécie Quantidade Galinhas 447 411 000 Patos 4 887 000 Perus 2 074 000 Codornas 831 000 Fonte: IBGE Resposta: É uma série do tipo: ........................................................................ C) Produção de Celulose(1981) Estado Produção (t) São Paulo 958 569 Espírito Santo 400 760 Paraná 339 569 S. Catarina 323 812 Minas Gerais 226 559 Fonte: Associação Nacional de Fabricação de Papel e Celulose. Resposta: É uma série do tipo ...................................................................... D) Estimativa de Renda Interna Segundo os Ramos de Atividade (1994/96) Renda Interna ( Em milhares de dólares ) Ramos de Atividade 1994 1995 421 933 708 848 1 446 050 Indústria 1 046 289 1 726 161 3 778 060 Serviços 1 662 867 2 886 801 5 880 469 Total 3 131 089 5 321 810 11 104 579 Agricultura Fonte: Fundação Getúlio Vargas Resposta: É uma série do tipo .................................................................................... 1996 Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 20 Dados Absolutos e Dados Relativos. Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida, são chamados dados absolutos. Dados relativos são resultantes de razões que se estabelecem entre dados absolutos, e têm por finalidade a comparação entre quantidades. Os dados relativos mais comuns em estatística são : porcentagens, índices , coeficientes e taxas. A) As Porcentagens: O emprego de porcentagens é de grande valia, principalmente quando queremos destacar a participação da parte no todo e a consequente comparação de grandezas. Podemos estabelecer, em tais casos, a fórmula: P= p x 100 T Onde P é a porcentagem procurada, p é o dado numérico referente à parte e T é o dado numérico referente ao todo (referencial adotado). Obs: Como é um cálculo que envolve divisão, enfrentaremos os arredondamentos e compensações que já estudamos anteriormente. Normalmente arredondamos a décimos as porcentagens. Exemplo: Matrículas nas Escolas da Cidade X em 2002 Categoria Quantidade de alunos % Educação Infantil 34 600 36,9 Ensino Fundamental 45 567 48,6 Ensino Médio 13 560 14,5 Total 93 727 100,0 Fonte: Dados Imaginários Educação Infantil = 34 600 X 100 : 93 727 = 36,915 % ~ 36,9 % Ensino fundamental = 45 567 X 100 : 93 727 = 48,616 % ~ 48,6 % Terceiro grau = 13 560 X 100 : 93 727 = 14,467 % ~ 14,5 % B) Os índices , os coeficientes e as taxas. Os índices são razões entre duas grandezas tais que uma não inclui a outra. Exemplo: Densidade demográfica = População Superfície Os coeficientes são razões entre duas grandezas tais que uma delas está contida na outra, ou seja é uma razão entre parte e todo. Exemplo: Coef. de natalidade = Nº de nascimentos População total Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 21 As taxas são obtidas multiplicando-se por uma potência de 10 (10, 100, 1000, etc.) os resultados dos coeficientes ou índices. A mais usada é a taxa percentual ou porcentagem. Exemplo: Calcule a taxa de aprovação de uma classe com 40 alunos, dos quais foram aprovados 36. TA = 36 x 100 = 0,9 . 100 = 90 % 40 As Distribuições de Freqüência. É um tipo de série estatística muito especial, qualitativa ou específica, onde os dados estão agrupados em faixas, de acordo com as suas repetições, podendose utilizar faixas ou intervalos que contenham tais valores. O número de observações ou repetições de um determinado dado é a sua freqüência. As distribuições de Freqüência dividem-se em dois tipos: I) Tipo A ou Discreta. Normalmente usamos este tipo de distribuição quando não há um número muito grande de valores distintos da variável. É uma tabela com duas colunas básicas:(xi), que representa os valores distintos da variável e ( fi ), que indica o número de repetições de cada valor (freqüência absoluta). Exemplo: Um professor anotou as notas de Matemática de uma classe de 30 alunos, obtendo os seguintes dados brutos (ainda não organizados): 07 08 10 08 06 06 06 09 06 05 05 08 09 06 10 08 07 08 07 09 09 05 07 04 04 10 06 05 04 05 Fazendo a distribuição de freqüência discreta (tipo A) para essas notas, teremos: xi fi 04 05 06 07 08 09 10 ∑ 3 5 6 4 5 4 3 30 Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 22 Obs: Usamos também o cálculo da freqüência relativa (fr), que é a razão entre a freqüência absoluta (fi) e o número total de elementos observados N ou ∑ f, e que pode também ser expressa em forma de porcentagem (taxa relativa) fr = fi N Exemplo: Distribuição de profissões entre pacientes potencialmente suicidas Freqüência (fi) Freq. Relativa (fr) Taxa (%) Serviços Gerais* 75 0,249 24,9 Doméstica** 55 0,182 18,2 Do Lar 53 0,175 17,5 Indeterminada 29 0,096 9,6 Emprego especializado*** 23 0,076 7,6 Menor 20 0,066 6,6 Desempregado 15 0,050 5,0 Estudante 14 0,046 4,6 Lavrador 12 0,040 4,0 Autônomo 4 0,013 1,3 Aposentado 2 0,007 0,7 302 1 100 Profissão (xi) Total * garçom, encanador, pedreiro, frentista, operário, padeiro, açougueiro, borracheiro etc. ** copeira, faxineira, costureira e bordadeira *** enfermeira, modelo, protético, escrivão, professor e vendedor A tabela mostra a distribuição de pacientes potencialmente suicidas. A maior incidência foi observada entre profissionais mal remunerados e com sobrecarga de trabalho, sem perspectiva de ascensão social. O alto percentual entre menores e estudantes (6,6% + 4,6%) confirma o fato relatado na literatura de que o índice de tentativas de suicídio entre adolescente é preocupante. Tal tipo de distribuição é o que denominamos tabela de freqüência discreta. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 23 II) Tipo B ou Contínua: Quando o número de valores distintos da variável for muito grande, o processo anterior seria, além de trabalhoso, desvantajoso em termos de apresentação já que exigiria um espaço muito grande. Dessa forma, é usual agruparmos os valores distintos obtidos em intervalos ou classes, de modo a resumir a tabela , em tempo de elaboração e forma de apresentação. A forma mais comum de representarmos uma classe de valores é a b, que significa uma classe com todos os valores entre a (inclusive) e b (exclusive). Exemplo: Os valores abaixo relacionados em rol (estão organizados), representam as alturas dos 40 alunos de uma turma, em cm. Organizar uma distribuição de freqüências do tipo B (Contínua), com 6 classes distintas. 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 Solução: Estaturas 150 | 154 154 | 158 158 | 162 162 | 166 166 | 170 170 | 174 ∑ 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173 fi 04 09 11 08 05 03 40 Importante: Existem dois princípios básicos que devem nortear a elaboração de uma distribuição contínua de freqüências: I. As classes devem ser exaustivas, ou seja, todos es valores da variável devem estar inseridos em uma das classes. II. As classes devem ser mutuamente exclusivas, ou seja, nenhum valor deve pertencer a duas classes ao mesmo tempo. Vamos agora completar o nosso estudo de distribuição de freqüências com mais algumas definições importantes ao nosso estudo. (a) classes - são os intervalos de variação da variável, no exemplo anterior foram feitas 6 classes. (b) limites de classe - são os extremos de cada classe. O limite inferior representaremos por l e o limite superior, representaremos por L . Por exemplo, na tabela acima, os limites da terceira classe são: l = 158 e L = 162. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 24 (c) amplitude do intervalo de classe, ou intervalo é o número que expressa, no caso de intervalos fechados em apenas um dos extremos (à esquerda, segundo deliberação do IBGE, para o Brasil), a diferença entre os limites superior e inferior. No nosso exemplo ainda, cada intervalo tem amplitude igual a 4. (d) amplitude total da distribuição é a diferença entre o limite superior da última classe e o limite inferior da primeira classe, para intervalos semifechados, ou seja: ATD = L (máx.) - l (mín.) Em nosso exemplo, ATD = 174 - 150 = 24 cm. É imediato observar que, se as classes possuem o mesmo intervalo h, com número de classes igual a k, vale a relação: h = ATD : k No exemplo dado , temos: h = 24: 6 = 4. Observe que a determinação dos parâmetros básicos da distribuição de freqüências depende do número de classes a ser considerado. Apesar de ser uma quantidade à escolha do pesquisador, existem algumas fórmulas empíricas que pretendem "amarrar" o número de classes ao número de elementos observados n. A mais usada é a fórmula de Sturges, que é: FÓRMULA DE STURGES k ≅ 1 + 3,3 . log n No nosso exemplo, teríamos: k =1+3,3 . log 40 = 1 + 3,3 . 1,6 ≅ 6,28 ou 6 classes. Nesse tipo de exercício o valor do logaritmo decimal é normalmente dado no problema, como no nosso caso que log 40 ≅ 1,6. Há quem use também a relação k ≅ n , que, ainda no nosso exemplo geraria o resultado: k ≅ 40 ≅ 6 classes.(Procedimento da raíz) (e) Amplitude amostral é a diferença entre o valor máximo e o valor mínimo da amostra de valores ou população observada. No exemplo a amplitude amostral é 23, pois esta é a diferença entre o valor máximo 173 e o valor mínimo 150. Note que na elaboração da tabela, aumentamos a amplitude para 24, para que a divisão por 6 fosse exata e facilitasse a montagem. (f) Ponto médio da classe é o valor que normalmente representa a classe no uso de fórmulas estatísticas, e é o ponto que divide o intervalo em duas partes iguais. A obtenção do ponto médio pode ser feita por: PM = (ll + L) : 2 ou l + h : 2. (g) Freqüência acumulada pode ser crescente, quando representa a soma das freqüências de uma classe com as anteriores (também chamada de Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 25 freqüência “abaixo de”) ou decrescente, quando é a soma das freqüências de uma classe com as posteriores (também chamada de freqüência “acima de”). Este conceito representa a quantidade de elementos que antecedem ou que sucedem um certo dado é terá grande uso posteriormente, no capítulo das medidas de posição em estatística. Voltando ao nosso exemplo, vamos agora completar a tabela com os demais conceitos que estudamos: 150 | 154 | 158 | 162 | 166 | 170 | 154 158 162 166 170 174 ∑ fi fir 04 09 11 08 05 03 40 0,10 0,22 0,28 0,20 0,12 0,08 1,00 Fir % 10 22 28 20 12 08 100 Fac cr 04 13 24 32 37 40 Fac dc 40 36 27 16 8 3 Outro exemplo: Distribuição do Nível de colesterol (mg/dl) em 80 indivíduos. Freqüência Absoluta (fi) Nível (classes) Freqüência Relativa Simples Acumulada Simples Acumulada 100 | 150 2 2 0,0256 0,0256 150 | 200 24 26 0,3077 0,3333 200 | 250 35 61 0,4487 0,7821 250 | 300 14 75 0,1795 0,9615 300 | 350 1 76 0,0128 0,9744 350 | 400 1 77 0,0128 0,9872 400 | 450 0 77 0,0000 0,9872 400 | 500 1 78 0,0128 1,0000 78 1 Resumindo as etapas para a elaboração de uma distribuição de freqüências, do tipo contínua: 1) Encontrar o máximo (maior) e o mínimo (menor) valores do conjunto de dados; obter a diferença entre esses valores extremos, que chamaremos de amplitude total do fenômeno. 2) Escolher um número de classes, em geral de mesma amplitude (tamanho), que englobem todos os dados sem haver superposição dos intervalos. Convenciona-se usar de 5 a 20 classes, não há regra rígida para esse número, Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 26 mas usa-se também uma fórmula, denominada de “Regra de Sturges” ( NC = 1 + 3,3 . log n ). 3) Obter a amplitude de cada classe, dividindo-se a amplitude total pelo valor definido para o número de classes. Esse valor pode ser modificado para facilitar a construção da tabela. Recomenda-se ainda usar um valor redondo. 4) Contar o número de elementos que pertencem a cada classe; este número é denominado freqüência absoluta, em geral representada por fi 5) Determinar a freqüência relativa de cada classe, dividindo a freqüência da classe pelo número total de observações (N). EXERCÍCIO RESOLVIDO: A relação abaixo representa os pesos, em kg, dos 40 alunos de uma turma. Responda às questões de 1 a 9, sabendo que log 40 vale aproximadamente 1,6. 44,5 62 72 72 39,5 41,6 58 73,5 73,5 52,5 40 58,5 42 42 50,4 40 69 58 58 56 42 65 87 47,5 55 55 65 56,5 46,8 65 62 39,5 60 45,7 66,5 63,5 44,5 60 55,9 68 1) De acordo com a fórmula de Sturges, qual o número recomendável de classes para uma distribuição de freqüências contínua? NC ≅ 1 + 3,3 x 1,6 ≅ 6,28 ≅ 6 classes. 2) Qual a amplitude total da amostra? Será a diferença entre os valores máximo 87 e mínimo 39,5, logo a amplitude é igual a 87 – 39,5 = 47,5 3) Qual a amplitude a ser usada para a distribuição? A amplitude que usaremos será 48, para facilitar os cálculos. 4) Qual a amplitude de cada um dos intervalos? É só dividir 48 (amplitude total) por 6 (número de classes), logo 48:6 = 8 5) Qual o limite inferior da primeira classe? O limite inferior da primeira classe será igual ao menor valor encontrado, ou seja, 39,5. 6) Qual o limite superior da última classe? Como fizemos um arredondamento da amplitude total, em meio ponto, teremos que o último limite será igual a 87,5 (maior valor medido, aumentado de 0,5). Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 27 7) Construir a tabela da distribuição contínua Classes (kg) 39,5 47,5 55,5 63,5 71,5 79,5 47,5 55,5 63,5 71,5 79,5 87,5 ∑ Freq. (fi ) 12 5 11 7 4 1 40 8) Qual o percentual de pessoas do grupo, cujo peso é inferior a 63,5 kg? Freq. Relat. Freq. Relat. Freq. (fi ) Classes (kg) acumulada 39,5 47,5 12 30,0 % 30% 47,5 55,5 5 12,5 % 42,5% 55,5 63,5 11 27,5 % 70% 63,5 71,5 7 17,5 % 87,5% 71,5 79,5 4 10,0 % 97,5% 79,5 87,5 1 2,5 % 100% 100 % 40 ∑ Observando a coluna que acrescentamos, com as freqüências relativas, verificamos que o percentual das pessoas com peso inferior a 63,5 kg é igual a 70% que corresponde à freqüência relativa acumulada crescente da terceira classe. 9) Qual o percentual de pessoas do grupo, cujo peso é superior a 71,5 kg? Agora a resposta será 12,5%, que corresponde à soma das freqüências relativas das duas últimas classes. 10) Qual o percentual de pessoas do grupo, cujo peso é inferior a 58 kg? Verifique que esse tipo de pergunta (que tem sido bastante cobrada em concursos recentes) é menos óbvia que as anteriores, pelo fato do valor envolvido não ser um dos limites de classe (58 kg). Como devemos proceder num caso desses? A solução não será difícil, bastando usar o recurso da regra de três, é um método denominado INTERPOLAÇÃO LINEAR PELA OGIVA OU PELAS FREQUÊNCIAS ACUMULADAS CRESCENTES. Verifique que todas as pessoas inseridas nas duas primeiras classes fazem parte das que atendem ao que se pede na questão (peso inferior a 58 kg). Quanto as que pertencem à terceira classe, nem todas atenderão ao que se pede, já que essa classe vai de 55,5 kg a 63,5 kg. Verificando que a classe toda tem amplitude igual a 8 e freqüência relativa de 17,5%, a amplitude de 2,5 (que vai de 55,5 kg a 58 kg) corresponderá a um percentual que poderemos obter através de regra de três. É claro que é um resultado aproximado, como praticamente tudo o que fazemos nas distribuições de Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 28 freqüências, já que sempre que a tabela está pronta, por não dispormos mais das informações detalhadas, há uma perda de informações. A regra de três que conclui a questão é: 8 2,5 17,5% x x= 2,5 x 17,5 ≅ 5,47% 8 Conclusão: O percentual das pessoas que têm seu peso inferior a 58 kg é de 30% + 12,5% + 5,47¨% = 47,97% (aproximadamente). Ao concluirmos nosso capítulo das distribuições de freqüências, cabe destacar ainda que, apesar da simplificação e da agilidade gráfica que possibilitam, tais tabelas contínuas apresentam a desvantagem de "perda de informações". A título de exemplo, olhando apenas para a tabela acima, do exercício resolvido, tente descobrir quais foram o maior e o menor peso detectados para os 40 alunos da turma? Vejamos uma questão de concurso recente, sobre o tema: (Auditor Fiscal da Receita Federal – 2002) O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Assinale a opção que corresponde à estimativa do número de indivíduos na população com valores do atributo X menores ou iguais a 95,5 e maiores do que 50,5. a) 700 b) 638 c) 826 d) 995 e) 900 Como a questão envolve agora dois valores e que não são extremos de classes da distribuição, teremos um pouco mais de trabalho, sendo necessário o uso de duas regras de três. a) Podemos verificar que a terceira classe da tabela terá participação parcial da resposta, pois nem todos os valores de 49,5 a 59,5 são maiores do que 50,5. Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 29 Como essa classe (a terceira) tem amplitude 10 e corresponde a uma freqüência absoluta simples de 14 e de 49,5 a 50,5, temos uma amplitude de 1, teremos a seguinte regra de três: 10 -------------- 14 1 ---------------- x x= 1 x 14 = 1,4 10 b) Verificamos ainda que a quarta classe da tabela entrará totalmente na resposta, já que ela vai de 59,5 a 69,5. Teremos então, para a amostra, mais 20 indivíduos a considerar (freqüência da quarta classe) c) O mesmo ocorrerá com a quinta classe, que vai de 69,5 a 79,5. Agora serão mais 26 indivíduos a considerar na amostra. d) Também a sexta classe será considerada na íntegra, pois ela vai de 79,5 a 89.5. Agora temos um acréscimo de mais 18 elementos na resposta e) Finalmente a última classe da tabela não poderá ser considerada integralmente, pois ela vai de 89,5 a 99,5 e o texto da questão diz que só temos que considerar os valores do atributo X, menores ou iguais a 95,5. Teremos de montar uma outra regra de três, lembrando que a amplitude 10 corresponde a 10 indivíduos e a amplitude 4 (de 89,5 a 95,5) obviamente corresponderá a 4 indivíduos. Um outro detalhe importante da questão é que a amostra é de 100 pessoas, numa população de 1000 indivíduos. O resultado que estamos obtendo é referente à AMOSTRA, ou seja, a 10% do Universo. Nesse caso, como a pergunta feita foi sobre a população, teremos que multiplicar a nossa resposta por 10 (10% x 10 = 100%). resposta amostral = 1,4 + 20 + 26 + 18 + 4 = 82,6 elementos. Resposta populacional = 82,6 x 10 = 826 elementos (opção C) "Quem quer fazer algo encontra um meio; quem não quer fazer nada encontra uma desculpa". Provérbio árabe Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 30 Exercícios (Lista 3) 21) O Estado de São Paulo apresentou 733 986 matrículas na primeira série , no início do ano de 1973, e 683 816, no fim do ano. O Rio de Janeiro apresentou, respectivamente, 436 127 e 412 457 matrículas. Qual a diferença entre as taxas de evasão escolar dos dois estados nesse ano? (arredondamento a centésimos). a) 1,41 % b) 1,40 % c) 1,42 % d) 2,45 % e) 3,43 % 22) Um estado brasileiro tinha, em 2002, uma população estimada de 20 636 874 habitantes; sabendo-se que sua área terrestre é de 247 320 km2, calcule a sua densidade demográfica desse ano.(Arredondamento a centésimos). a) 84,35 hab/km2 b) 83,44 hab/ km2 c) 78,92 hab/ km2 d) 80,04 hab/ km2 Uma escola apresentava, no final de um ano, a seguinte tabela de matrículas: Séries Março Novembro Primeira 480 475 Segunda 458 456 Terceira 436 430 Quarta 420 420 Total 1794 1781 As questões 23, 24 e 25 dizem respeito à tabela acima. 23) Qual a taxa de evasão escolar da primeira série ? a) 2,34 % b) 4,35 % c) 1,45 % d) 1,04 % e) 3,23 % 24) Qual o coeficiente de evasão escolar, com aproximação a milésimos, da terceira série? a) 0,014 b) 0,14 c) 0,14 % d) 0,013 e)1,3% 25) Qual a taxa de evasão escolar da escola ? a) 0,75 % b) 0,71 c) 0,72 % d) 1,2 % e) 0,15 % 26) Qual a amplitude amostral dos dados: 1,2; 3,4 ; 0,9 ; 6,8 ; 1,4 ; 7,8 ; 1,7 . a) 6,7 b) 9,8 c) 0,5 d) 1,2 e) 6,9 27) Tendo havido uma epidemia na cidade A, com 108 casos em agosto e 12 casos em setembro, certo jornal publicou que houve uma diminuição de 800 % nos casos da doença. Está certa a notícia? Qual foi a redução correta do número de casos da doença? a) 11 % b) 66 % c) 79 % d) 89 % e) 20% Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 31 28) Foi feito um rol com os pesos dos 1000 alunos de um colégio. Aplicando-se a fórmula de Sturges, qual seria o número recomendado de classes para a distribuição de freqüências do tipo contínua? a) 10 b) 11 c) 12 d) 13 e) 14 29) Em uma distribuição de freqüências, para uma de suas classes obtivemos a freqüência absoluta igual a 12 e a freqüência relativa igual a 0,24. Pode-se dizer que o número de elementos da população observada é: a) 40 b) 25 c) 100 d) 24 e) 50 30) Qual o número aproximado ideal de classes, para uma distribuição de freqüências onde N = 312. Aplicar a relação de Sturges, sabendo-se que log 312 vale aproximadamente 2,5. a) 9 b) 8 c) 11 d) 10 e) 6 31) Observe a tabela: Unidades Escolares (Ensino Fundamental) Anos Quantidade 2002 189 900 2003 190 345 2004 195 400 2005 198 600 Fonte: Dados Fictícios Esta tabela é uma série do tipo: a) específica b) conjugada c) geográfica d) cronológica e) mista 32) Um conjunto de 500 notas de Estatística, extraídas dos arquivos da secretaria de um Colégio, constitui: a) Um rol b) uma relação de dados brutos c) uma tabela d) uma distribuição de freqüências e) um gráfico estatístico 33) As regras básicas para se construir uma distribuição de freqüências contínuas são: I. Nenhum dado deve ser excluído II. Nenhum dado deve ser computado mais de uma vez. III. As classes devem ser mutuamente exclusivas. IV. campo de variação da variável deve ser completamente esgotado. Destas regras: a) todas estão corretas b) todas estão erradas. c) só a segunda está errada. d) só a terceira está errada. e) só a quarta está correta. 34) Quando afirmamos que as classes de uma distribuição de freqüências devem ser mutuamente exclusivas, estamos querendo que: Estatística Descritiva Básica – prof. Ilydio Pereira de Sá a) b) c) d) e) 32 Nenhum dado seja excluído Nenhum dado seja contado mais de uma vez. todos os dados sejam computados. possamos exaurir totalmente o campo de variação da variável. Os limites de classe sejam considerados. 35) Os elementos fundamentais que o título de uma tabela deve conter são: a) veracidade, local e fonte b) fato, local e época c) veracidade , clareza e fato d) época, fonte e clareza. e) fonte, fato, local e época. As questões de 36 a 42 referem-se aos conceitos dos elementos de uma distribuição de freqüências e as simbologias usadas. Selecione, para cada questão, a alternativa correta. a) freqüência relativa b) freqüência absoluta c) limite de intervalo d) ponto médio e) população observada 36) É o ponto central de um intervalo de classe: 37) É o valor do extremo superior de um intervalo: 38) É o limite inferior do intervalo, acrescido da metade da amplitude do mesmo: 39) Simbologia: f / ∑f 40) (ll i + Li) : 2 41) Número de observações de cada dado: 42) Simbologia: ∑f i As questões de 43 a 45, dizem respeito à tabela seguinte: Pontos Alunos 0|-------- 5 02 5|-------- 10 05 10|-------- 15 15 15|-------- 20 08 Total 30 43) Qual a freqüência relativa, correspondente ao segundo intervalo? a) 0,15 b) 0,16 c) 0,17 d) 0,18 e) 0,19 44) Qual o ponto médio do último intervalo de classe? a) 15,0 b) 17,5 c) 20,0 d) 22,5 e) 12,5 Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 33 45) Qual a amplitude da distribuição: a) 10 b) 5 c) 15 d) 20 e) 24 46) A primeira etapa, de modo a se construir uma distribuição de freqüência contínua, consiste em calcular: a) a amplitude do intervalo de classe b) o limite inferior da primeira classe c) a amplitude total da distribuição d) o limite superior da última classe 47) A freqüência relativa é obtida: a) adicionando-se a freqüência absoluta ao somatório das freqüências posteriores b) dividindo-se a freqüência absoluta pelo produtório das freqüências. c) dividindo-se por dois o somatório das freqüências e multiplicando por 100. d) dividindo-se a freqüência absoluta pela freqüência acumulada crescente da última classe. e) nada disso As questões de 48 a 50 dizem respeito à tabela de preços abaixo, que representa a pesquisa em 20 lojas , referente a determinado produto: Preços em Número de Reais lojas 50 2 51 1 52 5 54 6 55 2 56 3 60 1 48) Qual o percentual de lojas que estão cobrando até R$52,00 (inclusive)? a) 45 % b) 40 % c) 36 % d) 50 % e) 60 % 49) Qual o percentual de lojas que estão cobrando acima de R$ 55,00? a) 15 % b) 30 % c) 40 % d) 25 % e) 20 % 50) Qual a freqüência relativa do preço mais caro da tabela? a) 2% b) 3 % c) 4 % d) 5 % e) 6 % "Não se pode ensinar tudo a alguém, pode-se apenas ajudá-lo a encontrar por si mesmo." Galileu Galilei, astrônomo italiano Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 34 51) (Concurso TTN - 1994) Considere a distribuição de freqüência transcrita a seguir: Peso (Kg) Freq. Simples 9 2 |-------- 4 12 4 |-------- 6 6 6 |-------- 8 2 8 |--------10 1 10|--------12 a) b) c) d) 65% das observações têm peso não inferior a 4 kg e inferior a 10 kg. Mais de 65 % das observações têm peso maior ou igual a 4 kg. Menos de 20 observações têm peso igual ou superior a 4 kg. A soma dos pontos médios dos intervalos de classe é inferior ao tamanho da população. e) 8% das observações têm peso no intervalo de classe 8 |____10 As questões 52, 53 e 54 dizem respeito à tabela abaixo: Número de Número de ítens pedidos 3 10 |--------- 15 7 15 |--------- 20 16 20 |---------25 12 25 |---------30 9 30 |---------35 5 35 |---------40 2 40 |---------45 Total 54 52) Assinale a alternativa errada: a) o número de elementos é 7. b) o limite inferior de segunda categoria é 15. c) o intervalo de classe é 5 d) o ponto médio da terceira categoria é 22,5. e) o número de elementos é 54. 53) Essa tabela é classificada como sendo de: a) dupla entrada ou bidimensional. b) simples ou unidimensional. c) cruzada. d) cronológica. e) geográfica. 54) Qual a porcentagem de pedidos abaixo de 25 itens? a) 48% b) 54% c) 45% d) 65% e) 25% Estatística Descritiva Básica – prof. Ilydio Pereira de Sá 35 55) Complete a distribuição de freqüências abaixo e determine a freqüência relativa da última classe (%). CLASSES Fi Fac 3 0 ________| 2 ? 8 2 ________| 4 8 4 ________| 6 10 6 ________| 8 28 8 ________|10 a) 7,14% b) 7,18% 21) A 26) E 31) D 36) D 41) B 46) C 51) B c) 6,47% 22) B 27) D 32) B 37) C 42) E 47) D 52) A d) 5,68% e) 7,23% GABARITO 23) D 24) A 28) B 29) E 33) A 34) B 38) D 39) A 43) C 44) B 48) B 49) E 53) B 54) A 25) C 30) A 35) B 40) D 45) D 50) D 55) A "Somos o que fazemos, mas somos, principalmente, o que fazemos para mudar o que somos." (Eduardo Galeano)