COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 1 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 2 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 3 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 4 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 5 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 6 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 7 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 8 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 9 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 10 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS ESTATÍSTICA 1. INTRODUÇÃO A Estatística trata dos métodos científicos para coleta, organização, resumo, apresentação e análise de dados, visando também a tomada de decisões. Ao coletar dados sobre as características de um conjunto de elementos, nem sempre é possível considerar todos os elementos, ou seja, toda a população ou universo. Considera-se, então, apenas uma parte do todo, chamada de amostra. No caso de pesquisa em uma eleição, por exemplo a população é formada por todos os cidadãos que têm direito ao voto, e a amostra é formada pelos eleitores que serão entrevistados. 2. VARIÁVEIS Suponhamos que um colégio esteja interessado em traçar um perfil de seus alunos do Ensino Médio. Para isso, escolhe uma amostra de 20 alunos para deles colher as seguintes informações: sexo, idade, área da profissão que pretende seguir e o número de irmãos. Os resultados obtidos estão apresentados na tabela a seguir. Cada um dos itens pesquisados constitui uma variável. As variáveis sexo e área pretendida são denominados qualitativas, enquanto que idade e número de irmãos são quantitativas. ORDEM 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 SEXO masculino masculino feminino masculino feminino feminino masculino masculino masculino feminino feminino masculino masculino feminino feminino feminino masculino masculino masculino masculino IDADE 16 17 15 14 14 15 15 15 19 15 17 17 16 15 16 18 15 18 19 14 ÁREA PRETENDIDA Humanas Biológicas Humanas Exatas Exatas Biológicas Biológicas Exatas Humanas Biológicas Humanas Humanas Humanas Humanas Biológicas Humanas Exatas Exatas Biológicas Biológicas Nº DE IRMÃOS 2 3 2 1 1 0 0 1 3 1 4 0 1 2 2 2 1 3 4 1 3. FREQUÊNCIA Para que melhor se possa interpretar os dados colhidos, o primeiro passo a ser dado consiste na contagem do número de vezes que cada opção ocorre em cada variável. O número obtido para cada opção é denominado frequência absoluta e indicado por ni. 11 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS Como exemplo (1), consideremos na tabela anterior o número de alunos de acordo com área pretendida. Teremos: - Exatas: 5 - Biológicas: 7 - Humanas: 8 Ainda na tabela anterior, se considerarmos o número de alunos de acordo com a idade, teremos: - 14 anos: 3 - 15 anos: 7 - 16 anos: 3 - 17 anos: 3 - 18 anos: 2 - 19 anos: 2 Para determinar a influência de cada uma dessas frequências na amostra, calculamos a frequência relativa e representamos por fi. Ela é definida como sendo a razão entre a frequência absoluta e o número total de observação (n), isto é: fi ni n Para os exemplos tomados anteriormente, teríamos as seguintes tabelas de frequência relativa: IDADE ni fi % ÁREA ni fi % 14 anos 3 3/20 = 0,15 15% Exatas 5 5/20 = 0,25 25% 15 anos 7 7/20 = 0,35 35% Biológicas 7 7/20 = 0,35 35% 16 anos 3 3/20 = 0,15 15% Humanas 8 8/20 = 0,4 40% 17 anos 3 3/20 = 0,15 15% 18 anos 2 2/20 = 0,1 10% 19 anos 2 2/20 = 0,1 10% Exemplo: Para a variável estado civil da tabela anteriormente apresentada, construímos a seguinte tabela de freqüência: Frequência absoluta (ni) Frequência relativa (fi) Porcentagem (%) Separado 3 3 0,15 20 15 Solteiro 7 7 0,35 20 35 Casado 8 8 0,40 20 40 Viúvo 2 2 0,10 20 10 Total 20 1,0 100 Estado civil 12 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS Exemplo: Considerando a variável renda mensal familiar, é possível agrupar os dados brutos nas seguinte classes: Frequência absoluta (ni) Frequência relativa (fi) Porcentagem (%) ˫8 2 2 0,1 20 10 ˫ 11 5 5 0,25 20 25 ˫ 14 7 7 0,35 20 35 Renda familiar (em salários mínimos 5 8 11 14 ˫ 17 4 4 0,2 20 20 17 ˫ 20 2 2 0,1 20 10 20 1,0 100 Total 4. REPRESENTAÇÃO GRÁFICA 4.1. Gráfico de Setores É uma representação que consiste em dividir um círculo em tantos setores circulares quantas sejam as opções da variável a ser representada. Os ângulos centrais dos setores deverão ser proporcionais às frequências relativas de cada opção. No exemplo (1) anterior, a variável área pretendida seria assim representada: 13 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 4.2. Gráfico de Barras No exemplo (1) anterior, a variável idade poderia ser representada por um gráfico de barras verticais, conforme abaixo. 5. MEDIDAS DE CENTRALIDADE Para analisar como se distribuem os valores de uma variável quantitativa, é necessário estabelecer um valor médio ou central e outro valor que indique o grau de variabilidade dos dados. 5.1. Média Aritmética Sejam x1, x2, x3, ... , xn os valores de n observações de determinada variável X. Definimos a média aritmética (que é indicada por x ) como a razão entre a soma de todos os valores observados e o número total de observações: x x1 x 2 L xn 1 n xi n n i1 No exemplo (1) anterior, a média das idades obtidas seria calculada assim: x 16 17 15 14 14 15 15 15 19 15 17 17 16 15 16 18 15 18 19 14 320 16 20 20 5.2. Mediana Sejam x1 x2 x3 ... xn os n valores ordenados de uma variável X. A mediana (Me) desse conjunto de valores será o seu valor central, se n for ímpar, e a média aritmética dos dois termos centrais, se n for par. Ordenando-se as 20 idades obtidas no exemplo (1) anterior, temos: 14, 14, 14, 15, 15, 15, 15, 15, 15, 15, 16, 16, 16, 17, 17, 17, 18, 18, 19, 19 Como n = 20 é par, a mediana será a média aritmética entre o 10º e o 11º termos, isto é: Me 15 16 15,5 2 5.3. Moda Denomina-se moda (Mo) ao valor mais frequente de uma sequência de dados de uma variável. No exemplo (1) anterior, a moda das idades é Mo = 15, pois foi a mais frequente entre os valores pesquisados, com ni = 7. Caso numa variável pesquisada, dois valores apresentem a maior frequência, dizemos que ela possui distribuição bimodal. 6. MEDIDAS DE DISPERSÃO 14 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS A média de uma variável não revela o grau de homogeneidade ou heterogeneidade dos seus dados. Por isso, para melhor interpretá-los, é necessário que se defina uma medida que revele o grau de variabilidade desses dados. 6.1. Variância Sejam x1, x2, x3, ... , xn os valores assumidos por uma variável X e x a média aritmética desses valores. Chamase variância de X, e representa-se por Var(X), ao número real positivo obtido pela relação abaixo: Var(X) (x1 x)2 (x 2 x)2 L (xn x)2 1 n (xi x)2 n n i1 Consideremos o seguinte exemplo (2): um grupo de 5 alunos apresentou ao fim do curso, em Matemática, as seguintes médias: 5,0; 6,0; 5,0; 4,0; 5,0. Em Português, apresentaram as médias 1,0; 8,0; 5,0; 2,0; 9,0. Observe que, nas duas disciplinas, a média dos alunos foi 5,0. Porém calculando as suas variâncias respectivas, temos que: Var (M) (5 5)2 (6 5)2 (5 5)2 (4 5)2 (5 5)2 0,4 5 Var (P) (1 5)2 (8 5)2 (5 5)2 (2 5)2 (9 5)2 10,0 5 O primeiro valor, Var(M) = 0,4, mostra que as notas de Matemática apresentaram pequena dispersão. Isto significa que o resultado nessa disciplina foi bastante homogêneo. Já o seguindo, Var(P) = 10,0, indica que em Português houve alto índice de dispersão, portanto as notas foram bastante heterogêneas. 6.2. Desvio-Padrão Observe que a variância é uma medida quadrada, portanto de unidade diferente da dos dados apresentados. Isso impede que se possa compará-la com aqueles. Por isso, define o desvio-padrão (), expresso na mesma unidade dos dados e calculado pela fórmula abaixo: = Var(X) 1 n (x1 x)2 n i1 No exemplo (2) anterior, o desvio-padrão das disciplinas Matemática e Português, ficariam assim, respectivamente: SM 0,4 0,63 SP 10 3,16 CÁLCULO DA VARIÂNCIA E DO DESVIO PADRÃO O cálculo da variância e do desvio padrão de uma variável que apresenta seus valores distribuídos em intervalos utiliza a mesma hipótese usada no cálculo da média: dentro de cada intervalo, os valores estão homogeneamente distribuídos. Consideremos a situação de distribuição de salários de uma empresa com 200 funcionários, representada na tabela: 15 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS Faixa salarial (em salários mínimos) Ponto médio (xi) Número de funcionários (freqüência absoluta: ni) ˫6 4 45 ˫ 10 8 63 ˫ 14 12 36 2 6 10 14 ˫ 18 16 31 18 ˫ 22 20 17 22 ˫ 26 24 8 Temos: 6 x xn i1 6 n i1 i i 4 45 8 63 12 36 16 31 20 17 24 8 180 504 432 496 340 192 2 144 10,72 SM 200 200 200 i Para cada intervalo, avaliamos o desvio quadrático do ponto médio correspondente em relação à média encontrada: Intervalo Ponto médio Desvio quadrático ˫6 4 (4 – 10,72)2 = 45,16 ˫ 10 8 (8 – 10,72)2 = 7,39 ˫ 14 12 (12 – 10,72)2 = 1,64 2 6 10 14 ˫ 18 16 (16 – 10,72)2 = 27,88 18 ˫ 22 20 (20 – 10,72)2 = 86,11 22 ˫ 26 24 (24 – 10,72)2 = 176,36 Fazemos a média desses desvios, ponderando-os pelas freqüências absolutas correspondentes, isto é: = 45 45,16 63 7,39 36 1,64 31 27,88 17 86,11 8 176,36 200 = 2 032,2 465,57 59,04 864,28 1 463,87 1 410,88 200 = 6 295,84 31,48 SM2 200 Logo, o desvio padrão = 31,84 5,64 SM. Exemplo: 16 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS Os 200 funcionários de uma empresa foram submetidos a exames clínicos para avaliação de saúde. Na tabela seguinte, aparece o resultado do exame de dosagem de colesterol. a) Qual é a taxa mediana de colesterol, em MG, por dL de sangue? b) O teste sugere que, se a taxa média de colesterol exceder 235 mg/dL de sangue, deve-se iniciar uma campanha de prevenção com os funcionários. Com base nesse exame, verifique se será necessário iniciar a campanha preventiva. EXERCÍCIOS PROPOSTOS Questão 01 Os dados ordenados abaixo referem-se ao tempo de espera (em minutos) de 10 pessoas que foram atendidas em um posto de saúde durante uma manhã. 1 ; 5 ; 8 ; 9 ; x ; 16; 18; y ; 23 ; 26 Sabendo que o tempo médio de espera foi de 14 minutos e o tempo mediano foi de 15 minutos, podemos afirmar que x e y valem, respectivamente: a) b) c) d) e) 15 e 22 14 e 20 13 e 21 10 e 19 9 e 19 Questões 02 e 03: Num levantamento realizado em 100 jogos de futebol de um torneio, foram colhidos os seguintes dados: Número de gols por partida Frequência de jogos 0 28 1 26 2 31 3 9 4 4 5 2 Questão 02 Podemos afirmar que a moda e a mediana do número de gols são, respectivamente: a) 1 e 1,5 b) 1,5 e 1,5 c) 1,5 e 1 d) 2 e 1 e) 2 e 2 Questão 03 O desvio-padrão do número de gols marcados em cada partida é aproximadamente igual a: a) b) c) d) e) 1,21 1,03 1,67 0,64 2,39 Questão 04 Observe os seguintes conjuntos de valores: 17 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS A: 12; 8; 7 B: 9 ; 4 ; x Existem dois valores para x tais que as variâncias obtidas nos dois conjuntos são iguais. São eles: a) 4,5 e 9 b) 4 e 8 c) 4 e 11 d) 5 e 8 e) 5 e 11 Questão 05 (PUC-MG) Em uma pesquisa eleitoral para verificar a posição de três candidatos a prefeito de uma cidade, 1500 pessoas foram consultadas. Se o resultado da pesquisa deve ser mostrado em um gráfico de setores, e certo candidato recebeu 350 intenções de voto, qual o ângulo central correspondente a este candidato? a) 42º b) 168º c) 90º d) 242º e) 84º Questão 06 (UFBA) De acordo com o Boletim do Serviço de Meteorologia de 07 de junho de 2000, o quadro abaixo apresenta a temperatura máxima, em graus Celsius, registrada em Fernando de Noronha e nas capitais da Região Nordeste do Brasil. Aracaju Fernando de Noronha Fortaleza João Pessoa Maceió Natal Recife Salvador São Luis Terezina 27 ºC 30 ºC 31 ºC 30 ºC 27 ºC 30 ºC 30 ºC 26 ºC 32 ºC 32 ºC Com base nessas informações, pode-se afirmar: (01) O gráfico abaixo representa a distribuição de frequência das temperaturas. (02) A frequência relativa da temperatura de 31 ºC é igual a 10%. (04) Representando-se a frequência relativa por meio de um gráfico de setores, a região correspondente à temperatura de 27ºC tem ângulo de 36º. (08) A média aritmética das temperaturas indicadas no quadro correspondente a 29,5ºC. (16) A mediana das temperaturas registradas é igual à temperatura modal. (32) A amplitude das temperaturas é de 32ºC. Questão 07 O gráfico seguinte informa a distribuição do tempo de serviço (em anos) dos funcionários de uma pequena empresa. 18 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS Qual é o tempo médio de trabalho dos funcionários dessa empresa? Questão 08 Calcule a moda e a mediana de cada um dos seguintes conjuntos de valores: a) 9 8 8 7 10 12 11 8 8 7 6 14 10 b) 0 0 0 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 c) 40 44 42 23 36 40 d) 0,6 0,7 0,7 0,5 0,8 0,6 0,4 0,9 Questão 09 Calcule o desvio padrão dos seguintes conjuntos de valores: a) 2 3 4 5 6 b) 2 2 3 4 4 c) (– 2) (–1) ( –1) 0 1 3 d) 1 1 1 1 1 2 8 4 5 10 e) 70 65 60 60 65 68 72 60 Questão 10 19 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS O gráfico seguinte mostra os números relativos aos turistas estrangeiros que estiveram no Brasil no período de 1998a 2002. Qual é o desvio padrão dos dados apresentados? Questão 11 A Secretaria de Saúde de uma cidade está interessada em saber com que freqüência semanal seus habitantes praticam atividades físicas. Para isso, uma equipe entrevistou n pessoas e os resultados encontram-se no gráfico seguinte: a) Determine o valor de n. b) Qual é a média das freqüências de atividades físicas? c) Qual é a moda e a mediana dos dados obtidos? d) Qual é o desvio padrão dos dados obtidos? RESPOSTAS 20 COLÉGIO MATEMÁTICA E SUAS TECNOLOGIAS Módulo VI VILAS 1. B 2. D 3. A 4. D 5. E 6. 27 7. 2,89 8. a) Mo = 8; Me = 8 b) Mo = 3; Me = 2 c) Mo = 40; Me = 40 d) Mo = 0,6 e 0,7; Me = 0,65 9. a) 1,414 b) 0,894 c) 1,633 d) 0,142 e) 4,45 10. 516 140 turistas, aproximadamente 11. a) 76 b) 2,5 vezes por semana c) Mo = 2; Me = 2 d) 1,24 21