Atividades de Investigação - Médias e desvio Padrão Comparando dados Dado um conjunto de dados, na maioria das vezes é complicado trabalhar com todos os valores apresentados, seja por sua complexidade, seja por sua quantidade. Por exemplo: se seu chefe encontrar você no elevador e perguntar como foram as vendas no mês passado, ele provavelmente deseja que você lhe diga alguns números que lhe deem uma ideia das vendas. Ele não precisa de detalhes, mas de valores que resumam, sintetizem e caracterizem o conjunto total de dados. Dessa forma, com esse tipo de "informação gerencial" que você proporcionará, seu chefe estará melhor preparado para tomar decisões. Além do mais, apenas no tempo de uma viagem de elevador não é possível discorrer sobre um relatório detalhado. Do mesmo modo, quando o INEP (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira) realiza o ENEM, em momento algum, por mais formal que ele seja, as notas serão divulgadas individualmente. Pense bem o que seria um relatório com milhões de notas; provavelmente nada poderia ser inferido dele. O que pode interessar nesses milhões de notas, por exemplo, é a constatação de que houve ou não uma melhoria no nível dos estudantes. Como se pode ver, novamente faltam alguns números que resumam os milhões de notas dos alunos. Neste sentido, a Estatística tem uma contribuição fundamental, fornecendo ferramentas para organizar, analisar, interpretar e apresentar dados. Por exemplo: a Estatística criou medidas que dão a ideia do comportamento de diversos conjuntos de dados. As mais importantes e, consequentemente, as utilizadas com maior frequência, são as medidas de posição e as medidas de dispersão (ou variabilidade). Aqui serão trabalhadas apenas duas dessas medidas: a média e o desvio padrão. A média Define-se média como um conjunto de valores que tem como resultado a divisão da soma desses valores pela quantidade deles. Exemplo: Em uma determinada prova, que valia 10 pontos, os alunos de uma certa turma obtiveram as seguintes notas: 8,7 3,4 5,2 5,3 9,8 9,7 8,7 6,4 2,5 3,1 7,1 6,4 7,2 8,3 8,7 4,1 3,2 5,7 8,9 8,7 6,2 6,8 7,2 7,3 5,1 A nota média, então, será 8,7 3,4 5,2 5,3 ... 7,2 7,3 5,1 163,7 6,548 pontos. 25 25 Esse valor significa que, se todas as notas atribuídas fossem igualmente repartidas entre os alunos (quem tem nota alta dá seus pontos para quem tem notas mais baixas), então, o equilíbrio seria atingido, atribuindo-se 6,548 pontos para cada um dos 25 alunos. Interpretação da média Como explicado no exemplo acima, a média pode ser interpretada como o valor que deve ser atribuído a cada elemento (aluno) que compõe a turma, retirando de quem tem muito e aumentando de quem tem pouco, atingindo-se o equilíbrio, ou seja, igual valor a todos. Nem sempre essa interpretação é levada a termo e interpretações matematicamente incorretas normalmente surgem. Uma das mais comuns, que é muito difundida em comerciais, diz respeito ao estar acima da média ou abaixo da média. Por sua própria natureza, é usual que vários dos valores fiquem acima da média e que outros tantos fiquem abaixo da média, não necessariamente metade acima e metade abaixo, como muitos pensam. Desse modo, o aluno que obteve nota 6,8 pode afirmar que conseguiu uma nota acima da média (isto é correto), mas jamais pode considerar que isso é um feito extraordinário. Uma característica da média que necessita ser levada em conta para evitar interpretações errôneas é que ela é muito influenciada por valores extremados, ou seja, valores que são muito diferentes dos demais. Observe a tabela abaixo, que mostra o número de óbitos registrados no último ano, em um hospital de uma cidade do interior, com 10.000 habitantes: Mês Óbitos Mês Óbitos Mês Óbitos janeiro 12 maio 7 setembro 11 fevereiro 8 junho 12 outubro 9 março 10 julho 144 novembro 10 abril 9 agosto 8 dezembro 12 O dado de julho justifica-se pelo fato de que, nesse mês, houve um acidente aéreo no município e os feridos, muitos em estado gravíssimo, foram levados para o hospital. Para se ter uma ideia, 132 óbitos de julho foram devidos a esse acidente. Porém, independente dessa fatalidade, vamos determinar a média mensal de óbitos: m= 12 8 10 9 7 12 144 8 11 9 10 12 21. 12 Observe que, nesse caso, a média foi muito influenciada pelo resultado de julho, não retratando o que realmente ocorreu, ao longo do ano. Apesar disso, seu significado continua sendo o que foi dito anteriormente: se os óbitos fossem igualmente distribuídos, ao longo dos meses, aumentando nos valores baixos e reduzindo nos valores altos, então, o equilíbrio seria atingido, quando, em todos os meses, ocorressem 21 óbitos. Atividades 1) Suponha que você é o Secretário Municipal de Saúde da cidade retratada no exemplo anterior. Escreva um relatório para a autoridade de saúde estadual, informando a média de óbitos, em sua localidade, acompanhado de gráficos e tabelas que o ilustrem. Como o acidente aéreo seria informado? 2) Vários pais, principalmente os que têm um único filho, são muito influenciados por informações sobre o crescimento de suas crianças. Assim, se em algum livro está escrito que uma criança começa a falar, em média, aos 14 meses de idade, é comum que os pais se orgulhem, se seus filhos começam a falar com um ano de idade e procurem o pediatra, se a criança de 15 meses não fala ainda. a) Critique matematicamente esse comportamento dos pais. b) Que outra informação você precisaria para saber se uma criança está falando muito cedo ou muito tarde ? c) Critique matematicamente o comportamento do editor desse livro. O desvio padrão A média apenas é insuficiente para representar ou caracterizar uma sequência de valores. Além dessa medida de posição central, precisa-se de mais informações sobre esse conjunto de dados, a saber, ao menos, uma informação sobre a distribuição (dispersão, variabilidade) desses valores para uma análise mais correta e apurada deste conjunto de dados. Observe a tabela abaixo: Produção de cada máquina da indústria X (em milhares de peças) Máquina Jan Fev Mar 1 12000 12000 12000 2 11000 12000 13000 3 5000 6000 25000 Um cálculo rápido mostra que a produção mensal média de cada máquina é a mesma: 12000 peças. Porém, pelos dados apresentados, a produção da primeira máquina foi constante, a segunda máquina teve uma pequena variabilidade e a terceira máquina foi muito instável, ou seja, obteve valores muito discrepantes. A média é incapaz de detectar e representar essas variações. Como já visto, a Estatística desenvolveu o que se denomina de medidas de dispersão. Uma medida fácil para representar a variabilidade de um conjunto de dados é calcular sua amplitude. A amplitude é definida como a diferença entre o maior dado e o menor. No exemplo acima, a amplitude da máquina 1 é zero, da máquina 2 é 2000 e da máquina 3 é 20000. Observe que o fato de se conhecer essas amplitudes já dá uma idéia geral do comportamento das máquinas, principalmente o conhecimento de qual é a mais estável. Apesar disso, só a amplitude ainda é muito pouco para mostrar o comportamento dos valores. Há uma medida mais precisa para expressar a variabilidade dos dados, o desvio padrão. Ele é definido como a raiz quadrada da média dos quadrados dos desvios da média. Complicado, não? Melhor: cada dado tem um desvio da média, ou seja, se calculamos a diferença entre o dado e a média, temos uma medida de quão afastado da média esse dado está. Exemplo: para a máquina 2, mostrada na tabela acima, a produção média foi 12000 peças. O desvio da produção de janeiro foi de 11000 – 12000 = - 1000 peças (1000 peças abaixo da média). O desvio da produção de fevereiro foi 12000 – 12000 = 0 (a média) e o de março foi 13000 – 12000 = 1000 (1000 peças acima da média). Se tentássemos utilizar a média dos desvios dos dados para termos uma ideia da dispersão, não teríamos sucesso, pois a soma dos desvios da média de todos os dados sempre é zero (Por que?). Por isso, tomamos os quadrados desses desvios, que temos certeza que são todos positivos (Por que?). No nosso exemplo, (-1000)2, 02 e 10002, ou seja, 1000000, 0 e 1000000 novamente. Calculamos, então, a média desses valores, obtendo 1000000 0 1000000 = 666666,667. O desvio padrão é definido como sendo a raiz quadrada 3 desse resultado, no nosso exemplo, 816,4966. Observe que calculamos a raiz quadrada da média dos quadrados dos desvios da média dos valores. O significado do desvio padrão O desvio padrão dá uma ideia de como se distribuem os valores a partir da média, sendo um padrão de comparação de quanto um valor está afastado da média (daí seu nome: desvio padrão). Em geral, a maioria dos dados não se afasta mais que um desvio padrão da média (para mais ou para menos). Na realidade, na maioria dos exemplos, mais de 60% dos valores não se afastam mais que um desvio padrão da média. Assim, se dissermos que uma criança fala, em média, aos 14 meses de idade, com desvio padrão de 2 meses, significa que mais de 60% das crianças fala entre 12 e 16 meses, ou seja, não se afastam mais que 2 meses (um desvio padrão) da média. Dados com desvio padrão pequeno são mais homogêneos, ao passo que dados com um desvio padrão elevado são mais heterogêneos. Por isso, se diz que, naqueles conjuntos com baixo desvio padrão, a média é uma medida muito representativa dos dados apresentados. Por exemplo: se você quer comprar uma lâmpada e observa que a duração média da marca A é de 12000 horas, com desvio padrão de 2500 horas, e a duração média da marca B é de 11500 horas, com desvio padrão de 200 horas, saberá que as lâmpadas da marca A têm uma faixa de duração muito longa, pois mais de 60% das lâmpadas dessa marca duram entre 9500 e 14500 horas. Por outro lado, a mesma quantidade de lâmpadas da marca B duram entre 11300 e 11800 horas. Se você quer confiabilidade, peça a marca B. Se você pode, ou quer, se dar ao luxo de arriscar, prefira a marca A, pois a duração de sua lâmpada pode ser muito maior; ou muito menor, dependendo do ponto de vista. Calcule o desvio padrão dos dados da máquina 1 na tabela acima. Um desvio padrão zero só ocorre, quando os dados são exatamente iguais, ou seja, quando não há variabilidade entre os valores do conjunto de dados. Atividades 1) Márcia é a diretora de uma escola secundária que tem convênio com uma Faculdade que admite que seus alunos, com as melhores médias nos três anos do Ensino Médio, entrem na escola superior sem exame vestibular. Nesse momento, Márcia tem uma lista, mostrada abaixo, de 10 alunos que estão competindo para entrar na escola superior sem vestibular. As notas estão dadas por semestre e indicam a média obtida pelo aluno, em todas as disciplinas, durante esse semestre: Aluno 1 Semestre 2 Semestre 3 Semestre 4 Semestre 5 Semestre 6 Semestre Paulo 8.5 9.25 10 9.75 7.25 8 Roberto 10 10 9.75 9.75 9.5 10 Walter 7 7.5 8 8.75 8.5 8.5 Brian 7.25 7.5 8.75 7.25 7 7.25 Cristina 9 7.5 7.75 7.5 7.5 9 Evelyn 8 8.75 8.5 10 9.25 9.5 Joao 7 8.25 9.5 7.25 8.5 9.75 Augusto 9.25 9.75 9.75 9.5 9.75 10 Judith 6.5 6 7.5 6.25 7 6.5 Ema 9.25 8 7.5 8 9 8.75 a) Calcule a média das notas de cada aluno para os três anos apresentados na tabela. b) Interprete a tabela para determinar quais alunos poderão ingressar na Faculdade, sem exame de vestibular. 2) Projeção de fluxo de caixa. A Gerência Financeira de uma empresa dedicada à produção de autopeças está preparando uma projeção de créditos e débitos para os primeiros três meses do ano fiscal. A fim de obter a informação de que necessita, emitiu um comunicado interno à Gerência do Departamento de Vendas, pedindo que este prepare uma estimativa de vendas para os próximos três meses, com sua respectiva data estimada do ingresso efetivo do dinheiro. Logo que recebeu este informe, a Gerência Financeira elabora uma projeção de pagamentos para os próximos três meses. Veja os relatórios: Vendas Estimadas por Semana (do Departamento de Vendas) Semana 4 Fev – 9 Fev 11 Fev – 16 Fev 18 Fev – 23 Fev 25 Fev – 2 Mar 4 Mar – 9 Mar 11 Mar – 16 Mar 18 Mar – 23 Mar 25 Mar – 30 Mar 2 Abr – 7 Abr 9 Abr – 14 Abr 16 Abr – 21 Abr 23 Abr – 28 Abr Quantidade de vendas (unidades) 112.540 107.989 167.981 181.277 132.736 143.645 119.852 114.324 109.477 163.629 104.631 130.420 Preço unitário (R$) 1,55 1,55 1,55 1,55 1,59 1,59 1,59 1,59 1,59 17,70 1,70 1,70 Projeção de pagamentos por semana (Gerência Financeira) Semana 4 Fev – 9 Fev 11 Fev – 16 Fev 18 Fev – 23 Fev 25 Fev – 2 Mar 4 Mar – 9 Mar 11 Mar – 16 Mar 18 Mar – 23 Mar 25 Mar – 30 Mar 2 Abr – 7 Abr 9 Abr – 14 Abr 16 Abr – 21 Abr Gastos Estimados (R$) 130.787 116.509 167.902 175.400 149.771 152.026 124.980 112.464 127.908 171.811 113.353 23 Abr – 28 Abr 129.094 Com base nos dados apresentados e sabendo que, hoje, a empresa possui um saldo de R$ 568.457,35, determine o fluxo de fundos projetado e o respectivo saldo semanal, durante os próximos três meses. 3) Folha de pagamento. Suponha que você trabalha na área de contabilidade de uma empresa e está preparando, neste instante, as folhas de custo por empregado para apresentar em uma reunião. A ideia é que a folha de custo deve mostrar o custo real de cada empregado para a empresa. Os custos por empregado são constituídos por salário, os custos de espaço de escritório e máquinas utilizadas, além de outros gastos diversos. A seguir, vemos os dados de custos que você obteve. Custos Fixos Empregado Número Salário Anual Espaço Escritórios R$ 41.540 019 R$ 12.290 Uso de Máquinas R$ 20.263 106 R$ 13.804 Diversos R$ 13.798 204 R$ 15.468 233 R$ 11.065 552 R$ 18.004 a) Supondo que o critério dessa empresa é distribuir igual quantidade de custos fixos a cada empregado, calcule o custo médio por empregado de espaço, uso de máquinas e diversos. Organize os dados para elaborar uma tabela de custos anuais por empregado, em que se mostre os componentes de salários, espaço, uso de máquinas, diversos e o custo total. b) Apresente um gráfico que mostre apropriadamente esta distribuição de custos. c) Sugira um método alternativo de distribuição de custos fixos para esta empresa, defendendo que o que se usa, atualmente, não é adequado. 4) Chefe de pessoal. Suponha que você é o chefe de pessoal (ou de recursos humanos) de uma empresa e é sua função o processamento de informação referente a todos os empregados da empresa. Uma de suas tarefas mais importantes é a preparação de contra cheques a cada quinze dias. a) Qual é a informação básica que você necessita para poder determinar os salários a pagar aos empregados (incluído seu próprio salário). Pesquise em algumas empresas de sua cidade. b) Como você poderia obter essa informação de que necessita? A quem pediria informação, relatórios, etc? c) Que departamentos da empresa devem ser contactados para que o tratamento desta informação seja adequado e tenha a seriedade e privacidade necessárias? (Por que a privacidade?) d) Que tipo de informação deve ser recebida de fora da empresa para se conseguir que o tratamento da informação dentro da empresa seja o correto? e) Prepare um relatório (trabalhando em grupo) sobre o que você coletou, incluindo os gráficos e as tabelas que sejam necessários. 5) Cultivo de trigo. Mauro e Antônio são irmãos e têm quatro pequenos campos para cultivo. Hoje em dia, eles têm trigo, pois é época de colheita. - O campo número 1 é de 72 hectares e rende 9 toneladas por hectare. - O campo número 2 tem 128 hectares e rende 11 toneladas por hectare. - O campo número 3 tem 36 hectares e rende 8,8 toneladas por hectare. - O campo número 4 tem 64 hectares e também rende 8,8 toneladas por hectare. O preço de venda que Mauro e Antônio esperam obter é de R$ 300,00 por tonelada. a) Organize os dados do problema em uma tabela, indicando a área e o rendimento de cada campo. b) Prepare outra tabela, indicando, campo por campo, a quantidade estimada de colheita e o total de dinheiro a receber por Mauro e Antônio, se eles venderem todo o trigo. c) Com o preço obtido, Mauro afirmou que a margem de lucro sobre é de 30%. Qual é o custo aproximado de todo o trigo? d) Prepare gráficos que você considera convenientes para mostrar as situações relativas de cada campo e a relação custo-preço-lucro. 6) Temperatura e uso de água para irrigação. Você é o responsável operacional de uma represa de água para irrigação. Nessa função, de você depende a vazão de água que abastece o vale do rio São Francisco, mediante a abertura das comportas da represa. Normalmente as comportas estão abertas a um décimo de sua abertura total. Quando a temperatura máxima da água supera os 25 graus centígrados, durante dois dias seguidos, no terceiro dia, você deve abrir as comportas a 25% de sua abertura total, mantendo-as abertas a esse ritmo, até que volte a ter um dia de temperaturas menores que 25 graus centígrados. Na tabela a seguir estão os dados de temperatura máxima registrados durante o mês passado: Dom Seg Ter Qua Qui Sex Sab 26,5 25,5 22,3 23,7 23,8 27,1 27,4 27,4 31,2 29,5 22,5 21,9 22 25,7 24,5 23,5 23,1 21,1 26,7 26,9 29,9 31,4 28,7 25,6 23,7 23,1 25,3 25,9 28 30,6 a) Faça um gráfico com os dados da tabela acima para mostrar a evolução da temperatura durante este mês. b) Elabore algum tipo de gráfico onde sejam mostrados os dias em que a comporta esteve aberta a 10% e os dias em que a comporta esteve aberta a 25% de sua capacidade. c) Se a cada hora em que a comporta está aberta a 10% se liberam 400 metros cúbicos de água, e a cada hora que a comporta está aberta a 25% se liberam 1000 metros cúbicos de água, determine de quantos litros de água foi a vazão do mês passado. d) Quantos metros cúbicos de água se liberariam como máximo e como mínimo, de acordo com a informação que você tem da represa? e) Para que é necessária esta informação? 7) Composição das parcelas em planos de financiamento. Todos sabemos que, quando compramos algum produto financiado, temos o pagamento de juros nas prestações. Aprendemos em Matemática como determinar a taxa de juros desses planos de financiamento com prestações constantes. Podemos dizer que, dentro de cada pagamento fixo, há o pagamento dos juros do período anterior e uma amortização do saldo devedor. Por exemplo, se um produto custa R$ 120,00 e é comprado em duas prestações, sem entrada, de R$ 65,00, então (use sua HP 12C) os juros cobrados são de 5,5064 % ao mês. Assim, no seu primeiro pagamento de R$ 65,00, você está pagando R$ 6,61 (5,5064% de R$ 120,00) de juros, e os R$ 58,39 restantes amortizam sua dívida, que passa a ser de R$ 61,61 após esse pagamento. Suponha que você quer comprar um televisor em uma loja e o vendedor lhe apresenta o seguinte plano de financiamento: Preço do televisor R$1.000,00 Prestação mensal R$178,53 Quantidade de prestações Seis (6) Taxa de Juro mensal 2% Sem entrada a) Determine a composição de cada pagamento mensal de R$178,53, ou seja, quanto de juros e quanto de amortização do capital contém cada uma das seis parcelas. Mostre seus resultados graficamente. b) Que efeito teria, se você pagasse, junto com a terceira parcela, um adicional de R$100,00 e refinanciasse o restante em pagamentos iguais à mesma taxa? Faça uma tabela e um gráfico representando isto. 8) Estudo de solos. Você acaba de receber os resultados da análise que um engenheiro agrônomo fez em um campo de sua propriedade, onde você pretende plantar amendoim. Os resultados da análise são os seguintes: Nitrogênio 34 Kg/hectare Fósforo 31 Kg/hectare Potássio 265 Kg/hectare Com esta informação, você deverá decidir se, para plantar amendoim, é necessário, ou não, fazer algum tipo de fertilização do campo. Os requerimentos técnicos necessários para plantar amendoim são os seguintes: Nitrogênio: de 11 a 23 kg/hectare no início da fertilização Fósforo: Há no solo (kg/hectare) Porcentagem suficiente P2 O5 (kg/hectare) 0 – 11 40 68 – 91 12 – 23 60 45 – 68 24 – 45 80 23 – 45 46 – 74 95 Solo al inicio 75 + 100 Nada Potássio: Há no solo (kg/hectare) Porcentagem suficiente K2O (kg/hectare) 0 – 85 40 68 – 91 86 – 142 60 45 – 68 143 – 227 75 34 – 45 228 – 284 90 23 – 34 285 + 100 Nada a) Interprete os requerimentos técnicos para que se possa determinar quanto de fósforo e de potássio deve haver no solo para se plantar amendoim (por exemplo, o que nas tabelas figura como 100% suficientes). b) Determine se é necessário fertilizar o campo para plantar amendoim. c) Pesquise, nas lojas especializadas, qual é a apresentação comercial deste tipo de produto (por exemplo, bolsas de XX kg que contienen x% de nitrogênio, E% de fósforo e Z% de potássio) e elabore um relatório a ser apresentado à classe. 9) Impacto de novas informações nas finanças de um clube de futebol. O responsável financeiro de um clube de futebol está analisando as finanças para determinar a prestação anual que se deve cobrar de seus 28.900 associados. A escala de partidas para o ano que vem compreende as 40 partidas do campeonato oficial mais 10 partidas amistosas. A média de arrecadação por partida oficial jogada em casa é de R$300.000,00 e as jogadas como visitante é de R$125.000 por partida. Suponhamos que a metade das partidas é em casa e a outra metade, como visitante. As partidas amistosas são contratadas à parte e, por isso, não geram custos adicionais ao clube. Os gastos do clube são os seguintes: a) Salários dos jogadores: plantel de 30 jogadores com uma média mensal de R$10.000,00 por jogador. b) Salários com pessoal de manutenção e limpeza: R$200.000,00 anuais c) Salários administrativos: R$160.000,00 anuais d) Energia e outros (partidas em casa): R$500.000,00 por partida e) Reforma e manutenção de instalações (vestiários, etc.): R$140.000,00 anuais f) Dívida a pagar este ano a um ex-jogador do clube: R$3.000.000,00 Quanto se deverá cobrar, como prestação anual, a cada associado para balancear as contas do clube? As novas informações são as seguintes: Como consequência do problema de energia no país, o custo originalmente estimado será incrementado em 38%. Foi vendido um jogador muito importante do clube por US$1.250.000 Como consequência da realização do campeonato mundial de futebol neste ano, acreditase que as arrecadações, por partidas oficiais, serão reduzidas em 10%. Perguntas: a) Analise estas novas informações e apresente tabelas e gráficos, indicando os efeitos de cada uma delas na informação financeira feita para determinar a prestação anual a se cobrar de cada sócio do clube. Indique se será necessário ajustar a prestação anual e faça uma carta comunicando esse fato aos sócios.