DICAS DO ENEM MATEMÁTICA TEMA 5: Probabilidade e Estatística AUTOR: Itamar Nogueira Hernandes Mais próxima, para você ir mais longe. 1. Interpretação 6. Equações e problemas 2. Porcentagem Matemática ENEM.2014 5. Probabilidade e Estatística 3. Cálculo simples 4. Geometria TEMA 5: Probabilidade e Estatística Autor: Itamar Nogueira Hernandes HERNANDES, Itamar Nogueira. Matemática: Probabilidade e Estatística. Valinhos, 2014. TEXTO E CONTEXTO Pag. 04 GLOSSÁRIO Pag. 09 VOCÊ ESTÁ PRONTO? Pag. 10 REFERÊNCIAS Pag. 14 GABARITO Pag. 15 © 2014 Kroton Educacional. Proibida a reprodução final ou parcial por qualquer meio de impressão, em forma idêntica, resumida ou modificada em língua portuguesa ou qualquer outro idioma. TEXTO E CONTEXTO Probabilidade e Estatística Imagine se você pudesse prever o futuro. Essa é, talvez, uma das grandes buscas do ser humano em todas as esferas de atuação. Na agricultura, saber se vamos ter uma temporada de chuvas ou de geada poder ser muito útil; na economia, saber de antemão o movimento dos agentes econômicos pode ajudar na alocação de recursos; nos negócios, compreender qual será a demanda pelos produtos e serviços de uma empresa pode ser útil na contratação dos diversos recursos necessários; para a polícia, saber onde ocorrerão os crimes certamente ajudaria muito; enfim, prever o futuro seria uma vantagem enorme para quem detivesse essa habilidade. No entanto, isso não é possível, por mais que muitos chamem para si a posse dessa habilidade. Talvez isso ocorra nas crendices, mas este não é o espaço para isso. Na ciência, os métodos de criação de conhecimento devem seguir um padrão elevado de comprovação de sua utilidade. Ao longo do tempo, durante o desenvolvimento do conhecimento humano, tentamos criar técnicas notadamente úteis para interpretar melhor o passado, ou seja, encontrar nos fatos já ocorridos padrões, características particulares, as regras mais explícitas e as menos explícitas de cada fenômeno. Isso, inicialmente, por meio de técnicas simples como, por exemplo, contar as coisas, ou seja, enumerar. Com o desenvolvimento das técnicas, outros elementos foram sendo colocados nesse processo de contagem para enriquecer e melhorar a interpretação dos eventos. Qual a média de ocorrência de um fato específico? Sendo a média um padrão geral para todos os eventos, mas não sendo a regra geral para cada evento específico, quanto cada evento foge, em média, dessa regra padrão? Melhorando a pergunta: temos um evento, por exemplo, o salário de cada operário de uma fábrica. Cada um tem o seu salário, dependendo do seu cargo e função. No entanto, podemos encontrar uma espécie de salário médio para os funcionários dessa fábrica, digamos que seja de R$ 1.800. Mas perceba que essa é a média dos salários. Essa média é calculada seguindo essa lógica: 4 TEXTO E CONTEXTO Tabela 5.1: Cálculo da média de salários. Operários Operário 1 Salário de cada Operário R$ 1.300,00 Operário 2 R$ 1.300,00 Operário 3 R$ 1.400,00 Operário 4 R$ 1.400,00 Operário 5 R$ 1.700,00 Operário 6 R$ 2.000,00 Operário 7 R$ 2.000,00 Operário 8 R$ 2.200,00 Operário 9 R$ 2.200,00 Operário 10 R$ 2.400,00 Soma de todos os salários R$ 18.000,00 Número de Operários Média de Salário em R$ 10 R$ 1.800,00 Temos então, pela tabela, a soma dos salários de todos os operários, que é igual a R$ 18.000. Após isso, dividimos pelo número de funcionários, que é igual a 10, e essa divisão resulta em R$ 1.800. O valor da média significa que os ganhos dos funcionários daquela fábrica giram entorno de R$ 1.800, não significa que todos ou que alguém ganha R$ 1.800, mesmo que eventualmente isso possa ocorrer. Veja que a média é uma informação importante, na verdade é uma das principais medidas dentro da estatística, mas ela por si só não explica muito o que ocorre dentro de uma população (no nosso exemplo, a população são os operários de uma empresa). Uma informação relevante é saber, após tendo o conhecimento da média, o quanto os valores dos salários estão espalhados ao redor dessa média. Por exemplo, sendo a média R$ 1.800, será que são todos próximos de R$ 1.800, como R$ 1.850, R$ 1.750, R$ 1.825, R$ 1.795, e assim por diante, ou se eles estão mais espalhados, como na Tabela 5.1, indo de R$ 1.300 a R$ 2.500. Vamos pensar assim: se temos a média de um grupo (população) e o valor das amostras (salários) estão mais concentrados em pontos próximos da média, entre R$ 1.700 e R$ 1.900, ficará mais fácil prever qual vai ser o salário de cada operário. 5 TEXTO E CONTEXTO Mas, do contrário, se os valores das amostras (valores dos salários) estiverem mais espalhados ao redor da média, indo de R$ 1.300 a R$ 2.500, por exemplo, ficará mais difícil fazermos algum tipo de previsão. A essa forma como as amostras estão desviadas da média, ou como estão dispersas entorno da média, chamamos de desvio padrão. É como se observássemos o quanto cada amostra (salário de cada operário) desvia da média calculada. Veja que na Tabela 5.2 temos as etapas de cálculo do desvio padrão: Tabela 5.2 – Cálculo do desvio padrão. Operários Operário 1 Operário 2 Operário 3 Operário 4 Operário 5 Operário 6 Operário 7 Operário 8 Operário 9 Operário 10 Soma de todos os salários Número de Operários Média de salários por operário em em R$ Salário de cada operário (a) R$ 1.300 R$ 1.300 R$ 1.400 R$ 1.400 R$ 1.700 R$ 2.000 R$ 2.000 R$ 2.200 R$ 2.200 R$ 2.500 R$ 18.000 10 R$ 1.800 Média (b) R$ 1.800 R$ 1.800 R$ 1.800 R$ 1.800 R$ 1.800 R$ 1.800 R$ 1.800 R$ 1.800 R$ 1.800 R$ 1.800 O quanto cada amostra desvia da média (a-b = c ) Calcula-se o quadrado dos desvios ( c2) = (d) -R$ 500 -R$ 500 -R$ 400 -R$ 400 -R$ 100 R$ 200 R$ 200 R$ 400 R$ 400 R$ 700 R$ 250.000 R$ 250.000 R$ 160.000 R$ 160.000 R$ 10.000 R$ 40.000 R$ 40.000 R$ 160.000 R$ 160.000 R$ 490.000 Soma dos desvios = Número de Operários - 1 = R$ 1.720.000 9 Variância dos desvios Desvio padrão = R$ 191.111 437,1625683 Vamos acompanhar a continuação da Tabela 5.1, que agora acrescenta as informações de desvio padrão da amostra. Veja que na coluna “a” temos as informações sobre os salários e na coluna “b”, a informação da média que já havíamos 6 TEXTO E CONTEXTO calculado na coluna 1 (Tabela 5.1). Na coluna “c” simplesmente subtraímos o salário de cada operário (a) da média dos salários (b). Na coluna “d” elevamos ao quadrado essa diferença, isso ajuda a eliminar os números negativos. E finalmente, somamos esses quadrados e dividimos pelo número de amostras (operários) menos 1 (10 – 1 = 9). Chegamos ao valor de R$ 191.111 que é conhecido como variância. Se calcularmos a raiz quadrada da variância, chegamos ao valor e R$ 437,16 que é o tão famoso desvio padrão. Esse valor mostra o quanto de variação ou de dispersão existe em relação à média, lembrando que a média é também chamada de “valor esperado”. Para tudo isso que acabamos de abordar existem alguns símbolos próprios muito utilizados e que vale a pena conhecer. Os cálculos que fizemos nas Tabelas 5.1 e 5.2 possuem uma representação por meio de uma fórmula, que é assim: Para se calcular a média: ∑ n x= 1 n xi= x 1 + x2 + ... + xn n i=1 Onde: x, é a média dos valores (média da população) ou valor esperado. xi, é cada observação da nossa amostra (cada informação de salário) de operários. n, é o número de observações, no nosso caso, o número de operários. ∑, letra grega sigma, significa somatório, no nosso caso, o somatório de todos os termos presentes na amostra ou população. Em resumo, a média é o somatório (∑) de todos os termos (xi) dividido pelo números de termos/observações (n). Para calcular o desvio padrão: 7 TEXTO E CONTEXTO ∑ n s= 1 n-1 (xi - x)2 i=1 Em relação à nomenclatura dos termos, veja que apenas o s aparece como fator novo quando comparamos com a fórmula de cálculo da média. O s significa desvio padrão. Em resumo, essa fórmula quer dizer: a) Para cada valor xi calcular a diferença entre este valor e a média x . b) Eleva-se essas diferenças ao quadrado. c) Somamos então todas essas diferenças que foram elevadas ao quadrado. d) Divide-se essa soma pela quantidade de termos menos um, ou seja, divide-se por n-1. e) Então, calculamos a raiz quadrada desse resultado. Aqui vale uma observação: os passos seguidos até o passo indicado na letra d fazem com que cheguemos a um resultado que representa uma outra medida estatística chamada variância. Variância é também uma medida de dispersão que nos indica o quão espalhados estão os valores de uma população em comparação com o valor esperado (média). A diferença básica em relação ao desvio padrão é que este nos é dado na mesma unidade de medida dos elementos que estão sendo mensurados, tornando mais fácil sua visualização e interpretação. Sua fórmula está descrita a seguir: ∑ n s2 = 1 n-1 (xi - x)2, i=1 Repare que a variância é uma etapa do cálculo do desvio padrão. Nesse momento, vamos voltar ao nosso exemplo da fábrica que fez um levantamento dos salários dos funcionários. 8 TEXTO E CONTEXTO Repare que saber estimar a média de salários de uma fábrica é importante por diversos motivos. Se vamos abrir uma outra fábrica, esse conhecimento seria importante para o planejamento dessa nova fábrica. O governo poderia estimar esses salários para fins de projetar alguma política de emprego ou de estímulo à economia, ou mesmo como forma de planejamento tributário, enfim, são diversas as vantagens de saber dominar as técnicas estatísticas e entender a probabilidade de que certos eventos possam ocorrer. Na estatística, sua principal ideia e maior virtude não é poder adivinhar ou prever o futuro, isso não está ao seu alcance, mas sim aumentar a probabilidade de se conhecer o resultado de algum evento no futuro a partir do conhecimento de eventos semelhantes do passado. Se estatisticamente um evento tem pouca chance de ocorrer, por que apostar nele para o futuro? A ideia é melhorar a previsibilidade e o poder de planejamento da ação humana e seus recursos. Se conhecermos melhor o passado, poderemos projetar melhor as probabilidades de acontecimento futuro de diversos eventos relevantes para a vida do homem. GLOSSÁRIO Estatística: A estatística é a ciência que coleta e analisa dados em grandes quantidades, numéricos ou que possam ser classificados para fins de sistematização de análise, especialmente para o propósito de inferir conclusões sobre um todo a partir de suas partes. Probabilidade: A extensão na qual algum evento tem a chance de acontecer. Normalmente, tenta-se estabelecer algum tipo de razão, proporção ou porcentagem de chance para expressar essa possibilidade. Média: É o valor que busca localizar o ponto em que há a maior concentração de observação. É o ponto em que se observa o equilíbrio dentro de uma distribuição. Desvio padrão: É uma das medidas mais comuns de dispersão e busca mostrar qual a variação que existe da amostra 9 GLOSSÁRIO ou da população em relação à média da mesma amostra ou população. Um baixo desvio padrão significa que os valores das amostras se encontram concentrados próximo da média enquanto um alto desvio padrão significa que estão dispersos ao redor da média. Variância: Variância é também uma medida de dispersão que nos indica o quão espalhados estão os valores de uma população em comparação com o valor esperado (média). A diferença básica em relação ao desvio padrão é que este nos é dado na mesma unidade de medida dos elementos que estão sendo mensurados, tornando mais fácil sua visualização e interpretação. VOCÊ ESTÁ PRONTO? Instruções Agora, chegou a sua vez de exercitar seu aprendizado. A seguir, você encontrará algumas questões de múltipla escolha e dissertativas. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido. Questão 1 - As chances de se ganhar na Mega-Sena Um jogo bem popular da loteria nacional é a Mega-Sena. É o jogo que costuma pagar os maiores prêmios por aqui. Este jogo consiste em escolher 6 dezenas dentre 60 para uma aposta mínima. Mas apostadores podem fazer jogos mais audaciosos ao escolher mais de seis dezenas, porém, quanto mais números se joga, muito mais cara vai ficando a aposta. Para se ter uma ideia, a aposta mínima com 6 dezenas tem o custo para o apostador de R$ 2,50, já se você fizer um jogo com 15 números, o valor da aposta pula para R$ 12.512,50. Nada barato! Na verdade esse aumento substancial no valor da aposta reflete o aumento substancial das chances de se acertar uma maior quantidade de números. A probabilidade de se acertar a sena em uma aposta simples de 6 números é 1:50.063.860 e a probabilidade de se acertar a sena em uma aposta de 15 números é 1:10.003, ou seja, muito mais “fácil”. Sobre as características desse jogo, assinale a alternativa correta: a) 1:50.063.860 significa que a cada real gasto na aposta simples temos a chance de ganhar R$ 50.063.860. E que a cada real 10 VOCÊ ESTÁ PRONTO? gasto na aposta com 15 números podemos ganhar R$ 10.003. b)O aumento no valor em reais de uma aposta simples para uma aposta de 15 números é exatamente proporcional ao aumento das chances de ganhar. c) O aumento das chances de ganhar na sena de uma aposta simples para uma aposta com 15 números jogados é de quase 100%, logo, a chance de se ganhar com uma aposta 15 números é de quase 100%. d)A chance de se ganhar com uma aposta de 15 números é de 0,010% aproximadamente. e) A chance de se ganhar com uma aposta de 15 números é de 10% aproximadamente. Questão 2 Sempre que chegamos em época de eleições, os noticiários ficam repletos de divulgação de resultados de pesquisas de opinião. Recentemente, um jornal de grande circulação noticiou os resultados da última pesquisa para o primeiro turno das eleições para Presidente da República e o resultado foi o que segue: Se a eleição fosse hoje, segundo a pesquisa, o resultado seria: Candidato A teria 51% dos votos. Candidato B teria 31% dos votos. Candidato C teria 10% dos votos. Candidato D teria 8% dos votos. A margem de erro é de 3 pontos percentuais, para cima ou para baixo. Sobre essa pesquisa, podemos dizer: a) Pelas técnicas modernas hoje disponíveis, as pesquisas representam fielmente o que vai ser o resultado das eleições caso elas aconteçam logo após o término da pesquisa. b)As pesquisas de opinião são uma tentativa de antecipar os resultados futuros das eleições. Baseiam-se em uma amostragem da população apta a votar, de qual, com técnicas estatísticas apropriadas, buscam delinear o futuro resultado. Contudo, tais 11 VOCÊ ESTÁ PRONTO? pesquisas são passíveis de erro. c) Sendo esta uma eleição que contempla um segundo turno, certamente, pelos resultados dessa pesquisa, não haverá segundo turno, já que temos um candidato que possui mais de 50% dos votos e a soma de todos os outros candidatos não alcança o percentual de votos do candidato A. d)Pela margem de erro declarada na metodologia da pesquisa (3%), podemos dizer que o provável resultado do candidato A pode variar entre 50% a 52%. e) Se após a apuração real dessa eleição ficar constatado que o candidato A recebeu 50% dos votos, ou seja, 1% abaixo do que foi declarado na pesquisa de opinião, e mesmo assim dentro margem de erro, os demais candidatos terão comportamento semelhante quanto à margem de erro e o resultado provável dos demais candidatos será: Candidato B terá recebido 30% dos votos; candidato C terá recebido 9% dos votos; e candidato D terá recebido 7% dos votos. Questão 3 - Recordes da Copa do Mundo de Futebol O Portal da Copa, site do Governo Federal Brasileiro sobre a Copa do Mundo da FIFA 2014TM, destaca o seguinte texto: “A 20ª Copa do Mundo chegou ao fim, mas ficará na história do torneio por vários motivos. Além da festa registrada fora das arenas, dentro de campo alguns recordes foram batidos. A começar pelo que o torcedor mais gosta: gols. Ao todo, o Mundial no Brasil teve 171 bolas nas redes, número que iguala ao torneio de 1998 na França, que registrava sozinho a maior marca de tentos até então. A média ficou em 2,67 gols por partida, a décima segunda de todas as edições da competição.” Portal da Copa – 14/07/2014: Disponível em <http://www.copa2014.gov.br/pt-br/noticia/copa-do-mundo-no-brasil-tem-171-gols-e-iguala-maiormarca-da-historia-do-torneio>. Acesso em: 3 ago. 2014. Considerando esse texto sobre a Copa do Mundo, podemos afirmar: a) O texto contém erro grave quanto à média de gols do campeonato, pois como foi fartamente divulgado, houve resultados de partidas com muito mais gols, por exemplo, o jogo do Brasil contra a Alemanha em que o Brasil foi derrotado por 7 a 1. b)O texto está claramente tendencioso e cai em contradição. Uma dessas contradições é dizer que houve recorde de gols marcados, porém, possui somente a décima segunda melhor média de gols da história de todas as copas. c) Pelo texto, podemos chegar à conclusão de que essa copa teve 64 jogos. 12 VOCÊ ESTÁ PRONTO? d)A média de 2,67 gols por jogo informada no texto é outro sinal de impropriedade dessa informação, já que pelas regras do futebol não se pode marcar um gol valendo 0,67 gol. e) Por apresentar uma média tão alta de gols, podemos chegar à conclusão de que não houve jogos que terminaram em zero a zero. Questão 4 - Série histórica sobre divórcio no Brasil Leia o texto a seguir: “Divulgada pelo Instituto Brasileiro de Geografia e Estatística (IBGE) nesta segunda-feira, dia 7, as Estatísticas do Registro Civil apontam taxa de divórcios recordes no País. De acordo com os registros, 351.153 divórcios foram realizados em 2011, um crescimento de 45,6% em relação a 2010, quando foram registrados 243.224 divórcios. É a maior taxa desde 1984, quando a série de estatísticas foi criada. O número representa 2,6 divórcios para cada mil habitantes acima de 15 anos de idade. Um dos fatores apontados pelo IBGE como responsável pelo aumento na taxa é a mudança na Constituição Federal realizada em 2010, que encurtou os prazos para a realização do divórcio. Agora os casamentos civis podem ser dissolvidos de forma efetiva, sem que haja etapa prévia de separação.” Revista Brasileiros – 17/12/2012 Disponível em: <http://www.revistabrasileiros.com.br/2012/12/17/ibge-brasil-registra-taxa-de-divorcios-recorde/#.U97n3_ldWjB>. Acesso em: 3 ago. 2014. Agora, escolha a alternativa correta sobre a interpretação dessa matéria. a) O número de 351.153 é a maior taxa de divórcio de todos os tempos. b)A taxa de 351.153 divórcios representa uma taxa de 2,6% de divórcios entre habitantes acima de 15 anos de idade. c) 2,6 pessoas se separam a cada mil habitantes. d) A taxa de 351.153 divórcios representa uma taxa de 2,6‰ de divórcios entre habitantes acima de 15 anos de idade. e) O IBGE, no momento da divulgação dessa pesquisa, possuía uma série histórica deste tipo evento de mais de 30 anos. 13 VOCÊ ESTÁ PRONTO? Questão 5 Assinale a alternativa que melhor descreva as características e utilidades da informação de desvio padrão em estatística: a) Quanto maior o desvio padrão, maior a chance dos dados estarem próximos da média. b)Quanto menor o desvio padrão, menor a chance dos dados estarem próximos da média. c) O conceito de desvio padrão é igual ao conceito de variância, inclusive na forma de calcular, sendo, assim, sinônimos. d)Desvio padrão é o mesmo que média aritmética. e) Sua grande utilidade é mostrar quanto de variação ou de dispersão existe em relação à média de uma amostra ou população. REFERÊNCIAS BUSSAB, Wilton de Oliveira; MORETTIN, Pedro Alberto. Estatística Básica. 8 ed. São Paulo: Saraiva, 2013. FIALHO, Gabriel. Copa no Brasil tem 171 gols e iguala maior marca do torneio. Público total é o segundo da história. Portal da Copa. Disponível em: <http://www.copa2014.gov.br/pt-br/noticia/copa-do-mundo-no-brasil-tem-171-gols-eiguala-maior-marca-da-historia-do-torneio>. Acesso em: 3ago. 2014. IBGE: Brasil registra taxa de divórcios recorde. Revista Brasileiros. Disponível em: <http://www.revistabrasileiros.com. br/2012/12/17/ibge-brasil-registra-taxa-de-divorcios-recorde/#.U97n3_ldWjB>. Acesso em: 3 ago. 2014. 14 GABARITO Questão 1 Resposta: Alternativa “d”. Pelo texto pegamos a informação de 1:10.003 , que é a chance de acerto para uma aposta de 15 números, e processamos a informação para representar o resultado em porcentagem. 1/10.003 = 0,01% de acertar, ou ainda, 99,99% de errar a aposta. Questão 2 Resposta: Alternativa “b”. As pesquisas de opinião sobre as eleições representam a aplicação de técnicas estatísticas para tentar coletar uma grande quantidade de dados sobre a opinião de votos dos eleitores, contudo, está sujeita a erros e imprecisões inerentes ao processo de estimar dados futuros. Questão 3 Resposta: Alternativa “c”. Apenas calcule o número de partidas pelo cálculo da média de gols por partida e substitua na expressão a seguir as informações disponíveis no texto: Número de Gols / Número de Partidas = Média de gols por partida 171 / X = 2,67 X = 64 Questão 4 Resposta: Alternativa “d”. O próprio texto informa essa taxa, sendo apenas necessário entender o sinal de “‰” para melhor interpretar a questão. Questão 5 Resposta: Alternativa “e”. Veja no texto da aula as definições para o conceito de desvio padrão, média e variância. 15 Mais próxima, para você ir mais longe. unopar.br