Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Estatística Descritiva Aplicada "ADM" Prof. Esp. Bruno César de Mattos Sorriso, 2012 Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Atenção A avaliação da disciplina é feita da seguinte maneira: 1º) A cada bimestre será dada uma prova com questões referentes as aulas dadas. A nota desta prova terá peso 8. 2º) No fim de cada módulo o aluno terá que entregar o trabalho correspondente que está no fim do módulo na apostila e terá uma nota. A média destas notas terá peso 2. 3º) A nota de cada bimestre será a média ponderada daquelas notas. Se a média final não for no mínimo 6, o aluno poderá fazer uma prova substitutiva onde a matéria cobrada será do semestre todo. Essa nota substituirá a menor nota das duas provas feitas. BOM CURSO Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos "A Estatística é a sofisticada técnica matemática de torturar os números, até que eles confessem". Sir George Bernard Shaw (Dublin, 26 de julho de 1856 — Ayot Saint Lawrence, 2 de novembro de 1950) foi um dramaturgo, romancista, contista, ensaísta e jornalista irlandês. É autor de comédias satíricas que o tornaram espírito irreverente e inconformista. Introdução A noção de “Estatística” foi originalmente derivada da mesma raiz da palavra “Estado”, já que é uma função tradicional dos governos armazenarem registros da população, tais como nascimentos e mortes, produção das lavouras, taxas e muitas outras espécies de informação e atividades. A contagem e mensuração dessas quantidades geram todos os tipos de dados numéricos que são úteis para o desenvolvimento de muitos tipos de funções governamentais e formulação de políticas públicas. Os métodos estatísticos são usados hoje em quase todos os campos de investigação científica, já que eles capacitam-nos a responder a um vasto número de questões. Como os cientistas avaliam a validade de novas teorias? Como os pesquisadores médicos testam a eficiência de novas drogas? Como os demógrafos prevêem o tamanho da população do mundo em qualquer tempo futuro? Como pode um economista verificar se a mudança atual no Índice de Preços ao Consumidor é a continuação de uma tendência secular, ou simplesmente um desvio aleatório? Como é possível para alguém predizer o resultado de uma eleição entrevistando apenas algumas centenas de eleitores? Estes são poucos exemplos nos quais a aplicação da estatística é necessária. Podemos presumir que a matemática é uma das rainhas das ciências porque ela fornece a estrutura teórica para quase todas as outras ciências. As teorias matemáticas estão sendo desenvolvidas todos os dias em muitas áreas por estatísticos teóricos treinados em teoria estatística e probabilidade. Vamos citar alguns casos ilustrativos onde elas são desenvolvidas: teoria dos vôos espaciais em física; teorias do conhecimento do comportamento animal e humano em psicologia; teorias da migração e dos diferenciais de raça em sociologia; teorias de epidemias em saúde pública, etc. A maioria das pessoas possui o entendimento de que a palavra “fenômeno” significa alguma coisa que foge do senso comum, ou seja, uma coisa extraordinária diferente daquelas observadas no dia-a-dia. Ou então que seja uma pessoa que se distingue por algum talento extraordinário, ou então, animal ou objeto excepcional por alguma particularidade ou prodígio. Porém nos estudos científicos o entendimento de fenômeno é qualquer aspecto ou ocorrência passível de observação, que seja de interesse científico, suscetível de descrição ou explicação. Em ciências consideramos dois tipos de fenômenos: Determinístico: que é aquele que sabemos antes de executarmos um experimento, qual é resultado que iremos obter. Estes fenômenos são estudados, por exemplo, em disciplinas como a biologia a física e a química. Via de regra, são os mais fáceis de entender. Aleatório: que é aquele cujo resultado de um experimento é imprevisível. A palavra aleatória vem do latim “alea” que significa por acaso, por sorte. Essa palavra ficou famosa no tempo por ter sido usada pelo general Julio César quando disse “alea jacta est”, que significa “a sorte está lançada”, quando atravessou o rio Rubicão para ir guerrear contra os Helvécios. Os engenheiros, por exemplo, trabalham mais frequentemente com fenômenos determinísticos enquanto que os economistas com fenômenos aleatórios. Essas profissões é que usam a estatística para tirar duvidas de uma serie de fenômenos por eles estudados. Muitos fatos cujos resultados para nós seriam lógicos e evidentes, apresentam resultados que às vezes contradizem daqueles esperados. Daí a razão de se estudar estatística para testar hipóteses a respeito de fatos que achamos lógicos e desnecessários de sofrerem pesquisa para saber o resultado. Por exemplo, na segunda guerra mundial acreditava-se que a capacidade dos soldados procedentes do sul suportarem o clima quente na guerra seria mais fácil que a dos soldados vindos do norte acostumados com o clima frio. Também se acreditava que os homens de nível educacional mais alto apresentariam maior quantidade de sintomas psíquicos neuróticos do que aqueles que eram broncos e menos educados. Após a pesquisa realizada por métodos estatísticos a respeito desses dois fatos que pareciam conter verdades óbvias, se mostraram que na realidade o que aconteceu foi exatamente o contrário. A coleção de dados numéricos é a parte inicial da Estatística, sendo apenas a matéria-prima, que precisa ser transformada pelos “métodos estatísticos” para posterior análise. A Estatística é um método científico, e se refere a projeto de experimentos, descrição e interpretação das observações feitas a respeito de qualquer fenômeno aleatório. Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Do ponto de vista moderno, a Estatística é freqüentemente definida como um método de tomada de decisão em face da aleatoriedade dos fenômenos. Em uma vasta perspectiva, o escopo da estatística pode ser pensado em termos de três áreas diferentes de estudos: a) Estatística Descritiva (Refere-se ao corpo de métodos desenvolvidos para coletar, organizar, apresentar e descrever dados numéricos.) b) Estatística Indutiva (É a área que trata e apresenta a metodologia de amostragem.) c) Teoria da Decisão Estatística. Essa área da Estatística refere-se às seguintes tarefas: a) Encontrar um método apropriado de coletar dados numéricos eficientemente e acuradamente para um dado problema. b) Determinar um formato eficiente, tal como uma apresentação tabular, para a organização dos dados de uma forma sistemática e ordenada, de maneira que a informação fornecida pelos dados possa ser observada com grande facilidade e precisão. c) Apresentar dados numéricos que sejam organizados ou não, de forma que as características e o comportamento deles sejam clara e facilmente revelados. Tais apresentações são feitas por meio de métodos gráficos. d) Sumarizar ou descrever cada característica ou propriedade dos dados por um simples número, tal como a média, a porcentagem ou alguma outra medida apropriada, a qual é calculada a partir dos dados por meio de fórmula derivada a partir de algum princípio válido. Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Tipos de Variáveis na Estatística As variáveis que iremos estudar neste curso, serão unidimensionais, ou seja, para cada elemento da população iremos associar apenas uma característica que estamos interessados em estudar. Exemplos: peso, altura, consumo de carne, resistência de vigas, etc. A estatística requer o desenvolvimento de formas particulares de pensamento e raciocínio, que serão utilizados em experimentos que envolvem fenômenos aleatórios, que servirão para interpretar resultados amostrais, fazendo inferências, comunicando resultados obtidos nas pesquisas, através de linguagem matemática apropriada. Muitos são os conhecimentos exigidos para esse aprendizado considerando que a estatística necessita da base de outras disciplinas que nos ajudam a interpretar resultados de pesquisas amostrais. Ao estudante cabe aprender quais são os procedimentos adequados que deve adquirir para coletar, organizar, comunicar e interpretar dados, através de tabelas, gráficos e outras representações matemáticas, descrevendo e interpretando a realidade dos fenômenos aleatórios estudados. Método é o caminho pelo qual se atinge um objetivo. Ou seja, é o meio mais eficaz para atingir determinada meta desejada onde destacamos o método experimental e o estatístico. O método experimental consiste em manter constante todas as causas, menos uma, que sofre variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc. Pode-se dizer que a Estatística é um método matemático criado para organizar dados obtidos numa pesquisa a respeito de um conjunto de coisas que possuem as mesmas características sobre as quais pretendemos estudar. Estes elementos pertencem a um conjunto universo denominado de “População”, que podem ser medidos, contados, pesados ou classificados, A variável de interesse a ser estudada é denominada de variável aleatória, e podem ser de dois tipos: "Qualitativas ou Quantitativas". O método estatístico, portanto é aquele que diante da impossibilidade de manter as causas constantes (como nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à estatística descritiva, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da estatística indutiva ou inferencial, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade. Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. Na fase do planejamento como levantar as informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades? Os custos envolvidos? etc. A coleta de dados é a fase operacional. É o registro sistemático de dados, com um objetivo determinado. É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição. A coleta direta é feita quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. A coleta indireta é feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, avaliação, indícios ou proporcionalização. A apuração dos dados é o resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados. Para a apresentação dos dados há duas formas de apresentação, que não se excluem mutuamente. A apresentação tabular, ou seja, é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística. A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. A análise e interpretação dos dados é a ultima fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). O dado estatístico é um dado numérico e é considerada a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. A população é o conjunto total de elementos portadores de, pelo menos, uma característica comum. Amostra é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. Parâmetros são valores singulares que existem na população e que servem para caracterizá-la. Estatísticas são os valores extraídos da amostra. Para definirmos um parâmetro devemos examinar toda a população. Ex: Os alunos de uma escola têm em média 1,70m de estatura. Estimativa é um valor aproximado do parâmetro e é calculado pelas estatísticas que são o resultado das medidas na amostra. Atributo é quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários para o tratamento desses dados são designados genericamente de estatística de atributo. Variável é o conjunto de resultados possíveis de um fenômeno. Existem diversos tipos de variáveis que serão utilizadas em um estudo estatístico. É importante compreender o conceito matemático de variável. Variável é uma abstração que se refere a um determinado Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos aspecto do fenômeno que está sendo estudado. Podemos afirmar que a quantidade colhida da safra anual de soja é uma variável. Essa variável pode assumir diversos valores específicos, dependendo dos anos de safra. Variáveis Quantitativas São as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. Variáveis discretas: Características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia. Variáveis contínuas: Características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. Variáveis Qualitativas (ou categóricas) São as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais. Variáveis nominais: Não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. Variáveis ordinais: Existe uma ordenação entre as categorias. Exemplos: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Medidas de posição ou de tendência central Estas medidas são as mais conhecidas na estatística, embora a exata compreensão do que significam é desconhecida pela maioria das pessoas que normalmente as usam ou interpretam erroneamente. A medida de posição mais característica de uma distribuição estatística é a média aritmética, seguida da moda e mediana. Cada uma dessas medidas possui características próprias e devem ser usadas corretamente para representar cada tipo de problema estudado. Elas são chamadas de medidas de tendência central pelo fato dos seus valores ficarem invariavelmente próximas do valor central da distribuição. Portanto é fácil reconhecer se o valor obtido para estas medidas está certo, pois basta fazermos o "rol" dos elementos que estamos estudando e verificar se os resultados estão próximos do meio. Rol dos Elementos: É a ordenação crescente ou decrescente de todos os valores estudados em uma amostra. Média aritmética Esta é a medida mais conhecida na estatística numa distribuição de variáveis aleatórias, e como todas as outras, tem a tendência de ficar no centro da distribuição. A média, portanto significa "o meio da distribuição" em termos dos seus valores. É importante observar que para o cálculo da média levamos em consideração todos os elementos da distribuição e, portanto, ela fica muito influenciada pelos valores extremos. Os parâmetros estatísticos são calculados para uma População enquanto que as estatísticas são calculadas para uma Amostra. População é o conjunto total dos elementos que possuem a característica que estamos interessados em estudar, e amostra é uma parte bem menor da população que retiramos para estudar o que está acontecendo na população. Assim chamamos “grupo de dados”, amostras feitas com 30 elementos ou menos, cujo tratamento matemático é diferente de quando temos bem mais de 30 elementos, quando então passamos a usar um tratamento chamado de “dados agrupados”. Para um grupo qualquer de “n” elementos de valores "xi", definimos como média aritmética desses valores a expressão: Σx Ma i n onde os valores xi representam cada valor dos elementos estudados. Na estatística não existe diferença entre o cálculo da média amostral e a populacional, porém para diferenciarmos uma da outra usamos símbolos diferentes para o seu cálculo. Assim utilizamos: x x2 x3 ..... xn Média Amostral: x 1 n Média Populacional: μ x1 x2 x3 ..... xn N Se, porventura, tivermos valores “ x i ” repetidos “ fi ” vezes, cada um deles, a expressão acima se torna: μ Σfi xi N A média calculada desta forma fica parecida com a “média ponderada”, onde os valores " fi " são os pesos atribuídos àqueles elementos que estamos estudando e, que possuem pesos diferentes dos outros, da mesma forma como os pesos adotados nas notas das provas e trabalhos que os professores usam para compor a nota final da disciplina. Os alunos na sua grande maioria não entendem o que é um “peso” na composição da nota. Todas as provas que o professor aplica valem 10 pontos. O peso que ele usa para elas é que varia. A maioria dos professores de uma faculdade W utiliza peso 8 para a prova regimental e peso 2 para o trabalho. O que isso quer dizer? Significa que para obter a nota final do bimestre o professor multiplica a nota da prova (que vale de 0 a 10) por 8 e a nota do trabalho (que vale de 0 a 10) por 2. A nota final do bimestre será, portanto a soma daquelas operações dividida por 10. Média harmônica Outra medida de tendência central é a média harmônica, definida como sendo o inverso da média aritmética dos inversos dos valores, ou seja: Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Mh n 1 1 1 1 .... x1 x2 x3 xn onde os valores xi representam cada valor dos elementos que estamos calculando a média e “n” é a quantidade deles. Esta média é usada em física para cálculos de velocidades médias. Média geométrica Outra medida de tendência central muito usada em economia para cálculos de inflação, é a média geométrica definida como sendo a “raiz enésima” do produto dos "n” valores em estudo, ou seja: Mg n x1x2 x3 .....xn A média harmônica é sempre a menor e, a aritmética a maior. Mediana Para calcular a mediana de uma população a primeira coisa a ser feita é o rol. A mediana é o valor do elemento pertencente à distribuição, que fica exatamente no meio dela, ou seja, o número de elementos que fica para frente é igual ao dos elementos que ficaram para traz. A diferença fundamental entre a média e a mediana é que, para o cálculo da média, levamos em consideração todos os elementos da distribuição, e a mediana é o valor de um só. Se o número de elementos a ser considerado for par, a mediana será o valor da média aritmética dos dois valores que estiverem no meio da distribuição. Esta medida deve ser usada para representar distribuições que possuem valores muito diferentes em suas extremidades, pois este fato muda consideravelmente o valor da média que conseqüentemente não irá representar corretamente essa distribuição. Moda Por definição, a moda é o mesmo valor da distribuição que aparece mais vezes, ou seja, com maior freqüência. Em alguns casos, a distribuição pode apresentar mais de uma moda. Se forem duas, é bimodal, se forem mais de duas, plurimodal. Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Exercícios de aplicação a) Calcule a média aritmética, geométrica, harmônica, a moda e a mediana dos seguintes dados: 2,3 2,1 3,0 2,7 2,0 2,3 1,8 2,0 2,7 2,0 Tabela Resumo Média aritmética f x Ma i i n Média geométrica Mg n x1x2 x3 .....xn Média harmônica Moda Mediana n Mh 1 1 1 1 .... x1 x2 x3 xn É o valor que mais aparece É o valor que fica no meio Rol(ordem crescente) b) Idem para os valores: 37 38 36 37 36 39 36 37 Rol Média aritmética Média geométrica Média harmônica Moda Mediana C) Idem para os valores: 2 3 4 9 5 1 7 6 10 7 2 2 8 4 2 1 1 7 10 1 7 8 1 7 2 6 2 10 9 1 8 8 5 3 7 4 10 5 5 3 4 3 4 10 4 8 2 6 8 Rol Média aritmética Média geométrica Média harmônica Moda Mediana Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Tarefa mínima Para cada uma das questões abaixo, assinale uma alternativa correta. 1. A variável nominal é aquela cuja mensuração envolve simplesmente o ato de nomear ou rotular, colocando os elementos em categorias e contando a freqüência com que eles ocorrem. Certo ( ) Errado ( ) 2. Quando um pesquisador consegue, de alguma maneira, ordenar as variáveis que possuem um atributo qualquer, ele está trabalhando com variáveis do tipo intervalar. Certo ( ) Errado ( ) 3. A média aritmética é a razão entre: a) o número de valores e o somatório deles; b) o somatório dos valores e o número deles: c) os valores extremos; d) os dois valores centrais. 4. Na série 60, 90, 80, 60, 50 a moda será: a) 50; b) 60; c) 66; d) 90. 5. A medida que tem o mesmo número de valores abaixo e acima dela é: a) a moda; b) a média c) a mediana; d) o lugar mediano. 6. Na série de valores 4, 5, 6, 7, 8, 9, 10, 11 a mediana será: a) 7 c) 7,5 b) 8 d) não tem 7. Na série 60, 50, 70, 80, 90 o valor 70 será: a) a média e a moda; b) a média e a mediana; c) a mediana e a moda; d) a média, a mediana e a moda. 8. Quando queremos saber qual questão de uma prova apresentou maior número de erros, utilizamos a: a) moda; b) média; c) mediana; d) qualquer das anteriores. 9. Média, mediana e moda são medidas de: a) dispersão; b) posição; c) assimetria; d) curtose. 10. Uma empresa possui dois serventes recebendo salários de R$2.500,00 cada um, quatro escriturários recebendo R$6.000,00 cada um, um chefe de escritório com salário de R$10.000,00 e três técnicos recebendo R$22.000,00 cada um. A média destes salários é: a) R$10.500,00; b) R$5.050,00; c) R$26.250,00; d) n. r. a.. 11. O valor dominante de uma distribuição de freqüência chama-se: a) mediana; b) média; c) moda; 12. Na série 10, 20 40, 50, 70, 80, a mediana será: a) 30; b) 35; c) 40; d) 1º quartil d) 45. 13. Na série 15, 20, 30, 40, 50, há abaixo da mediana: a) 3 valores; b) 2 valores; c) 3,5 valores; d) 4 valores. 14. Sabemos que 50% dos dados da distribuição situam-se: a) abaixo da média; b) acima da mediana; c) abaixo da moda; d) acima da média. 15. Assinale a alternativa correta: a) A medida de posição menos utilizada é a moda. b) A medida de posição mais importante é a mediana. c) A medida de posição mais importante é a média. d) A medida de posição mais utilizada é a média. e) As alternativas c e d estão corretas. Respostas: 1-C 2-E 3-b 4-b 5-c 6-c 7-b 8-a 9-b 10-a 11-c 12-d 13-b 14-b 15-e Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Medidas de dispersão As medidas de dispersão na estatística mostram como os valores da distribuição estão dispersos em torno da média, ou seja, medem o Grau de Homogeneidade da Distribuição. Quanto maior for este valor, significa que os valores estudados estão mais dispersos em torno da Média e, significando que a distribuição é mais espalhada e, portanto não muito homogênea. Um valor relativamente grande em função dos valores estudados para qualquer medida de dispersão indica que a distribuição estudada é muito dispersa em relação a média e, portanto a sua homogeneidade fica comprometida. Qual a importância da amostra ser homogenia? Garantir que varias amostras são equivalentes; comprova que uma dada amostra realmente fala a verdade. Desvio médio A primeira medida que os estatísticos pensaram fazer, para determinar a dispersão dos elementos em torno da média foi achar a média dos desvios ou discrepâncias, que são quantidades definidas como: di xi x O desvio médio ficou então definido na forma: dm xi x n Porém a soma das discrepâncias numa distribuição dá sempre zero, por esta razão, esta medida não pode ser usada para determinar a dispersão dos elementos de uma distribuição. Desvio médio absoluto Como a medida anterior não tinha significado pelo fato de dar sempre zero, foi necessário construir outro modelo matemático para calcular a dispersão dos elementos em torno da média: xi x definiu-se então o valor médio do módulo das discrepâncias na forma: dm n Porém esta medida não se mostrou de grande valia nas aplicações práticas. Variança ou desvio médio quadrático O modelo matemático que deu certo foi definido como sendo o valor médio da soma das discrepâncias ao quadrado, e que se tornou um dos principais parâmetros da Estatística. Esta medida é calculada diferentemente para uma população e para uma amostra. Para uma amostra quando houver elementos repetidos, por definição, a variância vale: S2 fi (xi x)2 n 1 x i = são os valores de cada uma das variáveis na amostra x = a média daqueles valores. n = número total dos elementos na amostra fi = quantidade dos valores repetidos Para uma população quando houver elementos repetidos, por definição, a variância vale: onde: σ2 i f (xi μ )2 N onde: x i = são os valores de cada uma das variáveis na população µ = a média daqueles valores. N = tamanho da população fi = quantidade dos valores repetidos Desvio padrão Como a variância é uma grandeza elevada ao quadrado, conseqüentemente a unidade da grandeza estudada também ficará ao quadrado. Assim, se estivermos estudando uma grandeza do tipo comprimento (m), a 2 variância dessa grandeza será dada numa unidade de área (m ). Para se evitar este problema, podemos voltar a unidade original, bastando extrair a raiz quadrada da Variança que dá origem ao desvio padrão. Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 2 δ = √S Coeficiente de variação Essa medida faz a comparação entre o desvio padrão e a média da distribuição, estabelecendo um valor de dispersão em termos relativos, que é expresso em porcentagem, portanto o resultado obtido da expressão deve ser multiplicado por 100. Esta dispersão relativa serve para se comparar o valor da homogeneidade de uma distribuição em relação a outra. 100s Por definição, o coeficiente de variação para a população vale: CV = m % E o coeficiente de variação para a amostra vale: CV = 100S % x Exercícios de aplicação Dados os valores abaixo, calcule a Média, Variança, Desvio-Padrão e o Coeficiente de Variação deles. a) 5 7 9 8 6 8 9 Média Variância R: 7,43 Desvio padrão R: 2,29 Coeficiente de variação R: 1,51 R: 20,32% b) 15 16 18 16 18 Média Variância R: 16,6 Desvio padrão R: 1,8 Coeficiente de variação R: 1,34 R: 8,07% Adiciornar mais um exercício e tarefa mínima! Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Distribuição de freqüências O conjunto de valores obtidos numa população, a respeito da qual vamos efetuar um estudo estatístico, são denominados de dados brutos. O tratamento estatístico sobre esses dados é feito através de processos utilizados para descrever, organizar, analisar e interpretar-los. Para tanto, existem procedimentos a serem seguidos, sempre feitos da mesma forma, iniciando-se com a determinação de quantas classes devemos usar e, qual deve ser o valor do tamanho destas classes de forma que contenha todos os elementos da distribuição. Para organizar o método de como isso deve ser feito devemos seguir: Começamos fazendo o “rol” que a ordenação crescente dos valores da população; Em seguia determinar o número de classes, bem como dos valores inferiores e superiores de cada classe, depende do bom senso do analista que estiver manipulando os dados. O número de classes numa distribuição de freqüências não pode ser maior do que 20 nem menor do que 5. Deve-se utilizar sempre o mesmo valor (h) para todos os intervalos de classe. Vamos dar um exemplo de como é feito este tratamento estatístico. Vamos admitir que no exame final de Estatística, aplicado em 54 alunos de uma faculdade, resultaram nas notas mostradas abaixo. A partir destes valores, vamos mostrar como proceder para colocá-los de forma organizada, numa tabela. 4,2 4,9 7,1 5,8 7,5 7,0 6,1 6,7 7,6 7,2 4,6 5,1 8,4 5,3 7,9 6,2 6,6 6,5 7,9 5,2 9,5 6,9 8,5 5,7 6,1 8,7 7,1 4,5 7,6 6,6 7,8 5,6 6,8 8,1 8,6 7,7 6,3 8,7 7,3 5,4 6,7 5,9 6,9 5,5 7,0 9,2 7,4 8,2 5,1 7,1 8,3 6,0 8,9 4,7 Roteiro para a construção da tabela de freqüências 1º) Inicialmente, procuramos o maior e o menor valor entre os dados brutos e efetuamos a diferença entre eles, achando a amplitude da distribuição; 2º) em seguida, definimos quantas classes vamos adotar. Este número não tem regra a ser seguida, dependendo apenas do bom senso do pesquisador, sendo que alguns autores recomendam usar n , onde "n" é o número total de elementos que está sendo estudado; 3º) no nosso exemplo, 54 7,35 , vamos então adotar 7 classes; 4º) calculamos o valor que vamos adotar para o intervalo de classe (h), que é a amplitude (a = Limitei Limites) dividida pelo número de classes que iremos adotar que poderá ser arredondado (sempre para cima, nunca para baixo) de acordo com as nossas conveniências ( h = a / n ) 5º) decidimos, então, qual será o valor inicial da primeira classe, que será o limite inferior da primeira classe, pelo qual iremos começar a construção de todas as classes até a última, de forma a conter todos os dados brutos; 6º) contamos entre os dados brutos, quantos elementos existem pertencentes a cada uma das classes e anotamos este valor, na coluna das freqüências de classe (fi); 7º) é comum nesta tabela se calcular a freqüência relativa da classe (fr), que nada mais é do que o valor da probabilidade que os elementos da distribuição têm de pertencerem a ela, e é obtida dividindo-se o valor da freqüência da classe pela freqüência total de distribuição. fr = ( fi / ∑fi ) * 100 Vamos construir a tabela de freqüência de acordo com as regras mostradas: Classes |— |— |— |— |— |— |— |— Somatória ∑ = fi xi fi * xi ( fi * xi)2 fac fr Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Observe que na tabela não aparecem mais os verdadeiros valores dos elementos da população. Sabemos apenas, quantos são em cada classe. Por essa razão, é que usamos o valor médio de cada classe (xi) para representar todos os valores que estão em cada uma delas. Medidas de Posição As medidas de posição calculadas para caracterizar uma distribuição de freqüência em relação aos valores estudados, são calculadas bem diferentes das que foram mostradas para um grupo de dados. Média aritmética Já vimos que é a medida mais representativa da distribuição que está sendo estudada. A média aritmética numa distribuição de freqüência é calculada, usando-se a expressão da média ponderada com elementos repetidos, portanto para cada xi o valor deverá ser multiplicado pela freqüência fi das vezes com que se repete. O cálculo da média numa distribuição de freqüências é feita pela expressão: fi xi fi 1º) Cálculo da média fi xi fi xi fi Mediana A mediana é o valor do elemento que fica numericamente no meio da distribuição, ou seja, (n/2). O elemento mediano na tabela é localizado na coluna das freqüências acumuladas, na classe onde estiver o valor (n/2). Ao valor do limite inferior dessa classe vamos somar o valor obtido da divisão do intervalo da classe (h), pelo número de elementos que estão na classe da mediana (fi). Este valor é então multiplicado pela diferença entre o elemento mediano (n/2) e a freqüência relativa acumulada ( fac ) da classe anterior onde está o elemento mediano. Assim, a mediana, é calculada pela fórmula: Md l inf l inf n 2 fac h onde: fi = limite inferior da classe onde se encontra o elemento mediano. f ac = freqüência acumulada da classe anterior ao da que contém a mediana. h = intervalo de classe. fi = freqüência da classe onde está a mediana. n = número total de elementos da distribuição. Atenção: a construção da fórmula deve sempre começar pelo valor de n/2 2º) Calculo da mediana Md l inf n 2 fac h fi Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Moda de Czuber Moda é o valor da distribuição que mais aparece. No caso de uma distribuição de freqüências o cálculo da moda é feito de forma diferente. Existem várias formas de se calcular a moda, sendo a mais utilizada a proposta por Czuber, cuja formula está abaixo. Para usá-la a primeira coisa a fazer é achar a Classe Modal (Aquela que tem a maior freqüência). A partir da classe modal montamos a formula: Mo l inf + d1h d1 d2 l inf = limite inferior da classe modal, que é aquela que possui a maior freqüência. d1 = diferença entre a freqüência da classe modal e a classe anterior. d 2 = diferença entre a freqüência da classe modal e a classe posterior. h = intervalo de classe. 3º) Calculo da moda de Czuber Mo l inf + d1h d1 d2 Propriedades das medidas de posição 1º) A moda é o valor que mais aparece, portanto, num gráfico que relaciona a freqüência dos elementos da distribuição com os seus respectivos valores (chamado de histograma), a moda corresponde ao valor da abscissa do ponto mais alto no gráfico. 2º) A mediana é o valor de um único elemento da distribuição que a divide em duas partes numericamente iguais, portanto, isto equivale a dizer que o valor da mediana divide a área do histograma em duas partes iguais. O seu valor está sempre compreendido entre a média e a moda. 3º) A média é o valor que fica no meio da distribuição em termos dos seus valores. Portanto o seu valor é aquele que equilibra o histograma naquele ponto, ou seja, se fizermos um histograma numa placa de espessura constante num material homogêneo, a média é o valor que equilibraria o histograma com o eixo das abscissas dos "x" na horizontal. 4º) Quando a média, moda e mediana numa distribuição de freqüência qualquer apresentam os mesmos valores (ou muito próximos), ela é chamada de simétrica. Caso contrario, a distribuição é assimétrica. Os gráficos em Estatística ocorrem das seguintes maneiras: a) enviesada à esquerda onde temos a relação: moda mediana média b) enviesada à direita onde temos a relação: média mediana moda c) simétrica onde: média = mediana = moda Os gráficos correspondentes são: Enviesada à esquerda x/ < Md < Mo Simétrica x/ = Md = Mo Enviesada à direita Mo < Md < x/ Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Exercício de aplicação Dada a distribuição de freqüência abaixo, calcule: a) média Classes 0,125 – 0,135 0,135 – 0,145 0,145 – 0,155 0,155 – 0,165 0,165 – 0,175 0,175 – 0,185 Soma fi 12 31 23 18 9 4 97 Xi 0.13 0.14 0.15 0.16 0.17 0.18 b) moda f iX i 1.56 4.34 3.45 3.88 1.53 0.72 14.48 c) mediana fac 12 43 66 84 83 87 Média f x i i fi R: 0,1493 Moda Mo l inf + d1h d1 d2 R: 0,1420 Mediana Md l inf n 2 fac h fi R: 0,1474 Dada a distribuição de freqüência abaixo, calcule: a) média Média f x i i fi Moda Mo l inf + d1h d1 d2 Mediana Md l inf n 2 fac h fi b) moda c) mediana Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Tarefa mínima 1) Na distribuição abaixo, a moda de Czuber vale: a) 50,6; b) 55; c) 50; d) 56. 2) E a mediana é: a) 55,7 b) 55 c) 56,7 d) 54,5 Classes 30┤40 40┤50 50┤60 60┤70 70┤80 Freqüência 10 20 35 25 10 3) Dada a distribuição abaixo Classes fi 150├200 5 200├250 16 A média será: a) 350 250├300 21 300├350 28 b) 313 c) 324,76 350├400 19 400├450 8 450├500 3 d) 323,80. 4) Coloque nos parênteses o número do conceito estatístico correspondente ao seu significado: 1. Freqüência relativa: é o valor que se obtém para uma classe, somando na sua freqüência, as freqüências das classes que a antecedem. 2. Média: é a divisão da freqüência da classe onde está este elemento pelo numero total dos elementos da distribuição. 3. Moda: é o valor do elemento da distribuição que a divide, numericamente, ao meio. 4. Mediana: é o valor do elemento de maior freqüência em um conjunto de dados. 5. Freqüência acumulada: é a medida de tendência central mais conhecida. a) 1,4,5,3,2 b) 5,4,3,2,1 c) 3,2,1,4,5 Respostas: 1-d 2-a 3-b 4-d d) 5,1,4,3,2 e) 5,4,1,2,3 Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Medidas de dispersão Como vimos às medidas de dispersão mostram o grau de homogeneidade de uma distribuição, ou seja, se ela é muita ou pouco dispersa, em relação à média. Na distribuição de freqüências onde os dados são agrupados as medidas de dispersão são calculadas na forma: Variância 2 A variância da população é definida como: σ Σfi (xi μ )2 N Porém para o seu cálculo nas distribuições de freqüência é mais conveniente e mais fácil de ser calculada que ela fique expressa na forma: Σfi xi2 σ2 μ2 N Desvio padrão O desvio padrão é a raiz quadrada da variância. 2 Coeficiente de variação O coeficiente de variação é a razão entre o desvio padrão e a média da distribuição. CV 100 % Propriedades das medidas de dispersão 1) Provaremos mais tarde que qualquer que seja a distribuição estatística estudada, os intervalos mostrados abaixo compreendem aquelas porcentagens da distribuição: x σ este intervalo compreende aproximadamente 68% da distribuição; x 2σ este compreende aproximadamente 95%, e x 3σ este compreende praticamente tudo ou seja 99,76%. Uma distribuição estatística nunca tem valores que ultrapassam o valor da média acrescida ou subtraída de três vezes o desvio padrão, ou seja, o intervalo definido entre o menor valor e o maior, nunca ultrapassa 6 vezes o valor do desvio padrão. Propriedade prática: Existe uma forma de se chegar rapidamente ao valor aproximado do desvio padrão de uma distribuição, basta tirar do maior valor da distribuição o menor e, dividir o resultado por 5. O valor obtido será próximo do desvio padrão que for calculado. 2) As distribuições estatísticas se apresentam de três maneiras, em função do grau de dispersão que possuem em relação a média e são classificadas em: platicúrticas, mesocúrticas e leptocúrticas. As figuras correspondentes são: Platicúrtica Mesocúrtica Leptocúrtica Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Exercício de aplicação No exercício dado abaixo, de uma distribuição de freqüência de uma população qualquer, calcule todas as medidas de dispersão. (tente estimar mentalmente a média e o desvio padrão) Classes 0,15 ┤ fi xi 2 fi xi ┤0,31 fi 7 11 29 18 13 10 8 5 Xi soma 1º) cálculo da variância Σfi xi2 σ2 μ2 N 2º) cálculo do desvio padrão 2 3º) cálculo do coeficiente de variação (expresso em porcentagem) CV Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Tarefa mínima 1. Examinando a figura abaixo, podemos dizer que: a) o desvio padrão da distribuição A é maior que o da distribuição B, e as médias são iguais; b) o desvio padrão A é menor que o de B e as médias são diferentes; c) o desvio padrão de A é igual ao de B, independente do valor da média; d) as distribuições possuem o mesmo coeficiente de variação. B A x 2. O cálculo da variança supõe o conhecimento da: a) média; b) mediana; c) ponto médio; d) moda. 3. Numa distribuição de valores iguais, o desvio padrão é: a) negativo; b) positivo; c) a unidade; d) zero. 4, O desvio padrão de um conjunto de dados é 9. A variança será: a) 3; b) 18; c) 36; d) 81. 5. A soma dos desvios entre cada valor e a média é: a) positiva; b) negativa; c) diferente de zero d) zero. 6. O coeficiente de variação é uma medida que expressa a razão entre: a) o desvio padrão e a média; b) média e desvio padrão; c) amplitude semi-interquartilica e a mediana; d) desvio padrão e moda. 7. Realizou-se uma prova de matemática para duas turmas. Os resultados foram os seguintes: x 5 e = 2,5 Turma A : x4 e =2 Turma B : Com esses resultados, podemos afirmar: a) a turma B apresentou maior dispersão absoluta; b) a dispersão relativa é igual à dispersão absoluta; c) tanto a dispersão absoluta quanto a relativa são maiores para a turma B; d) a dispersão absoluta de A é maior que a de B, mas em termos relativos, as duas turmas não diferem quanto ao grau de dispersão das notas. Respostas: 1-a 2-a 3-d 4-d 5-d 6-a 7-d Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Medidas separatrizes Entre o primeiro e o último valor de uma distribuição de freqüências, temos 100% dos valores. As medidas de separação são usadas para determinarmos qual é o elemento da distribuição cujo valor a divide em duas porcentagens conhecidas. As divisões mais comuns e usadas com freqüência são os quartis, decis e percentis. Os quartis dividem a distribuição em quatro partes iguais (conseqüentemente, cada quartil representa 25% da distribuição), os decis em dez partes iguais (cada um com 10% da distribuição) e os percentis em cem partes iguais (cada um com 1% da distribuição). Evidentemente podemos definir qualquer outra medida que desejarmos, como pentis (cinco partes), tercis (3), hexil (6), heptil (7) octil (8), nonil (9), decil (10), percentil (100), etc. A diferença na obtenção destes valores está apenas no valor da divisão do fator (kn) que deverá ser dividido pelo número correspondente à quantidade de divisões desejadas. Estas medidas calculam o valor do elemento da distribuição que a reparte numa porcentagem desejada. Por exemplo, o primeiro quartil determina o valor do elemento da distribuição que deixa para trás 25% dos valores da distribuição e, é suplantado por 75% deles. Esta interpretação é a mesma para qualquer outra medida. Portanto qualquer medida separatriz é calculada aplicando-se a fórmula da mediana, onde apenas mudamos o número de vezes que iremos dividir o valor “kn” conforme a medida que desejamos calcular. Observe as equações que mostramos a seguir. Quartil Esta medida divide uma distribuição em 4 partes iguais, correspondendo cada uma delas a 25% do total. Para o cálculo de um quartil qualquer, basta substituir na expressão o valor do k correspondente ao quartil desejado, assim, para o cálculo do 3º quartil o valor do k é 3. O resultado obtido significa que 75% dos valores da distribuição são menores que ele. A expressão para o cálculo do quartil é: QK = l inf ækn ö çç - fac ÷ ÷h çè 4 ø÷ + fi onde K = 1, 2, 3 Atenção: a aplicação da fórmula deve sempre começar pelo valor de kn/4 Decil Esta medida divide a distribuição em 10 partes iguais, correspondendo cada uma delas a 10% do total. Para o cálculo de um decil qualquer, basta substituir na expressão o valor do k correspondente ao decil desejado, assim, para o cálculo do 7º decil o valor do k é 7. O valor encontrado significa que 30% dos valores da distribuição são maiores que ele. A expressão para o cálculo do decil é: DK = l inf ækn ö çç - fac ÷ ÷h çè10 ø÷ + fi onde K = 1, 2, ......, 9 Atenção: a aplicação da fórmula deve sempre começar pelo valor de kn/10 Percentil Esta medida divide uma distribuição em 100 partes iguais, correspondendo cada uma delas a 1% do total. Para o cálculo de um percentil qualquer, basta substituir na expressão o valor do k correspondente ao percentil desejado, assim, para o cálculo do 37º percentil o valor do k é 37. A interpretação deste valor é análoga às anteriores. Esta expressão também serve para se calcular a porcentagem correspondente a certo valor dado, bastando resolvê-la ao contrário, ou seja, calculando o valor de k, dado Pk. A expressão para o cálculo do percentil é: æ kn ö çç - fac ÷ h ÷ ÷ çè100 ø PK = l inf + fi onde K = 1, 2, ....., 99 Atenção: a aplicação da fórmula deve sempre ser começada pelo valor de kn/100 Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Exercício de aplicação 1) Dada a tabela abaixo de uma distribuição de freqüência, calcule: a) o terceiro quartil; b) o quarto decil; c) o sexagésimo sétimo percentil; d) o segundo heptil. e) o primeiro tercil f) a porcentagem dos valores da distribuição que ficam acima do valor 107. Classes Freqüência 90 ┤ 93 7 93 ┤ 96 23 96 ┤ 99 18 99 ┤102 14 102 ┤105 12 105 ┤108 10 108 ┤111 8 111┤114 4 fac a) Q3 l inf kn 4 fac h fi ækn ö çç - fac ÷ ÷h çè10 ø÷ + fi b) D = K l inf c) P = K æ kn ö çç - f ÷ h ÷ çè100 ac ÷ ø + inf fi l d) H = K e) T = K f) P = K R: 97,4 R: 102,6 ækn ö çç - fac ÷ ÷h çè 7 ø÷ + inf fi R: 95,7 ækn ö çç - fac ÷ ÷h çè 3 ø÷ inf + fi R: 96,4 æ kn ö - fac ÷ h ÷ çççè ÷ ø 100 inf + fi R: 16% l l l R: 104,5 2) Dada a distribuição de freqüência abaixo: a) calcule a média b) calcule a moda; c) calcule a mediana; d) calcule o coeficiente de variação; e) calcule a porcentagem de valores que fica acima de 6,2; f) calcule o terceiro pentil; g) calcule o sétimo decil; h) calcule o 85º percentil. Classes 4,5 ┤ 5,8 fi 7 21 13 10 8 5 3 Xi fac fi xi a) 2 fi xi R: 8,09 b) R: 6,63 Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos c) f) R: 7,65 d) R: 8,32 g) R: 26,70% e) R: 9,16 h) R: 80% R: 10,66 Trabalho 2 a ser entregue Os dados da estatura dos alunos de uma determinada turma (em metro) são: 1,74 1,66 1,68 1,73 1,73 1,52 1,60 1,70 1,56 1,67 1,63 1,63 1,51 1,50 1,56 1,69 1,70 1,70 1,72 1,72 1,63 1,68 1,68 1,53 1,75 1,67 1,73 1,74 1,76 1,62 1,71 1,75 1,70 1,70 1,61 1,78 1,60 1,66 1,76 1,79 1,74 1,67 1,62 1,63 1,68 1,76 1,79 1,74 1,67 1,81 1,68 1,56 1,81 1,70 1,67 1,79 1,72 1,62 1,60 1,58 1,50 1,58 1,58 1,68 1,72 1,72 1,61 1,75 1,74 1,50 Pede-se: a) agrupar os dados em 8 classes b) a mediana; c) o coeficiente de variação; d) a porcentagem de alunos entre 1,52 e 1,65 m; e) o terceiro quartil; f) o sexto decil; g) calcule o 85º percentil; h) o 3º pentil; i) a moda. Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Representações gráficas São representações visuais dos dados estatísticos que sevem para dar informações rápidas que correspondam aos dados, mas nunca substituir as tabelas estatísticas. Os mais comuns são: Gráficos de informação: são gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as informações desejadas estejam presentes. Gráficos de análise: são gráficos que se prestam melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise freqüentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico. Têm gráficos que podem trazer uma idéia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construção de escalas. Diagramas: são gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser feitos gráficos de barras horizontais ou verticais (colunas) as vezes chamados de gráficos de hastes ou histogramas. Quando as legendas não são breves usam-se de preferência os gráficos em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. A ordem de apresentação a ser observada nos eixos é a crescente cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica. Gráficos de setores: são aqueles construídos com base em um círculo, e é empregado sempre que desejamos ressaltar a participação dos dados em função do total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. As séries temporais geralmente não são representadas por este tipo de gráfico. Estereogramas: são gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. Pictogramas: são construídos a partir de figuras representativas do tipo de variável estudada no fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Cartogramas são ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Uma distribuição de freqüências pode ser representada por vários tipos de gráficos, cuja finalidade é mostrar o comportamento da distribuição bem como possibilitar o calculo rápido das medidas estatísticas mais importantes. Histograma O histograma é um gráfico construído para a representação dos dados de uma distribuição de freqüências, feito através de retângulos, cuja base é igual ao intervalo de cada classe e altura igual a respectiva freqüência. Este gráfico possibilita calcular o valor aproximado das medidas de posição. Polígono de freqüências Este gráfico possui uma propriedade mais visual, sem utilidade de cálculos aproximados. Ele é feito ligando-se, por meio de segmentos de retas, os pontos correspondentes aos pontos médios das classes com suas respectivas freqüências. No inicio e no fim do gráfico ligamos os pontos nas extremidades dos retângulos para o gráfico não ficar “voando”. Ogiva de Galton (de freqüências acumuladas) A ogiva de Galton é um gráfico construído com a finalidade de obtermos os valores aproximados de qualquer medida separatriz que quisermos. Ele é feito com as freqüências acumuladas ascendentes ou descendentes. O mais comum é a representação ascendente. A ogiva de Galton é construída, tomando-se nas abscissas os intervalos de classe e nas ordenadas as freqüências acumuladas de cada classe. O gráfico é feito unindo-se por segmentos de retas os pontos obtidos pela coordenada das freqüências acumuladas com o limite Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos superior de cada classe, a partir de zero do limite inferior da primeira classe. Após o gráfico feito, se fizermos um segmento de reta vertical, desde o último ponto do gráfico até o eixo das abscissas, basta dividirmos esse segmento nas partes correspondentes a medida de separação que desejamos calcular. Para obtermos o valor de a medida separatriz desejada basta traçarmos uma reta horizontal a partir do ponto correspondente a parte que desejamos até encontrar a curva do gráfico e, deste ponto traçamos uma vertical até o ponto correspondente no eixo das abscissas. O valor encontrado no eixo será o valor da medida separatriz que estamos querendo. Por exemplo, se dividirmos o eixo em quatro partes, cada uma das partes, de baixo para cima, indicará um dos quartis. Exercícios de aplicação 1) Fazer o Histograma, Polígono de Freqüência e a Ogiva de Galton, com os valores do exercício nº1 . a) Histograma e polígono de freqüência b) Ogiva de Galton (de freqüências acumuladas) Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Tarefa mínima 1. Dado o histograma abaixo, no interior de cujos retângulos foram anotadas as freqüências absolutas, a mediana é: a) 6,5 b) 8,0 c) 7,5 d) 7,0 30 25 20 15 10 2 4 6 8 10 12 2. Dada a figura abaixo, podemos afirmar que: a) a moda é maior que a mediana e menor que a média; b) a moda é menor que a mediana e maior que a média; c) a moda é menor que a mediana e esta menor que a média; d) a mediana é maior que a média e menor que a moda. F x 3. Dado o polígono de freqüência abaixo, o primeiro quartil da distribuição será: a) 5,0; b) 5,5 c) 4,8; d) 3,0. 7 fi 6 5 4 3 2 1 2 Respostas: 1-d 2-d 3-a 4 6 8 10 12 Classes Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Exercício de aplicação Uma população de oitenta parafusos, forneceu a seguinte distribuição de comprimentos em mm. Construa a tabela com os valores que você vai precisar para os cálculos. Classes 0,15 ┤ ┤ ┤ ┤ ┤ ┤ ┤ ┤ 0,23 fi 6 19 33 24 17 11 7 3 Xi fac fi xi 2 fi xi soma Calcule os seguintes parâmetros estatísticos dessa distribuição a) Média. fi xi fi R: 0,184mm b) Mediana. Md l n 2 fac h fi inf R: 0,181mm c) Moda de Czuber. Mo l inf + d1h d1 d2 R: 0,176mm d) Variança σ2 Σfi xi2 n μ2 R: 0,000124mm 2 e) Desvio padrão v R: 0,011mm f) 3º Quartil. QK = l inf ækn ö çç - fac ÷ ÷ ÷h çè 4 ø + fi R: 0,195mm g) 4º Decil. DK = l inf ækn ö çç - fac ÷ ÷ ÷h çè10 ø + fi h) 87º Percentil. R: 0,177mm Estatística Descritiva PK = l inf Eng. Prof. Esp. Bruno César de Mattos æ kn ö çç - f ÷ h ÷ çè100 ac ÷ ø + fi R: 0,205mm i) 3º Heptil HK = l inf ækn ö ÷h çç - fac ÷ ÷ çè 7 ø + fi R: 0,178mm j) Coeficiente de variação cv σ 100% μ R: 5,98% k) Qual a porcentagem dos valores que ficam acima de 0,183? PK = l inf æ kn ö çç - f ÷ h ÷ çè100 ac ÷ ø + fi R: 45,7% l) A especificação para esse tipo de material exige que; 1º) o comprimento médio das peças esteja compreendido entre 0.20 e 0.22 mm. 2º) que o coeficiente de variação seja inferior a 5%. 3º) que a distribuição dos comprimentos seja simétrica. Quais dessas exigências não estão satisfeitas no problema? R: todas Tarefa mínima 1) Na tabela abaixo, são dados alguns valores de uma distribuição de freqüência e, com base neles, complete a tabela com os valores que estão faltando. Sabe-se que: Xi = pto médio da classe; fi = freqüência da classe; fac = freqüência acumulada da classe; fr = freqüência relativa da classe. Xi 5 6 7 8 9 10 11 fi 4 fac fr 0,1 24 20 0,25 60 12 2) A distribuição de freqüências da duração de válvulas de rádio está representada na tabela abaixo. Construir o histograma, o polígono de freqüência e o polígono de freqüências relativas acumuladas. Calcule a média e o desvio padrão desta distribuição. Duração (h) nº de cabos 30 ┤ 40 14 40 ┤50 46 50 ┤ 60 58 60 ┤ 70 76 70 ┤ 80 68 80 ┤ 90 62 90 ┤ 100 48 3) Cronometrando o tempo para várias provas de uma gincana automobilística, encontramos: Equipe 1: nº de provas 40 tempo médio das provas: 45 segundos variança delas: 400 segundos ao quadrado Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Equipe 2: tempo das provas: 20 40 50 80 nº de provas: 10 15 30 5 Pergunta-se: a) Qual o coeficiente de variação relativo à equipe 1? b) Qual a média da equipe 2? c) Qual o desvio padrão relativo à equipe 2? d) Qual a média aritmética referente às duas equipes consideradas em conjunto? e) Qual a equipe que apresentou resultados mais homogêneos? Justifique. Respostas: a) 44% b) 45 c) 15 d) 45 e) A equipe 2, pois os valores da dispersão são menores. 4) Dada a distribuição de freqüência abaixo se sabe que a média destes valores vale 11,5. Calcule o valor da freqüência "x", R: 7,0 Xi fi 5 4 8 5 13 x 18 3 25 1 Assinale a alternativa correta dos testes abaixo: 1) Os coeficientes de variação dos resultados de uma prova, cujas notas estão mostradas abaixo: Estatística : x 80 σ =16 x 20 σ = 5 História : são: a) 16% e 40% b) 20% e 25% c) 50% e 40% c) 80% e 40% 2) Na distribuição abaixo, o valor da medida que deixa 45% do valor do consumo para trás vale: a) 46; b) 50; c) 49,6; d) 63. Renda consumo 10 ┤20 50 20 ┤30 100 30 ┤40 150 40 ┤50 250 3) O 5º decil da distribuição abaixo é: a) 7,20; b) 5,50; c) 6,60; 2 ┤4 5 Classes fi 4) A média da distribuição abaixo é: a) 12,0; b) 8,5; Classes fac 4 ┤6 7 50 ┤60 150 70 ┤80 80 80 ┤90 50 90 ┤100 70 d) 7,20. 6 ┤8 10 c) 10,83; 0┤6 1 60 ┤70 100 8 ┤10 3 10 ┤12 5 d) 11,4. 6 ┤12 2 12 ┤ 18 5 5) O desvio médio absoluto da distribuição abaixo é: a) 12; b) 8; c) 16; d) 18. Classes fi 6) A variância da distribuição abaixo é: a) 2,24; b) 2,8; Classes fi 90 ┤ 110 2 110 ┤130 1 c) 2,5; d) 1,44. 1 ┤3 1/5 3┤5 2/2 130 ┤150 2 5 ┤7 2/5 Respostas: 1-b 2-a 3-c 4-d 5-c 6-d 8) Em cinco testes realizados, um consumidor interessado em três modelos de motocicleta obteve a seguinte relação de consumo em quilômetros por litro de combustível: Teste 1 Teste 2 Teste 3 Teste 4 Teste 5 Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Moto A Moto B Moto C 28 31 29 32 29 32 28 31 28 30 29 32 34 31 30 a) Se o fabricante da motocicleta A quiser anunciar a melhor performance de sua moto nesse teste, qual será a medida de tendência central usada para justificar a propaganda a média, mediana ou moda? b) Se o fabricante da motocicleta B quiser anunciar a melhor performance de sua moto nesse teste, qual será a medida de tendência central usada para justificar a propaganda a média, mediana ou moda? c) Se o fabricante da motocicleta C quiser anunciar a melhor performance de sua moto nesse teste, qual será a medida de tendência central usada para justificar a propaganda a média, mediana ou moda? Justifique as respostas. 9) Duas empresas (A e B) contrataram dez pessoas com curso superior. O salário inicial nessas companhias é mostrado a seguir. Salário A Salário B 41 40 38 23 39 41 45 50 47 49 41 32 44 41 41 29 37 52 42 58 a) Determine a variância e o desvio padrão amostral do salário inicial para cada uma das duas empresas; b) Determine a moda e mediana para cada uma das duas empresas. 10) Foi coletada uma amostra aleatória do número de crianças por família em uma região. Os resultados estão dispostos na tabela abaixo. a) Determine a média e o desvio padrão amostral do conjunto desses dados, classificando-os em uma distribuição de freqüências do número de filhos por família, com classes de 0 até 6. b) Determine a moda e a mediana. 11) Dada a distribuição de freqüências abaixo, responda os testes a seguir: CLASSES 0,136 ┤ 0,148 fi 7 19 29 22 20 14 11 8 Xi SOMA I) A média dessa distribuição é: a) 0,1803 b) 0,1664 c) 0,1774 d) 0,1671 e) 0,1713 II) A moda vale: a) 0,1803 b) 0,1664 c) 0,1774 d) 0,1671 e) 0,1713 III) A mediana vale: a) 0,1803 b) 0,1664 c) 0,1774 d) 0,1671 e) 0,1713 IV) O desvio padrão vale: a) 0,0232 b) 0,0225 c) 0,0217 d) 0,0228 e) 0,0225 fac Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos V) O terceiro pentil vale: a) 0,1835 b) 0,1854 c) 0,1863 VI) O coeficiente de variação vale: a) 13,25% b) 12,85% c) 12,97% d) 0,1817 d) 12,75% e) 0,1846 e) 12,65% VII) A porcentagem de valores que fica abaixo de 0,192 vale: a) 69,49% b) 69,57% c) 69,23% d) 69,68% e) 69,87% VIII) O sexto octil vale: a) 0,1987 b) 0,1956 c) 0,1964 d) 0,1954 e) 0,1971 12) Considere o grupo de valores dados abaixo: 3,1 3,8 3,2 3,8 3,4 3,1 3,5 Responda abaixo: I) a média geométrica desses valores é: a) 3,39 b) 3,40 c) 3,38 d) 3,41 e) 3,37 II) a média harmônica vale: a) 3,39 b) 3,40 c) 3,38 e) 3,37 d) 3,41 13) Dado a distribuição de freqüência abaixo: CLASSES 1,38 → 1,49 fi 7 29 18 20 17 9 Xi fac soma a) calcule a média b) a moda c) a mediana; d) a variança e) o desvio padrão f) o coeficiente de variação g) o terceiro quartil h) a porcentagem de valores abaixo de 1,71 14) Dado um grupo de dados mostrados abaixo 3,3 2,2 3,1 1,8 2,1 3,3 1,4 2,9 Calcular: a) a média aritmética b) geométrica c) harmônica d) a moda e) a mediana f) desvio padrão Se não puder se destacar pelo talento, vença pelo esforço Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Módulo 2 Introdução a probabilidades Para aprendermos ciências exatas, certamente temos que criar algumas habilidades necessárias para isso. Conforme disse um dos maiores gênios da humanidade, Galileo Galilei, o professor não ensina, o que ele deve fazer é auxiliar o aluno a aprender. Cabe, portanto a você adquirir as habilidades necessárias que deverão auxiliá-lo na aprendizagem como, por exemplo, desenvolver a compreensão e precisão no uso da linguagem técnica, habilidade esta imprescindível no entendimento e organização das idéias, propiciando um aumento na sua capacidade de raciocínio lógico. Portanto, quando receber informações técnicas, estas deverão ser devidamente interpretadas, pois é importante você aprender a desenvolver esse senso crítico, analisando o conteúdo e essência da informação, não aceitando de imediato, idéias ou conceitos ali existentes sem a devida compreensão dos mesmos. A probabilidade é a parte da matemática aplicada que estuda fenômenos de caráter essencialmente aleatórios e não determinístico, Alea, significa sorte em latim e, aleatório quer dizer por acaso. Fenômeno é qualquer fato ou acontecimento que se pode observar. Fenômenos aleatórios significam acontecimentos de qualquer natureza que geram resultados completamente imprevisíveis e fora de controle de qualquer espécie. O cálculo de probabilidades estabelece as regras que nos permitem mensurar, a priori, o valor da chance de ocorrer um dado acontecimento num fenômeno aleatório. A estatística possibilita o desenvolvimento de formas particulares de pensamento e raciocínio, em experimentos que envolvem fenômenos aleatórios, interpretando amostras, fazendo inferências e, possibilitando a comunicação de resultados obtidos nas pesquisas por meio de linguagem matemática apropriada. Muitos são os conhecimentos exigidos para esse aprendizado, considerando que tais assuntos possibilitam o desenvolvimento de formas particulares de pensamento e raciocínio, envolvendo fenômenos aleatórios, ajudando a interpretar resultados amostrais, possibilitando que o estudante aprenda a construir procedimentos adequados para coletar, organizar e comunicar dados, utilizando tabelas, gráficos e representações, capacitando-o a descrever e interpretar fenômenos aleatórios, usando conhecimentos matemáticos. É essencial o aprendizado da probabilidade antes de estudar estatística, pois obteremos melhor compreensão dos acontecimentos no cotidiano de fenômenos de natureza aleatória, possibilitando a identificação dos possíveis resultados desses acontecimentos observando o acaso e a incerteza com que ocorrem no contexto aonde se manifestam. O aluno deve se empenhar na investigação de solução de problemas, criando estratégias apoiadas em argumentos e justificativas convincentes, lembrando-se que nos cálculos estatísticos o mais importante é interpretar o que cada grandeza significa e não simplesmente saber efetuar seus cálculos. Por outro lado, é bom lembrar que você, como futuro profissional, deve adquirir conhecimentos básicos no uso de computadores bem como uma visão sistêmica dos problemas que lhe são apresentados, alem de ter uma boa formação cientifica para saber procurar em livros e jornais aonde existam textos que possam atender às suas necessidades de informação. Também é importante aprender a fazer relatórios e resumos com informações cientificas pertinentes sobre qualquer assunto que lhe for exigido. Operações com conjuntos Intercessão O resultado dessa operação é o conjunto que pertence simultaneamente a todos os conjuntos que estão na operação. No caso de dois conjuntos, a parte comum é a mostrada pela região hachurada na figura. Este conceito pode ser estendido para tantos conjuntos quanto quisermos. Esta operação é representada por: A B a inter b A União B Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos O resultado dessa operação é o conjunto que reúne todos os conjuntos participantes da operação. A figura abaixo mostra o resultado da união de dois conjuntos. Para mais do que dois conjuntos o resultado é a soma de todos. Esta operação é representada por: A B a união b A B Complementar O resultado dessa operação é o conjunto de elementos que faltam no conjunto dado para completar o universo. Esta operação é representada por: A a complementar A A Probabilidades Vamos definir Espaço Amostral como sendo o conjunto de todos os possíveis resultados de um fenômeno aleatório qualquer. Evento é qualquer elemento pertinente àquele espaço amostral. O evento pode ser simples, quando for constituído por apenas um conjunto, ou composto, quando for constituído por mais de um. Pode-se dizer que probabilidade é um número que mensura a possibilidade. Por definição, o cálculo da probabilidade para um dado evento (A) em um espaço amostral (E) é definido na forma: numero dos casos favoraveis que se quer P( A ) numero dos casos possiveis de existir Eventos simples Os eventos serão representados por conjuntos num diagrama de Venn, que é o modelo matemático ideal para isto. No cálculo de probabilidades as formas como os conjuntos se relacionam no diagrama de Venn é muito importante, pois, para cada tipo de disposição existe uma interpretação e solução diferente. Vamos representar por P(A) a probabilidade de um evento A, por P(B) a de um evento B e assim por diante. Por definição, eventos simples são aqueles que possuem apenas um conjunto no espaço amostral, portanto, em termos numéricos o cálculo da probabilidade de um evento simples A qualquer fica definido na forma: P( A ) n( A ) n(E) Por essa definição, para um evento A qualquer definido num espaço amostral temos os seguintes axiomas: 1º) Num espaço amostral, é sempre válida a relação numérica n() n( A) n(E) . Se a dividirmos por n(E), teremos: 0 P( A ) 1 Esta expressão define que para um evento qualquer A, a probabilidade não pode ter valor maior que um, nem menor que zero, O resultado "1" é a certeza, e o "0", é a impossibilidade do acontecimento do evento. 2º) Num espaço amostral, é válida a relação numérica n( A ) n( A ) n(E) . Se a dividirmos por n(E), teremos: P( A ) P( A ) 1 Essa propriedade é fundamental, pois mostra que a probabilidade de um evento em qualquer espaço amostral, somada com a probabilidade do seu não acontecimento, é sempre igual a um. Vale dizer, num mesmo espaço amostral sempre podemos calcular a probabilidade de um evento pelo seu contrário cuja relação é indispensável na solução de muitos problemas: Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos P( do que se quer ) 1 P( do que não se quer) Eventos compostos Eventos compostos são aqueles que ocorrem simultaneamente com mais de um evento no mesmo espaço amostral. Para o cálculo das probabilidades desses eventos, aplicaremos as propriedades definidas na teoria dos conjuntos, em função das situações que podem ocorrer. Mostraremos as mais comuns, com as respectivas expressões matemáticas que definem o resultado das probabilidades com aqueles conjuntos. Alguns modelos de eventos compostos são mostrados nos diagramas de Venn abaixo: P( A B) P( A) P(B) Eventos mutuamente exclusivos P( A B) P( A) P(B) P( A B) Eventos independentes P(A U B U C) P(A) P(B) P(C) P(A I B) P(A I C) P(B I C) P(A I B I C) Estas situações podem ser estendidas para 4 ou mais eventos. As expressões matemáticas respectivas podem ser obtidas bastando que continuemos aplicando os mesmos raciocínios da teoria dos conjuntos. Probabilidade condicional Esta probabilidade, como o próprio nome diz, está condicionada a um acontecimento que ocorreu anteriormente. Simbolicamente esta probabilidade é escrita na forma P(A/B) que representa; “ probabilidade de ocorrer o evento A depois que eu já sei que ocorreu o evento B”. Vamos lançar mão de um diagrama de Venn para melhor entender como pode ser calculada a probabilidade de um evento nestas condições. A B No cálculo dessa probabilidade observamos que o número de casos favoráveis está na intersecção dos dois conjuntos e, o número de casos possíveis, são aqueles que eu já sei que aconteceu, portanto eles têm que estar no conjunto B. De acordo com a definição de probabilidades a expressão para o cálculo dessa probabilidade é: n( A B) P( A / B) n(B) Dividindo o numerador e o denominador pelo número de elementos do universo n() , teremos: P( A / B) P( A B) P(B) Probabilidade de eventos simultâneos A expressão da probabilidade condicional nos sugere que também podemos escrever a dependência daqueles dois eventos A e B ao contrario, ou seja, na forma: Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos P(B / A) P(A I B) P(A) Portanto analisando as expressões dadas elas nos levam à conclusão de que podemos escrever a ocorrência simultânea de dois eventos A e B na forma: P(A I B) P(B) P(A /B) P(A) P(B / A) Observe que não importa a ordem como os eventos ocorrem que o resultado obtido é sempre o mesmo, por esta razão podemos calcular a probabilidade de qualquer grupo, em qualquer ordem que o resultado obtido é sempre o mesmo. Estas expressões podem ser generalizadas para 3 ou mais eventos, ou seja, P(A I B I C) P(A) P(B / A) P(C/ A I B) Probabilidades de eventos independentes Suponhamos que num espaço amostral tenhamos dois eventos independentes. Então partindo desse pressuposto, matematicamente teremos a expressões: P(A/B) = P(A) ou P(B/A) = P(B) pois o evento B não tem influência nenhuma sobre o A e vice-versa. Portanto o cálculo da probabilidade condicional de dois eventos independentes nessas condições fica: P(A I B) P(A) P(B) É importante observar que quando dois eventos são independentes, eles não podem ser mutuamente exclusivos. Portanto, se sabemos que dois ou mais eventos são independentes, necessariamente os conjuntos que os representam tem interseção, caso contrário os eventos não poderiam ser considerados independentes. O que fazer para resolver exercícios de probabilidades Para resolver um problema de probabilidade devemos sempre pensar em montar um modelo que represente TODAS as possibilidades que podem ocorrer para satisfazer a pergunta do problema e nele montarmos o nosso raciocínio. 1º) Comece lendo atentamente o enunciado, prestando muita atenção na pergunta do problema, pois é ela que nos irá impor a condição na forma de raciocinar na construção de um modelo que melhor se ajuste para descrever qualquer uma das possibilidades que o problema está pedindo. Verifique se podem existir outras possibilidades que sejam diferentes daquela e monte todas elas. 2º) Os modelos que normalmente vamos usar são: a) montagem de grupos que descrevem a pergunta do problema. b) árvore das probabilidades, que é um modelo que nos mostra todas as possibilidades condicionadas que podem existir no problema e nos mostra o caminho para a sua solução. É o modelo ideal para problemas que possuem perguntas condicionais. 3º) Verificar se os elementos que pertencem ao grupo montado em função da pergunta do problema para que ocorram de acordo com a pergunta devem ser ligados pelo conectivo "e" ou "ou". Se na formação do grupo usamos o conectivo “E” para ligar seus elementos, as probabilidades de cada um deles é multiplicada e, se eles forem ligados pelo conectivo “OU”, as probabilidades são somadas. 4º) Calcular a probabilidade de cada possibilidade que foi montada. Para cada uma delas calcule o número total de todas as outras possibilidades que possam existir, multiplicando este número pelo resultado da probabilidade obtida em cada uma delas. 5º) Nunca desista de tentar resolver o problema na primeira dificuldade, pois é com treino que se adquire o raciocínio lógico exigido para resolver problemas de probabilidades. Eis alguns exemplos para que você não desista fácil das coisas! O famoso General Douglas MacArthur foi recusado duas vezes na academia militar de West Point. Somente quando tentou pela terceira vez é que ele entrou e, passou para a história. O incrível jogador de basquete Michael Jordan, quando jovem foi recusado pelo treinador do time de basquete da sua escola. Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Albert Einstein só falou aos 4 anos de idade e começou a aprender a ler aos 7 anos. Sua professora o qualificou de lerdo, não sociável e sempre perdido em devaneios tolos. Foi expulso da escola e não foi admitido na escola politécnica de Zurique. Em 1944 um diretor de uma agência de modelos de Nova York disse a Marilyn Monroe, quando a recusou como artista, é melhor você fazer um curso de secretariado ou arrume um marido. Um alto executivo da Decca Records, maior gravadora de discos da Inglaterra recusou um grupo de rock chamado Beatles dizendo: Não gostamos desse som, esses grupos de guitarra já eram. Quando Alexandre Graham Bell inventou o telefone em 1876 ninguém queria financiar a sua invenção. O presidente dos USA da época Rutherford Hayes disse: é uma invenção extraordinária, mas quem vai querer isso? Thomas Alva Edison fez 2.000 experimentos antes de inventar a lâmpada elétrica. Um jovem repórter lhe perguntou o que ele achava de tanto fracasso. Ele respondeu. Não foram fracassos, foi um processo que demorou 2.000 passos. Exercícios de aplicação 1) Um casal tem dois filhos, um dos quais é menino. a) Qual a probabilidade do outro ser menino? b) Sem se conhecer o sexo das duas crianças, qual a probabilidade de uma delas ser menino? 2) Numa prateleira existem 6 pares diferentes de sapatos, retirando-se dois sapatos ao acaso, qual a probabilidade de se formar um par? 3) Uma letra é escolhida da palavra SOCO e a outra escolhida da palavra TOCO. Qual a probabilidade de que elas sejam iguais? 4) Certo tratamento, quando aplicado a doentes com certa enfermidade, cura 60% dos casos. Tendo dois doentes sob esse tratamento, qual a probabilidade: a) de que os dois morram; b) de que os dois sejam curados; c) de que um seja curado e o outro não? 5) Uma urna contém 3 bolas azuis e 5 amarelas, retirando-se todas, qual a probabilidade de que apareçam no final, as amarelas? 6) Um comprador aceita um lote de rádios, se numa amostra de dois tirados ao acaso desse lote, nenhum apresentar defeito. Qual a probabilidade de que ele aceite um lote de 10 rádios que contêm 4 defeituosos? 7) Duas lâmpadas queimadas são misturadas com dez lâmpadas boas. Se vamos testando uma por uma até encontrar as duas defeituosas, qual a probabilidade de que a última defeituosa seja encontrada no sétimo teste? 8) Temos 4 números positivos e 6 negativos. Escolhemos 4 números ao acaso e efetuamos o produto deles. Qual a probabilidade do produto ser positivo? 9) Lançado um dado 3 vezes, calcule a probabilidade de sair o mesmo número, pelo menos 2 vezes. 10) Um artilheiro naval dispara 5 torpedos para tentar acertar um navio. Sendo 1/3 a probabilidade de cada torpedo acertar o navio: a) qual a probabilidade de ele ser atingido? b) Se os 2 primeiros torpedos foram perdidos, qual a probabilidade de que o navio ainda seja atingido? Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 11) Se a voltagem é baixa, a probabilidade de uma máquina produzir peça defeituosa é 0,6 e se a voltagem é boa, a probabilidade é 0,1. Em 20% da produção a voltagem é baixa. Qual a probabilidade de uma peça boa ter sido produzida com baixa voltagem? 12) A probabilidade de um homem casado assistir certo programa na televisão é 0,40 e da sua mulher é 0,50. Se a mulher está assistindo o programa na televisão, a probabilidade de que o homem também veja o programa é 0,70. Pede-se: a) Qual a probabilidade de que ambos estejam assistindo o programa? b) Se o marido está assistindo o programa, qual a probabilidade de que a mulher também assista ao programa? c) Qual a probabilidade de que pelo menos uma pessoa do casal esteja assistindo o programa? 13) São dadas duas urnas, X e Y. A urna X contém duas bolas pretas e uma vermelha. A urna Y contém duas bolas pretas e três vermelhas. Uma bola escolhida ao acaso na urna X e colocada na Y. Uma bola é extraída da urna Y: a) qual a probabilidade de que ambas as bolas retiradas sejam da mesma cor? b) qual a probabilidade de que a primeira seja vermelha, sabendo-se que a segunda era preta? 14) Um colégio tem 850 estudantes e sabe-se que 260 estudam francês, 220 estudam alemão e 170 estudam inglês. Sabe-se ainda que 77 estudam francês e inglês; 88 alemão e inglês; 95 alemão e francês e 50, as três línguas. Se um estudante é escolhido ao acaso, qual a probabilidade de que seja: a) estudante de duas e somente duas línguas? b) estudante de, no mínimo, uma língua? c) estudante de alemão, sabendo-se que ele estuda francês? R: 11/65 65/85 19/52 Tarefa mínima 1) Uma empresa recebeu duas propostas para a compre de um artigo de sua produção. Proposta A: a empresa compradora seleciona ao acaso 18 peças, examina-as e paga R$120,00 por peça do lote, se existir no máximo uma peça defeituosa na amostra e R$100,00 por peça caso contrário. Proposta B: ou então seleciona ao acaso 12 peças, examina-as e paga R$180,00 por peça se não existir nenhuma defeituosa e R$60,00 caso tenha Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos uma ou mais defeituosas. Sabendo que a proporção de peças defeituosas é de 7% determine o preço médio por peça de cada proposta. 2) Uma fabrica recebe, sem identificação, peças provenientes de três fornecedores. A, B e C. Sabe-se que 50% das peças vieram do fornecedor A, 30% do B e 20% do C. Das peças do fornecedor A, 40% são grandes e 60%pequenas. Do fornecedor B, 30% são grandes e 70% são médias. Do fornecedor C, 60% são pequenas, 30% são grandes e 10% médias. a) Escolhendo-se aleatoriamente uma peça, qual a probabilidade dela ser grande? b) Após pegar uma peça e verificar que é grande qual a probabilidade dela ter vindo do fornecedor B? 3) Numa exposição de orquídeas estão expostas, sem identificação, orquídeas provenientes de três orquidários: A, B e C. Sabe-se que 50% das plantas vieram do orquidário A, 30% do orquidário B e 20% do orquidário C. Das orquídeas do orquidário A, 40% produzem flores vermelhas e 60% produzem flores brancas. Das orquídeas do orquidário B, 30% produzem flores brancas e 70% produzem flores amarelas. Do orquidário C, 60% produzem flores vermelhas, 30% produzem flores brancas e 10% produzem flores amarelas. Escolhida aleatoriamente uma orquídea e verificado que produz flores brancas: a) qual a probabilidade de que seja proveniente do orquidário A? b) Escolhida aleatoriamente uma orquídea e verificado que produz flores vermelhas, qual a probabilidade de que seja do orquidário B? c) Escolhida aleatoriamente uma orquídea e verificado que produz flores vermelhas, qual a probabilidade de que seja proveniente do orquidário A? 4) Uma empresa recebeu duas propostas para a compre de um artigo de sua produção. Proposta A: a empresa compradora seleciona ao acaso 18 peças, examina-as e paga R$120,00 por peça do lote, se existir no máximo uma peça defeituosa na amostra e R$100,00 por peça caso contrário. Proposta B: ou então seleciona ao acaso 12 peças, examina-as e paga R$180,00 por peça se não existir nenhuma defeituosa e R$60,00 caso tenha uma ou mais defeituosas. Sabendo que a proporção de peças defeituosas é de 7% determine o preço médio por peça de cada proposta. 5) Um empreiteiro apresentou orçamentos separados para a execução da parte elétrica e da parte de hidráulica de um edifício. Ele acha que a probabilidade de ganhar a concorrência da parte elétrica é 1/2. Caso ele ganhe a parte elétrica, a chance de ganhar a parte hidráulica é 3/4, caso contrário, essa probabilidade é de 1/3. Determine a probabilidade dele: a) ganhar os dois contratos. b) ganhar apenas um. c) não ganhar nenhum. R: 3/8 7/24 1/3 6) Duas máquinas A e B produzem diariamente 600 e 900 peças respectivamente. As máquinas A e B apresentam respectivamente 4% e 6% de peças defeituosas por dia. Da produção de um dia selecionou-se uma peça ao acaso e constatou-se que era defeituosa. Qual a probabilidade de que tenha sido fabricada pela máquina A? R: 0,4051 7) Um arrombador de casas tem em seu poder um grande número de chaves falsas. A probabilidade de uma chave falsa abrir uma porta é 0,05. Para cada tentativa leva exatamente 3 minutos para se certificar que a chave não serve. Uma ronda noturna passará 9 minutos após o ladrão começar sua primeira tentativa e o prenderá com certeza, se estiver fora da casa, e com probabilidade 0,40 se estiver dentro da casa. Qual a probabilidade do ladrão ser preso? R: 0,916 8) Numa avenida existem 3 sinaleiros de trânsito, suficientemente espaçados para poderem ser considerados independentes. O primeiro dá luz verde durante 30 segundos em cada minuto; o segundo 40 segundos por minuto e o terceiro 50 segundos por minuto. Um motorista percorre toda a avenida em sua total extensão. Qual a probabilidade de que encontre: a) todos os sinais abertos? b) apenas um deles fechado? c) os três sinais fechados? R: 0,28; 0,47; 0,028 9) Lançando uma moeda 4 vezes, qual a probabilidade de que ocorra cara exatamente 2 vezes? R: 3/8 10) Estima-se que a probabilidade de Mário ser culpado é 0,2. São chamadas duas testemunhas. Se Mário for realmente culpado, Alberto dirá que é culpado, e Carlos com 0,6 de probabilidade dirá que é culpado. Se Mário for inocente, Alberto dirá com probabilidade de 0,3 que é inocente, e Carlos dirá certamente que é inocente: a) qual a probabilidade de Alberto dizer que Mário é inocente; b) qual a probabilidade de Mário ser inocente se Carlos disse que é inocente; c) qual a probabilidade das duas testemunhas afirmarem a mesma coisa; d) qual a probabilidade de Alberto mentir? R: 0,24 ; 0,9091 ; 0,36 e 0,56 11) Qual a probabilidade de que um mês, escolhido ao acaso, de um ano não bissexto, tenha 5 domingos? R: 29/84 12) Duas máquinas produzem peças idênticas que são misturadas. A produção da máquina A é o dobro da de B. A máquina A produz 60% das peças sem defeito, enquanto a segunda produz 84%. Uma peça é retirada ao acaso e resulta ter defeito. Qual a probabilidade de ela ter sido fabricada na máquina A? Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 13) De um total de 90 alunos que se destinam os cursos de matemática, física e química, sabe-se que: a) 30 destinam-se a matemática e destes, vinte são do sexo masculino; b) o total de alunos do sexo masculino é 40 dos quais 10, destinam-se a química; c) existem dez moças que se destinam ao curso de química. Nessas condições: a) sorteando-se um aluno ao acaso, do grupo total e sabendo-se que é do sexo feminino, qual a probabilidade de que ele se destine ao curso de matemática? b) sabendo-se que é do sexo masculino, qual a probabilidade de que ele se destine ao curso de química? c) qual a probabilidade de estudar física? R: 1/5 1/4 4/9 14) Duas máquinas produzem peças idênticas que são misturadas. A produção da máquina A é o dobro da de B. A máquina A produz 60% das peças sem defeito, enquanto a segunda produz 84%. Uma peça é retirada ao acaso e resulta ter defeito. Qual a probabilidade de ela ter sido fabricada na máquina A? R: 5/6 15) Uma mensagem é codificada num código binário. A probabilidade das transmissões dos dois símbolos são 0,45 para o “0” e 0,55 para o “1”. No canal, os símbolos “0” são distorcidos para “1” com probabilidade 0,2 e os símbolos “1”“1”, são distorcidos para “0” com probabilidade 0,1. Ache a probabilidade de que tendo recebido: a) um “0” ele não seja distorcido; b) um “1” ele seja distorcido. R: 0,8674 0,1538 16) Uma urna contém 3 bolas brancas e 7 vermelhas. Uma bola é retirada da urna e uma da outra cor é colocada nela. a) Depois disso uma segunda bola é retirada da urna, qual a probabilidade de que ela seja vermelha? b) se as duas bolas retiradas da urna são da mesma cor, qual a probabilidade que elas sejam brancas? R: 66/100 e 1/8 17) A probabilidade de um atirador A acertar um alvo é 0,6. A probabilidade de um atirador B acertar o mesmo alvo é 0,5. Se cada atirador dispara 3 tiros, qual a probabilidade de que o alvo seja atingido? R: 0,992 18) Um meteorologista acerta 80% dos dias em que vai chover e, 90% dos dias em que faz bom tempo. Chove em 10% dos dias. Tendo havido previsão de chuva, qual a probabilidade de chover? R: 0,4705 19) Uma urna contém 4 bolas brancas, 2 pretas e 5 amarelas. Outra urna contém 3 brancas, 5 pretas e 2 amarelas. a) extrai-se uma bola de cada urna. Qual a probabilidade das 2 bolas serem da mesma cor; b) se da primeira urna retirarmos uma bola e passarmos para a segunda, sem ver-se a cor, e retirarmos uma bola amarela da segunda, qual a probabilidade de ter ido uma branca para a segunda? R: 16/55 25/121 20) Um estudante está participando de um exame de múltipla escolha onde cada questão tem cinco alternativas, sendo apenas uma correta. Se o estudante conhece a questão ele sabe escolher a alternativa correta. Caso contrário ele escolhe aleatoriamente uma alternativa entre as cinco possíveis. Supondo que o estudante sabe a resposta de 70% das questões, determine: a) A probabilidade de que para uma dada questão o estudante assinale a alternativa certa. b) Se para uma dada questão ele assinala a resposta certa, qual a probabilidade de que ele conhecesse a pergunta? 21) Uma senhora compra determinado produto às vezes da marca A e às vezes da marca B. Se ficou satisfeita com sua aquisição ela compra novamente a mesma marca, caso contrário ela muda. Se a marca A tem probabilidade 0,70 de ser satisfatória enquanto que a marca B tem probabilidade 0,80, qual a probabilidade de que na terceira aquisição o produto seja da marca A, sabendo que para decidir que marca deve comprar na primeira vez ela joga uma moeda honesta. 22) Numa escola 5% dos homens e 2% das mulheres têm mais de 1,80m de altura. Por outro lado, 60% dos estudantes dessa escola são homens. Se um estudante selecionado aleatoriamente, tem mais que 1,80m de altura, qual a probabilidade dele ser mulher? R: 8/38 23) Para um determinado telefone a probabilidade de se conseguir linha é de 3/4 em dias normais e 1/4 em dias de chuva. A probabilidade de chover em um dia é de 1/10, além disso, tendo conseguido linha, a probabilidade de que o número chamado esteja ocupado é de 11/21: a) qual a probabilidade de que um telefonema tenha sua ligação completada; b) qual a probabilidade de que em dois telefonemas apenas um seja completado? R: 1/3 e 4/9 24) Num grupo de 500 estudantes, 80 estudam engenharia, 150 estudam informática e 10 estudam engenharia e informática. Se um aluno é escolhido ao acaso, qual a probabilidade de que: a) ele estude informática e engenharia; b) ele estude somente engenharia; c) ele estude somente informática; d) ele não estude nem engenharia nem informática; R: 0,02 ; 0,14 ; 0,28 ; 0,56 25) Um colégio tem 400 estudantes e sabe-se que 140 estudam francês, 170 estudam alemão e 200 estudam inglês. Sabe-se ainda que 70 estudam francês e inglês; 90 alemão e inglês; 60 alemão e francês e, 40 as três línguas. Se um estudante é escolhido ao acaso, qual a probabilidade de que seja: a) estudante de 2 e Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos somente duas línguas? b) estudante de, no mínimo, duas línguas? c) estudante de alemão, sabendo-se que ele estuda francês? d) estudante de nenhum delas? e) estudante só de inglês? f) estude só inglês ou francês? g) estudante de só uma língua? h) Só francês e inglês? 26) Uma cidade tem 30.000 habitantes e três jornais A, B e C. Uma pesquisa de opinião revela que 12.000 lêem A, 8.000 B; 6.000 C, 7.000 A e B, 4.500 A e C, 1.000 B e C, e 500 A, B e C. Qual a probabilidade de que um habitante leia: a) pelo menos um jornal; b) só um jornal? R: 0,47 e 0,08 27) Num estabelecimento bancário, trabalham 120 empregados que estão classificados de acordo com o fato de serem casados ou não, terem curso médio ou não. Dos empregados, 50 são casados, 40 não são casados e nem têm curso médio e existem 15 que são casados e têm curso médio. Quantos empregados possuem curso médio? Qual a probabilidade de extrairmos um elemento do conjunto dos empregados do estabelecimento que seja só casado? R: 45 e 35/120 Trabalho 3 para entregar 1) Um método A de diagnósticos de certa enfermidade dá resultado positivo para 80% dos portadores da enfermidade e para 10% dos sãos. O método B de diagnóstico da mesma enfermidade dá positivo para 70% dos portadores e para 5% dos sãos. Sabe-se que 15% da população são portadores da dita enfermidade. a) Calcular a probabilidade de uma pessoa fornecer resultados positivos pelos dois métodos. b) Qual a probabilidade de, entre duas pessoas enfermas, pelo menos uma, fornecer resultado positivo por algum método? R: 0,0882 ; 0,94 2) Uma urna A contém duas bolas brancas e três bolas pretas. Uma urna B tem uma bola branca e duas pretas. Uma bola é transferida ao acaso, da urna A para a urna B. Em seguida uma bola é transferida ao acaso, da urna B para a urna A. Extraem-se, então, duas bolas ao acaso, da urna A. Calcular a probabilidade de que sejam duas bolas pretas. R: 0,33 3) Duas máquinas produzem peças idênticas que são misturadas. A produção da máquina A é o dobro da de B. A máquina A produz 60% das peças sem defeito, enquanto a maquina B produz 84%. Uma peça é retirada ao acaso da mistura e, resulta ter defeito. Qual a probabilidade dela ter sido fabricada na máquina A? 4) João diz a verdade com probabilidade 3/4 enquanto que José diz a verdade com probabilidade 3/5. João faz uma afirmativa e José diz que ele mente, ou seja, contesta João. Qual a probabilidade de João estar dizendo a verdade? R: 2/3 O mal neste mundo é que os estúpidos vivem cheios de si e os sábios, cheios de dúvidas Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Módulo 3 Distribuição de variável discreta Como visto, as variáveis aleatórias discretas em Estatística são definidas como sendo o resultado de uma contagem, não existem em forma fracionária e nem são negativas. Algumas distribuições de variáveis aleatórias discretas, pela sua freqüente utilização, merecem estudo especial. E para que essas distribuições possam ser modeladas matematicamente, devem preencher alguns requisitos essenciais bem definidos para que se adaptem as situações reais. Vamos começar por uma muito especial, que serve da base para o estudo das distribuições binomiais. Distribuição binomial É o resultado de um experimento de Bernoulli executado “n” vezes seguidas e, que apresentam as seguintes características: a) Cada experimento executado apresenta um resultado independente do resultado anterior. b) O resultado de cada experimento só pode ser o sucesso (p) ou fracasso (q), de modo que teremos sempre p + q = 1. c) Em cada experimento executado, o sucesso terá sempre o mesmo valor para a probabilidade “p”. Vamos executar “n” experimentos de Bernoulli. Admitamos que dos “n” experimentos efetuados ocorram “x” sucessos e, conseqüentemente, “n−x” fracassos. O valor da probabilidade para essa situação é calculado na forma: p . p....... p . q.q......q n x x Portanto teremos: p x qn x Porém, como os eventos podem ocorrer em outras ordens distintas, todas com a mesma probabilidade, devemos contar quantas situações diferentes podemos obter daquela, e isto nós conseguimos, aplicando a contagem de permutação com elementos repetidos que é igual a uma combinação de “n” elementos tomados “x a x”. Na matemática a combinação de “n” elementos é escrita na forma Cn,x também representada por n denominada “número binomial”, que vale: x n n! x!(n x)! x portanto a fórmula que calcula a probabilidade de uma variável binomial “x” é dada por: n P(x) px qn x x Na solução de um problema de binomial, devemos identificar no problema as seguintes variáveis: p = é o valor da probabilidade do que se quer que aconteça, ou seja, é o evento desejado no problema. q=1−p n = número de experimentos executados x = é o número de vezes que a pergunta do problema pede que ocorra o sucesso. Média e variância de uma binomial E[B] μ np 2 σ (B) npq σ npq média da binomial variância da binomial desvio padrão da binomial Exercícios de aplicação Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 1) Numa urna, existem 6 bolas brancas, 3 bolas pretas e 2 vermelha. São retiradas 8 bolas com reposição. Calcular a probabilidade de sair: a) exatamente 3 bolas brancas; b) no mínimo, 3 bolas pretas; c) alguma bola vermelha. 2) Um dado é viciado, de modo que a probabilidade de dar ponto 6 é igual a 0,20. Jogando-se 20 vezes o dado, calcule a probabilidade de que o ponto 6 ocorra 5 vezes, sendo 3 vezes nas 10 primeiras jogadas e 2 vezes nas 10 jogadas finais. 3) Um torneio de futebol deve ser decidido após o último jogo, entre os times A e B, por cobranças de penalidades máximas. Tendo o time A desperdiçado 2 dos 5 tiros que lhe cabiam, é a vez de o jogador do time B, designado para as cobranças, mostrar sua perícia; este tem probabilidade 0,8 de acertar, em cada tiro: a) qual a probabilidade de o time A ser declarado vencedor do torneio, após esta última série de tentativas do time B? b) qual a probabilidade de ser necessária a repetição do processo decisório? 4) Uma remessa de 20 tubos de televisão contém 12 bons e 8 defeituosos. 3 tubos são escolhidos aleatoriamente e testados sucessivamente com reposição. Qual a probabilidade de saírem, ao menos, 2 bons? 5) Uma indústria fabrica tanques para combustível, e sabe-se que cada tanque possui 5 válvulas. A cada período determinado de tempo é feita uma manutenção preventiva dessas válvulas, e tem-se verificado que 30% delas necessitam ser substituídas. Calcular a probabilidade de: a) um tanque ter, no máximo, 3 válvulas que necessitem substituição; b) quatro tanques, de um conjunto de 6, apresentarem exatamente 2 válvulas por tanque que necessitem substituição. 6) Uma companhia de aviação chegou à conclusão que 4% das pessoas, fazendo reserva num dado vôo, não comparecem ao embarque. Conseqüentemente, adotou a política de reservar 77 lugares para um avião com Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 75 assentos. Qual é a probabilidade de que todas as pessoas que comparecem encontrem lugares? 7) Numa fábrica, a máquina 1 produz, por dia, o dobro de peças que a máquina 2. Sabe-se que 4% das peças fabricadas pela máquina 1 tendem a ser defeituosas, enquanto 7% de defeituosas são produzidas na máquina 2. A produção diária das máquinas é misturada. Extraída uma amostra aleatória de 20 peças, qual a probabilidade de que essa amostra contenha: a) 2 peças defeituosas; b) 3 ou mais peças defeituosas? Tarefa mínima 1) A probabilidade de que um carro, indo de São Paulo a Bauru tenha, no decorrer da viagem, um pneu furado é 0,05. Achar a probabilidade de que entre 10 carros, indo todos de São Paulo a Bauru: a) exatamente um carro tenha um pneu furado; b) dois ou mais carros tenham um pneu furado. R: 0,3151 e 0,0861 2) Um aluno conhece bem 70% da matéria dada. No exame com cinco perguntas sorteadas ao acaso, sobre toda a matéria, que probabilidade tem de responder mais da metade das perguntas? R: 0,5848 3) Numa oficina, funcionam 6 máquinas idênticas; para qualquer uma delas, a probabilidade de entrar em pane, durante o dia de trabalho, é igual a 0,1. Supondo-se que as falhas ocorram independentemente entre si, pede-se calcular a probabilidade de que: a) pelo menos, uma entrar em pane; b) não ocorra falha em dois dias consecutivos. R: 0,4685 e 0,2824 4) Um fabricante de certas peças de automóvel garante que uma caixa de suas peças conterá no máximo, 2 itens defeituosos. Se a caixa contém 20 peças e a experiência tem demonstrado que esse processo de fabricação produz 2% de itens defeituosos, qual a probabilidade de que uma caixa de suas peças vá satisfazer a garantia? R: 0,9929 5) Um jogo consiste no seguinte: um jogador lança 2 dados 5 vezes. Se, pelo menos, em 2 lançamentos dos dois dados, ele obtiver a soma dos pontos igual a sete ou maior que nove, ganha o jogo. a) Qual a probabilidade da vitória? b) Qual a probabilidade de que, em 4 partidas desse jogo, o jogador ganhe exatamente 2? R: 0,5394 0,3704 6) Numa seção de uma indústria metalúrgica, sete prensas estão ligadas a uma chave automática que desliga, quando a corrente atinge 25A. Cada prensa consome 1A, girando em vazio e 5A quando em operação. Sabendo-se que cada prensa é solicitada uma vez por minuto, durante 15 segundos cada vez, num dado instante, qual a probabilidade de a chave se desligar? R: 0,0128 7) Uma máquina apresenta 20% de defeitos na produção. Um inspetor de qualidade, ignorando a percentagem real de defeitos da máquina, retira ao acaso uma amostra de 8 peças de sua produção. a) Qual é a probabilidade de que venha a concluir, com base nessa amostra, que a proporção de defeitos é superior a 20%? b) Tirando-se seis amostras de 8 peças cada uma, qual a probabilidade de se terem 3 amostras com mais de um defeito? R: 0,4966 e 0,3124 8) Um fabricante afirma que apenas 5% de todas as válvulas que produz tem uma duração inferior a 20 horas. Uma indústria compra semanalmente um grande lote de válvulas deste fabricante, mas sob a seguinte condição: ele aceita o lote, se em 10 válvulas escolhidas ao acaso, no máximo uma, tenha duração inferior a 20h; caso contrário, o lote será rejeitado. Se o fabricante, de fato, tem razão, qual a probabilidade de que um lote seja rejeitado? R: 0,0861 9) Um produtor de sementes vende pacotes de 20 sementes cada. Os pacotes que apresentarem mais de uma semente sem germinar serão indenizados. A probabilidade de uma semente germinar é de 0,98. a) Qual a probabilidade de um pacote não ser indenizado? b) se o produtor vende 1.000 pacotes, qual é o número esperado de pacotes indenizados? c) Quando um pacote é indenizado, o produtor tem um prejuízo de R$1,20, se o pacote não for indenizado, ele tem um lucro de R$2,50. Qual o lucro esperado por pacote? d) Calcule a média e a variância da variável “número de sementes que não germinaram por pacote”. 10) Uma moeda é lançada 6 vezes. Qual a probabilidade de obtermos, ao menos, uma cara? R: 63/64 Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 11) A probabilidade de que, num único tiro, um atirador acerte o alvo é 0,4. Quantos tiros devem ser dados para que a probabilidade de acertar, pelo menos uma vez no alvo, não seja menor que 0,9? R: n4 12) Numa fábrica, um tipo de peça fabricada apresenta 4% de defeituosas. O fabricante vende uma partida de 2.000 peças, recebendo 3 propostas: a) o comprador A examina uma amostra de 100 peças e pagará R$50,00 por peça, se houver até 3 defeituosas na amostra. Caso contrário, pagará R$30,00 por peça. b) O comprador B examina 10 peças, pagando R$55,00 por peça, se todas as 10 peças forem perfeitas e R$25,00 por peça se houver alguma defeituosa. c) o comprador C oferece R$35,00 por peça, sem fazer teste algum. Qual a melhor oferta para a indústria? R: b 13) Deseja-se produzir 3 peças boas em uma máquina que produz 50% de peças defeituosas. Quantas peças deve-se programar para produzir, para que a probabilidade de não obter 3 peças boas, não seja superior a 50%? R: 5 14) Uma urna contém 3 bolas brancas e 2 pretas. Um experimento que consiste em retirar, simultaneamente, 3 bolas dessa urna é repetido 5 vezes consecutivas. Calcule a probabilidade de que, em pelo menos 2 tentativas, sejam retiradas as 2 bolas pretas. R: 0,4718 15) Numa linha de produção, 10% das peças são defeituosas. As peças são acondicionadas em caixas de 20 unidades. A fábrica paga uma indenização de R$10,00, se em uma caixa houver 3 ou mais peças defeituosas. Quanto representa essa indenização no custo de cada peça? R: R$ 0,16 16) Um determinado artigo é vendido, em caixas, a preço de R$10,00 cada uma. É característica da produção que 20% desses artigos sejam defeituosos. Um comprador fez a seguinte proposta: de cada caixa, escolhe 15 artigos ao acaso e paga R$25,00 por ela, se nenhum artigo for defeituoso. Paga R$17,00, se um ou dois artigos forem defeituosos e R$10,00, se 3 ou mais forem defeituosos. O que é melhor para o fabricante, manter o preço de R$10,00 por caixa ou aceitar a proposta do comprador? R: aceitar a proposta 17) Da produção de uma máquina, 10 peças são retiradas. Se ocorrer 2 ou mais peças defeituosas, a produção pára, para se verificar a causa da desregulagem do processo de produção. Se a porcentagem de peças defeituosas é de 5%, qual a probabilidade de a produção não parar? 18) Um comprador paga R$1,20 por peça de primeira qualidade e R$0,80 por peça de segunda. Ele classifica, de primeira, as partidas em que, retirando-se uma amostra de 5 unidades, não seja encontrada mais que uma peça defeituosa e, de segunda, as partidas que não satisfazem a este requisito. Se as peças que chegam ao comprador são oriundas de uma produção em que 10% são defeituosas, o preço médio que o comprador paga por peça que recebe é: a) R$1,00 b) R$1,16 c) R$0,98 d) R$1,08 R: b 19) Oito moedas são lançadas 5 vezes. Calcule a probabilidade de que, em 2 desses 5 lançamentos, se obtenham 4 caras e 4 coroas. Trabalho 4 para entregar 1) Numa fábrica, um tipo de peça fabricada apresenta 4% de defeituosas. O fabricante vende uma partida de 2.000 peças, recebendo 3 propostas: a) o comprador A examina uma amostra de 100 peças e pagará R$50,00 por peça, se houver até 3 defeituosas na amostra. Caso contrário, pagará R$30,00 por peça. b) O comprador B examina 10 peças, pagando R$55,00 por peça, se todas as 10 peças forem perfeitas e R$25,00 por peça se houver alguma defeituosa. c) o comprador C oferece R$35,00 por peça, sem fazer teste algum. Qual a melhor oferta para a indústria? 2) A probabilidade de uma máquina produzir uma peça defeituosa num dia é de 0,1. a) Qual a probabilidade de que em 20 peças produzidas pela máquina num dia, ocorram 3 defeituosas? b) qual a probabilidade de que a 18ª peça produzida num dia, seja a 4ª defeituosa? c) qual a probabilidade de que a 10ª produzida num dia seja a 1ª defeituosa? d) separa-se um lote de 50 peças das 400 produzidas num dia. Qual a probabilidade de que 5 sejam defeituosas, sabendo-se que 20 das 400 são defeituosas? e) se a probabilidade de a máquina produzir uma peça defeituosa, num dia fosse de 0,01, qual a probabilidade de se ter, no máximo, 2 defeituosas em um dia de 500 peças produzidas? R: 0,1901 0,0155 0,0387 0,0658 0,1233 3) Da produção em série de uma máquina, são retiradas 5 peças, no intervalo de 1h. Se nenhuma peça defeituosa for encontrada, o processo produtivo continua normalmente. Se ocorrerem duas ou mais defeituosas, a produção é interrompida para se localizar o defeito. Se for verificada uma peça defeituosa, uma nova amostra de 10 peças é coletada, ao acaso, em seguida. Se, nesta nova amostra, ocorrerem 2 ou mais defeituosas, o processo pára, para ser pesquisada a causa do defeito de fabricação. Se a máquina produz 5% de peças defeituosas, pergunta-se: a) qual a probabilidade de parada do processo de produção? b) em 24h de operação do sistema, qual o nº esperado de horas paradas? Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 4) Uma máquina produz determinado artigo. No fim de cada dia de trabalho, é a mesma inspecionada com a finalidade de se verificar a necessidade ou não de ser submetida a ajuste ou reparo. Para tal fim, um inspetor toma uma amostra de 10 itens produzidos pela máquina, decidindo por ajuste, se assinala de 1 a 3 itens defeituosos, e por reparo, no caso de mais de 3 itens defeituosos. Se a máquina está produzindo 20% de itens defeituosos, determinar a probabilidade de ela sofrer ajuste ou reparo, após uma inspeção. R: ajuste: 0,7717 reparo: 0,1208 Quem escuta esquece. Quem vê lembra. Quem faz aprende Módulo 4 Distribuição normal A equação da curva normal de Gauss é uma curva matemática teórica, e baseia-se em dois parâmetros a média e o desvio padrão, que são os elementos que definem uma determinada população, em relação a uma característica qualquer, estudada e medida para os integrantes dessa população. Na verdade, em Estatística, quando se usa o termo população, esta se refere mais ao conjunto de valores numéricos que serviram para estudar certa característica, do que propriamente ao conjunto de indivíduos nos quais ela foi investigada e medida. Como na maior parte das vezes é impossível estudar toda a população, essa avaliação se faz a partir de um número reduzido de elementos a ela pertencentes, e é a esses pequenos subconjuntos do universo populacional que se dá o nome de amostras. Esses dois parâmetros a média e o desvio padrão que ao mesmo tempo definem tanto a curva normal como a população de onde a amostra foi retirada, constituem, portanto os elementos primordiais desse tipo de estatística denominada paramétrica, que é uma estatística assim chamada justamente por basear-se nesses dois parâmetros. Não confundir parâmetros com variáveis, muito pelo contrário. Na verdade, parâmetros podem fazer parte de uma variável, porque esta pode ser representada por uma função de x, e nesse caso os parâmetros ajudariam a definir as relações de x dentro dessa função. Numa equação matemática, os parâmetros seriam representados pelos seus valores constantes, fixos, invariáveis. Por exemplo, quando se define uma reta pela sua equação, dizse que y = a + bx. Nessa expressão, os parâmetros são o a e o b, que são grandezas constantes. Todavia, são essas constantes que individualizam a linha reta por eles definida. Portanto tanto a média como o desvio padrão são valores constantes. A curva normal, que expressa matemática e geometricamente a distribuição normal de freqüências, é uma curva sui generis, que apresenta umas tantas propriedades que a tornam particularmente útil no estudo das probabilidades, especialmente em Estatística, que afinal não é mais do que a teoria das probabilidades aplicada às Ciências de um modo geral, seja qual for o campo de atividade destas. As propriedades da distribuição normal e da curva que a expressa matemática e geometricamente são: a) A curva é uma função de x, e o seu domínio estende-se de − infinito até + infinito. b) A curva é assintótica; isto é, estende-se de − infinito a + infinito, sem nunca tocar o eixo horizontal, e, portanto a função de x jamais se anula. c) A área compreendida pela curva nesse intervalo é exatamente igual a 1, valor que, em Estatística, corresponde a 100% de probabilidade. d) A função tem um máximo, e esse máximo ocorre quando x corresponde ao seu ponto médio, ou seja, à média da distribuição. e) A distribuição é simétrica em torno da média, e como esta é igual a zero, os valores de x são negativos à sua esquerda e positivos à sua direita. f) A curva tem dois pontos de inflexão que são simétricos em relação à média, que ocorrem quando x = +1 e x = −1. Esses pontos de inflexão são conhecidos, em Estatística, como o valor do desvio padrão da distribuição normal. g) Graficamente, a curva tem forma de sino, com concavidade voltada para baixo entre os pontos de inflexão da curva, e convexidade para além e aquém desses pontos. h) Em termos de probabilidade, a área sob a curva, desde menos infinito até um valor qualquer de x fornece a probabilidade de ocorrer esse valor de x. Mas, na vida real, como fica tudo isso? Transpondo tudo isso para o dia a dia da pesquisa científica, os valores de x correspondem aos valores numéricos dos dados experimentais, enquanto que os valores de y referem-se às freqüências com que cada valor de x aparece no experimento; e a curva normal seria ela própria o perfil do histograma de freqüências de toda a amostra. Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Na realidade qualquer pesquisador sabe que os seus dados experimentais terão valores num experimento científico os valores mais variados possíveis e tanto para a média como para o desvio padrão, pois a variável aleatória contínua é obtida como resultado da medida de uma grandeza aleatória. Todavia, a curva normal depois de reduzida a variável z tem sempre média igual a 0 e desvio padrão igual a 1, A função densidade probabilidade da distribuição normal é dada pela expressão: f(x) 1 (x μ )2 2σ2 sendo a variável "x" definida no campo dos reais. e σ 2π Na prática, um grande número de grandezas tem uma distribuição que segue essa função e, portanto, o seu comportamento em termos de variabilidade pode ser estudado por ela. Fazendo gráfico daquela função obtemos uma curva, como mostrada abaixo, A solução dos problemas é feita com o auxilio de uma tabela feita em função de uma variável z chamada reduzida ou padronizada que é obtida transformando os valores da variável x em z com a formula: z x Exercícios de aplicação 1) A duração de certo tipo de lâmpadas é uma variável normal com duração média de 712 horas e desvio padrão de 49 horas. a) Qual a probabilidade de uma lâmpada escolhida ao acaso durar mais de 775h? b) Qual a probabilidade de uma lâmpada durar mais de 630h? c) Qual a probabilidade de uma lâmpada durar entre 596 e 781h? d) Qual a probabilidade de uma lâmpada durar exatamente 713h? e) Qual a probabilidade de uma lâmpada durar entre 578 e 678h? f) O fabricante deseja fixar uma garantia de duração, de tal forma que, se a duração da lâmpada for inferior à garantia, a lâmpada será trocada. De quanto deve ser essa garantia, para que somente 1% das lâmpadas seja trocada? Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 2) Uma pessoa precisa tomar um trem que parte dentro de 20 min, podendo, para chegar à estação, optar por um de dois trajetos: A e B. Sabe-se que o tempo para percorrer A é uma variável aleatória normal de média 18 min e desvio padrão 5 min, idem para B, com média 20 min e desvio padrão 2 min. a) Qual será a melhor escolha de trajeto? b) No momento em que ia escolher o trajeto, a pessoa foi informada estar o trem com atraso de 3 min. Qual será, agora, a melhor decisão? 3) Os pesos das mulheres americanas têm distribuição normal com média 63,6 kg e desvio padrão 2,5kg. a) Selecionada aleatoriamente uma mulher, determine a probabilidade de o seu peso estar entre 63,6 e 68,6kg. b) Os pesos das dançarinas de dança do ventre devem estar entre 65,5kg e 68 kg. Escolhida aleatoriamente uma mulher, determine a probabilidade de ela poder ser dançarina de dança do ventre. c) Determine P(63,6<x<65,0) d) Determine P(x>58,1) 4) O tempo de duração de baterias para automóveis, de certa marca, se distribui segundo uma normal de média 803 dias e desvio padrão 41 dias. Pede-se a probabilidade que: a) Uma bateria qualquer falhe depois de 830 dias; b) Uma bateria qualquer falhe antes de 750 dias; c) Uma bateria qualquer falhe entre 850 e 950 dias; d) Uma bateria qualquer falhe depois de 500 dias? e) Qual o prazo da garantia que o fabricante deve oferecer a fim de que se tenha de repor, no máximo, 10% das baterias? Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos 5) A observação dos diâmetros de um grande número de peças produzidas por uma máquina forneceu média 12,510cm e desvio padrão 0,095cm. Sabe-se que a distribuição dos diâmetros é aproximadamente normal e para que a peça seja aceita seu diâmetro deve estar entre 12,320cm e 12,700cm. a) Qual será o número esperado de peças defeituosas numa série de fabricação de 10.000 peças? b) Qual será o lucro esperado se soubermos que o custo da peça é de R$2,00, o preço de venda é de R$2,60 e que as peças longas podem ser recuperadas, porém o custo da peça sofre um aumento de 10%? Se não houver vento, reme Tarefa mínima 1) O número de pedidos para compra de certo produto que uma companhia recebe por semana se distribui normalmente com média 125 e desvio padrão 30. Se, em uma semana, o estoque disponível é de 150 unidades: a) Qual a probabilidade de que todos os pedidos sejam atendidos? b) Qual deveria ser o estoque para que se tivesse 98% de probabilidade de que todos pedidos fossem atendidos? R: 0,7967 e 186,5 2) Os pneus de certa marca têm peso médio de 8,35Kg com desvio padrão 0,15Kg. Como a durabilidade relaciona-se com o peso, os fabricantes decidiram pagar uma indenização de R$100,00 por pneu fornecido com menos de 8,0Kg de peso. Quanto representa, em reais, essa indenização, no custo médio por pneu? R: $0,99 3) Uma maquina automática enche garrafas com distribuição normal dos volumes e média igual a 1 litro. Desejando-se que, no máximo, uma garrafa em 100, saia com menos de 0,98 litros. Qual deve ser o maior desvio padrão tolerável? R: 0,0086 4) Os pneus de certa marca têm peso médio de 8,35Kg, com desvio padrão 0,15Kg. Como a durabilidade relaciona-se com o peso, os fabricantes decidiram pagar uma indenização de R$100,00 por pneu fornecido com menos de 80Kg de peso. Quanto representa em reais essa indenização, no custo médio por pneu? R: $ 0,99 5) Uma peça, num torno, demora em média 12 minutos com desvio padrão de 1,5 min para ser feita. Supondo que a distribuição seja normal, determinar a proporção de peças que são feitas com duração: a) inferior Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos a 10 min; b) superior a 8 min; c) entre 9,4 e 13,2 min; d) igual a 11,6 min; e) entre 10 e 13 min ou 12,5 e 14 min; f) determinar uma faixa em torno do valor médio de forma que contenha 90% dos valores do tempo de duração. R: a) 0,0918 ; b) 0,9961 ; c) 0,7463 ; d) 0 ; e) 0,7525 ; f) 9,53 e 14,48 6) Os pneus de certa marca têm peso médio de 8,35kg, com desvio padrão 0,15Kg. Como a durabilidade relaciona-se com o peso, os fabricantes decidiram pagar uma indenização de R$100,00 por pneu fornecido com menos de 80Kg de peso. Quanto representa, em reais, essa indenização, no custo médio por pneu? 7) Uma peça é aceita num controle de qualidade com dimensões entre 299 e 301 mm. Verifica-se que 10% das peças são rejeitadas como grandes e 20% como pequenas. Calcular a porcentagem de rejeição, no caso da especificação ser ampliada para 298,5 e 301,5 mm. 8) A nota média de um exame final foi 72 e a variança 81. Sabe-se que 10% dos melhores alunos receberam a classificação A. Qual a nota mínima que o aluno deve receber para classificar-se em A? 9) Os níveis de colesterol em homens entre 18 e 24 anos de idade têm distribuição normal com média de 178,1 e desvio padrão de 40,7. Escolhido aleatoriamente um homem entre 18 e 24 anos de idade, determine a probabilidade de seu nível de colesterol estar entre 200 e 250. 10) Os prazos de substituição de aparelhos de TV têm distribuição normal com média de 8,2 anos e desvio padrão de 1,1 anos. Determine a probabilidade de um aparelho de TV selecionado aleatoriamente acusar um tempo de substituição inferior a 7,0 anos. 11) Supondo que os pesos do papel descartado semanalmente pelas residências tenham distribuição normal com média de 9,4 kg e desvio padrão de 4,2 kg. Determine a probabilidade de escolher aleatoriamente uma residência que descarte entre 5,0 kg e 8,0 kg de papel em uma semana. 12) Os prazos da gravidez têm distribuição normal com média de 268 dias e desvio padrão de 15 dias. Com base nessa informação, determine a probabilidade de uma gravidez durar 308 dias ou mais. Que é que o resultado sugere? 13) Uma pesquisa apontou que os homens gastam em média 11,4 minutos no chuveiro. Suponha que esses tempos tenham distribuição normal com desvio padrão de 1,8 min. Escolhido um homem aleatoriamente, determine a probabilidade de ele gastar ao menos 10 minutos no chuveiro. 14) Os escores de QI têm distribuição normal com media 100 e desvio padrão 15. A admissão numa empresa exige um QI superior a 131,5. a) escolhida aleatoriamente uma pessoa, determine a probabilidade de ela satisfazer aquela exigência da empresa. b) em uma região de 70.000 habitantes, quantos serão admitidos à uma vaga na empresa? 15) Uma peça é produzida em série e sua dimensão tem média 28,4 mm e desvio padrão 0,09 mm. As peças passam por uma inspeção onde são eliminadas todas que têm dimensões abaixo de 28,2 mm e acima de 28,7 mm. Qual a probabilidade da peça ser eliminada? 2 16) Uma peça num torno demora em média 12 minutos com variança 2,25min para ser feita. Supondo que a distribuição seja normal, determinar a proporção de peças que são feitas com duração: a) inferior a 10 min; b) superior a 8 min; c) entre 9,4 e 13,2 min; d) igual a 11,6 min; e) entre 10 e 13 min ou 12,5 e 14 min; f) determinar uma faixa em torno do valor médio de forma que contenha 90% dos valores do tempo de duração. 17) As lâmpadas fabricadas por uma indústria têm vida média de 2.060 horas e desvio padrão de 150 horas. Calcular a probabilidade de: a) uma lâmpada queimar-se com mais de 1.900 horas? b) idem, com menos de 1.800 horas? c) idem, entre 1.900 e 2.200 horas? d) idem, entre 1.800 e 1.900 horas? e) no máximo uma lâmpada, de um conjunto de 4 lâmpadas, queimar-se com mais de 1.800 horas. f) exatamente 2 lâmpadas, de um conjunto de 5 lâmpadas, queimarem-se com menos de 2.060 horas? 18) Uma maquina automática enche garrafas com distribuição normal dos volumes e média igual a 1 litro. Desejando-se que, no máximo, uma garrafa em 100, saia com menos de 0,99 litros, qual deve ser o maior desvio padrão tolerável? Tabela Normal Atenção: Os valores das probabilidades desta tabela se referem as áreas compreendidas desde a média até o valor da "z", seja ele positivo ou negativo. Quando se vai ler o valor de z Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos correspondente a certa probabilidade não esquecer que se o valor procurado de "z" estiver a esquerda da média o seu valor é negativo. z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1.6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,3 3,3 3,4 0 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3 159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0.4641 0,4713 0,4772 0,4821 0.4861 0,4893 0,4918 0,4938 0.4953 0,4965 0,4974 0.4981 0,4987 0,4990 0,4993 0,4995 0,4997 1 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2611 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0.4987 0.4991 0,4993 0,4995 0,4997 2 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4496 0,4967 0,4982 0,4987 0,4991 0,4994 0,4995 0,4997 3 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,.3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0.4977 0,4983 0,4988 0,4991 0,4994 0,4996 0,4997 4 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2703 0,2995 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0.4945 0,4959 0,4909 0,4977 0,4984 0,4908 0,4092 0,4994 0,4996 0,4997 5 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,4992 0,4994 0,4996 0,4997 6 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 7 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0.4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0.4985 0,4989 0,4992 0,4995 0,4990 0,4997 8 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2517 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4997 9 0,0359 0.0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4906 0,4990 0,4993 0,4995 0,4997 0,4998 Estatística Descritiva Eng. Prof. Esp. Bruno César de Mattos Frases retiradas das provas do ENEM. Lamentável o nível de instrução no nosso país. E o pior é que o governo vai cada vez mais facilitando a aprovação desses alunos e vê isso como normal. A quem interessa ter a nossa educação nesse nível?? "O Brasil não teve mulheres presidentes, mas várias primeiras-damas foram do sexo feminino". "Vasilhas de luz refratória podem ser levadas ao forno de microondas sem queimar". "O bem star dos abtantes da nossa cidade muito endepende do governo federal capixaba". "Animais vegetarianos comem animais não-vegetarianos". "Não cei se o presidente está melhorando as insdiferenças sociais ou promovendo o sarneamento dos pobres. Me pré-ocupa o avanço regresssivo da violência urbana". "Fidel Castro liderou a revolução industrial de 1917, que criou o comunismo na Rússia". "O Convento da Penha foi construído no céculo 16, mas só no céculo 17 foi levado definitivamente para o alto do morro". A História se divide em 4: Antiga, Média, Momentânea e Futura, a mais estudada hoje". "Os índios sacrificavam os filhos que nasciam mortos matando todos assim que nasciam". "Bigamia era uma espécie de carroça dos gladiadores, puchada por dois cavalos". "Os pagãos não gostavam quando Deus pregava suas dotrinas e tiveram a idéia de eliminá-lo da face do céu". "A capital da Argentina é Buenos Dias". "A prinssipal função da raiz é se enterrar no chão". "As aves tem na boca um dente chamado bico". "A Previdência Social assegura o direito a enfermidade coletiva". "Respiração anaeróbica é a respiração sem ar, que não deve passar de 3 minutos". “Ateísmo é uma religião anônima praticada escondido. Na época de Nero, os romanos ateus reuniam-se para rezar nas catatumbas cristãs". "Os egipícios dezenvolveram a arte das múmias para os mortos poderem viver mais". "O nervo ótico transmite idéias luminosas para o cérebro". "A Geografia Humana estuda o homem em que vivemos". "O nordeste é pouco aguado pela chuva das inundações frequentes". "Os Estados Unidos tem mais de 100.000 Km de estradas de ferro asfaltadas". "As estrelas servem para esclarecer a noite e não existem estrelas de dia porque o calor do sol queimaria elas". "Republica do Minicana e Aiti são países da ilha América Central". As autoridades estão preocupadas com a ploleferação da pornofonografia na Internet". "A ciência progrediu tanto que inventou ciclones como a ovelha Dolly". "O Papa veio instalar o Vaticano em Vitória, mas a Marinha não deixou para construir a Capitania dos Portos no mesmo lugar". "Hormônios são células sexuais dos homens masculinos". "Os primeiros emegrantes no ES construiram suas casas de talba". "Onde nasce o sol é o nacente, onde desce é o decente". "A terra é um dos planetas mais conhecidos e habitados no mundo. Os outros planetas menos demográficos são: Mercúrio, Venus, Marte, Lua e outros 4 que eu sabia, mas como esqueci agora e está na hora de entregar a prova, a senhora não vai esperar eu lembrar, vai? Mas tomara que não baixe minha nota por causa disso porque esquecer a memória em casa todo mundo esquece um dia, não esquece?".