Bioestatística – Distribuições Estatísticas Prof. Dr. Cláudio S. Sartori sua ocorrência, quando o número de observações é muito grande. A probabilidade propriamente dita é o limite da frequência relativa quando o número de observações cresce indefinidamente. A definição estatística é útil na prática; porém apresenta dificuldades do ponto de vista matemático, visto que um número limite real pode não existir. Por essa razão, desenvolveu-se axiomaticamente uma teoria moderna, na qual a probabilidade é um conceito indefinido, como ponto e linha são indefinidos em geometria. Teoria elementar de probabilidade A probabilidade de ocorrência de um evento E, que possa ocorrer de h maneiras diferentes em um total de n modos possíveis igualmente prováveis é dada por: h n p Pr{E} A probabilidade de Nao ocorrência do evento (q), denominado insucesso, é dada por: q Pr{não E} O evento ~ E , E ou ~ E . n h n "não h n 1 E" é 1 p denotado Exemplo 3 - Se em 1000 lances de uma moeda resultam 529 caras, a frequência relativa dessas caras é 529/1000=0,529. Se em outros 1000 lances resultam 493 caras, a frequência relativa no total dos 2000 lances é de (529+493)/2000=0,511. De acordo com a definição estatística, prosseguindose dessa maneira, poder-se-á finalmente chegar cada vez mais próximo de um número que será denominado probabilidade de ocorrer cara em um único lance de uma moeda. De acordo com os resultados até agora, ela será de 0,5 com um algarismo significativo. Para obter outros algarismos significativos, deveriam-se ser feitas outras observações adicionais. por Exemplo 1 - Admita que o evento E seja a ocorrência dos números 3 ou 4, em um único lançamento de um dado. Há seis maneiras segundo as quais o dado pode cair, e que resultam nos números 1,2,3,4,5 e 6. Se o dado é "honesto", (não viciado), pode-se supor que as seis maneiras sejam igualmente prováveis. Como E pode ocorrer de duas destas maneiras, teremos: p Pr{E} 2 6 1 3 Probabilidade Condicional: independentes e dependentes. Exemplo 2 - A probabilidade de não ter conseguido um 3 ou um 4, isto é, de ter conseguido {1,2,5,6} é: q Pr{E} 1 1 3 2 3 probabilidade Eventos Se E1 e E2 são dois eventos, a probabilidade de E2 ocorrer, depois de E1 ter acontecido é definida por: Pr{E1|E2} Ou probabilidade de E2 dado E1 e é denominada de probabilidade condicional de E2 depois de E1 ter ocorrido. Se a ocorrência ou não de E1 não afetar a probabilidade da ocorrência de E2, então: Pr{E2|E1}=Pr{E2} e diz-se que E1 e E2 são eventos independentes; caso contrário, eles são eventos dependentes. Se se representar por E1 e E2 a ocorrência de ambos os eventos, então: Pr{E1E2}=Pr{E1}Pr{E2} Exemplo 4 - A determinação do sexo na raça humana é feita através dos coromossomos X e Y. Há na célula humana normalmente 23 pares de cromossomos. A mulher possui o par XX e o homem XY. Sendo assim, qual a probabilidade de nascer menino e qual a probabilidade de nascer menina na raça humana? Note-se que a probabilidade de um evento é um número compreendido entre 0 e 1. Se um evento não pode ocorrer, sua probabilidade é 0. Se ele deve ocorrer, isto é, se sua ocorrência é certa, sua probabilidade é 1. Se p é a probabilidade de que um evento ocorra, a vantagem a favor de seu acontecimento é p : q (leia: p para q), a vantagem contra seu acontecimento é q : p. Definição de frequência relativa. 1 como Da definição anterior, o termo "igualmente provável" é vago, pois estamos definindo essencialmente a probabilidade em seus próprios termos. Por esta razão, alguns autores têm estabelecido uma definição estatística de probabilidade. De acordo com isso, a probabilidade avaliada ou a probabilidade empírica de um dado evento é considerada como a frequência relativa de Temos probabilidade de 50% homens e 50% mulheres: 1 Prof. Dr. Cláudio S. Sartori Sexo Cromossomos Homem XY Bioestatística – Distribuições Estatísticas Mulher XX XX XX Exemplo 7 - Qual a probabilidade de se retirar 1 ás em um baralho de 52 cartas? Existem 4 ases nesse baralho. Logo P=4/52=1/13 XY XY Observações: 1000 em cada 100.000 nascimentos ocorre a Síndrome de Down (mongolismo ou trisomia 21). A chance de nascer crianças com mongolismo aumenta com a idade da mãe. Caracteriza-se por haver 47 cromossomos (o normal é 46 cromossomos na célula humana (23 pares)). Há cerca de 1% de chance de uma criança ser afetada quando a mãe possui idade superior a 40 anos. A Síndrome de Turner ocorre quando há ausência do segundo cromossomo X ou do Y e causa o nascimento de pessoas baixas e estéreis. Exemplo 8 - Uso da probabilidade na Mecânica Quântica - Trata- se os fenômenos de movimento e equilíbrio do mundo macroscópico com a mecânica Newtoniana. Já no mundo microscópico, a Mecânica Quântica, cuja teoria foi desenvolvida por vários cientistas, como Max Planck, Einstein, Neils Bohr e De Broglie, explica os fenômenos que envolvem partículas de pequenas dimensões, como por exemplo, o estudo da corrente elétrica (movimentos dos elétrons) em um diodo. Nesse estudo, o cálculo de probabilidade é fundamental. Há uma "barreira" de potencial natural ao movimento dos elétrons. Existe a probabilidade do elétron "atravessar" essa barreira e se propagar no mesmo sentido, não refletindo seu movimento. Isso é verificado quando se calcula a densidade de 2 probabilidade , onde representa o estado quântico do elétron. A figura abaixo ilustra a barreira de potencial e a densidade 2 , ambas em função de x (posição do elétron). Exemplo 5 - Sabe-se hoje que há cerca de 175000 genes compondo o cromossomo de uma célula humana. Os tipos sanguíneos são definidos por genes denominados IA, IB e i. Os genes IA e IBsão dominantes em relação ao gene i. Há quatro tipos de sangue: Tipo O (ii), tipo A (IAIA ou IAi), tipo B (IBIB ou IBi) e tipo AB (IAIB). Se um home IAi casa-se com uma mulher IBi, qual as probabilidades da criança: a) Nascer com sangue tipo O. (25%) b) Nascer com sangue tipo A. (25%) c) Nascer com sangue tipo B. (25%) d) Nascer com sangue tipo AB. (25%) Genes Sanguíneos Homem IAi IAIB IAi Curva de densidade de probabilidade, muito usada em física quântica. Mulher IBi B I i ii Exemplo 6 - A NASA gasta cerca de dois milhões de dólares por ano na identificação de asteróides com mais de 1 km de diâmetro. A tabela a seguir indica a freqüência em função do tempo para cada diâmetro de determinado asteróide. Diâmetro 25 cm 3a4m 30 a 100 m 1 km 3 a 10 km 2 Frequência Todos os dias A cada 4 meses A cada 500 anos A cada 300.000 anos A cada 10 milhões de anos A probabilidade de cair um asteróide de 1km de diâmetro é da ordem de 1/300000 A probabilidade dele cair nos oceanos é cerca de 70%.Explique. 2 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas Exemplo 9 - O "gato de Schrödinger". Em 1935, o físico austríaco Erwin Schröndinger idealizou um experimento hipotético para demonstrar seu descontentamento com a recém criada mecânica quântica. Seu virtual "gato de Schrödinger" é um felino aprisionado em uma caixa hermeticamente fechada, com um sistema perverso: um vidro com gás mortal, acionado por um detetor de radiatividade e um átomo radiativo. O átomo teria 50% de chance de emitir uma partícula radiativa em um certo intervalo de tempo. Se isso ocorressem, o martelo, sob a ação do detetor, quebraria o vidro com veneno e o animal morreria. Para Schröndinger, o paradoxo estava na impossibilidade de a teoria determinar se o gato estaria vivo ou morto, pois o átomo teria outros 50% de chance de não emitir radiatividade, evitando o acionamento do martelo. O gato de Schröndinger permaneceria neste estado "misto"(vivo/morto) até que alguém resolvesse abrir a caixa para verificar. 1. 3 d) não ser vermelha e) ser vermelha ou branca 4.Um dado honesto é lançado duas vezes. Determinar a probabilidade de ocorrer um 4, 5 ou 6 no primeiro lance e 1, 2, ou 3 no segundo lance. Distribuição de probabilidade discreta. Se uma variável X pode assumir um conjunto discreto de valores, X1,X2…,Xk com as probabilidades p1 + p2 +pk =1 ; diz-se que está definida uma distribuição de probabilidade discreta de X. A função p(X) que assume os valores para X=X1;X=X2; X=Xk é denominada função de probabilidade ou de frequência X. Como X pode assumir valores com certas probabilidades, ele é denominado de variável aleatória discreta. A variável aleatória é denominada também variável casual ou estocástica. A distribuição de probabilidade pode ser representada graficamente, mediante o gráfico de p(X) versus X (X,p(X)), da mesma forma que a distribuição é denominada de função de distribuição de probabilidade. Exercícios Determinar a probabilidade p de: a) Aparecer um número ímpar em um único lance de um dado honesto. b) De ocorrer pelo menos uma cara em dois lances de uma moeda honesta. c) De surgir um ás, um dez de ouros ou um dois de espadas na retirada de uma única carta de um baralho, bem embaralhado, de 52 cartas. d) De aparecer o total 7 em um único lançamento de dois dados. e) De aparecer uma coroa, no próximo lance de uma moeda, se, no total de 100 lances, 56 são caras. Distribuição de probabilidade contínua Pode-se estender os conceitos anteriores para o caso em que a variável X assume um conjunto contínuo de valores. O histograma correspondente ao caso anterior torna-se uma curva contínua. P(X) é denominada de função de densidade de probabilidade, ou função de densidade e quando é dada uma função desta natureza, diz-se que foi definida uma distribuição de probabilidade para P(X). A variável X é denominada de variável aleatória reduzida. Veremos as diversas distribuições estatísticas; porém, recordaremos os conceitos da análise combinatória. Análise Combinatória. Para a obtenção de probabilidade de eventos complexos, a enumeração é frequentemente difícil, e para facilitar os cálculos há necessidade do auxílio da análise combinatória. 2.Uma experiência consiste em lançar uma moeda e um dado. Se E1 é o evento correspondente ao aparecimento de uma "cara" no lançamento de uma moeda e E2 o de ocorrer "3"ou "6"no lance do dado, expor em palavras o significado de cada notação. a)E1 b)E2 c)E1E2 d)Pr{E1E2} e)Pr{E1|E2} f)Pr{E1 + E2} 3.Uma bola é retirada ao acaso de uma urna que contém 6 vermelhas, 4 brancas e 5 azuis. Determinar a probabilidade dela: a) ser vermelha b) ser branca c) ser azul Fatorial: Definimos como fatorial de zero: 0!=1 e fatorial de 1 como 1!=1 e fatorial de n escrevemos como n! dado por: n! n(n 1)(n 2)...0! 3 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas Arranjo : Uma permutação de n objetos diferentes, tomados p de cada vez, é uma escolha p de n objetos, não se levando em consideração a ordem de sua disposição: (n p )! C9,5 n! ( n p )! p! 102! 103.102! 102! 10.9.8.7.6! 6! 5040 9! (9 5)!5! 9! 4!5! .9.8.7.6.5! 5!4.3.2.1! 210 Exemplo 15 - Use a aproximação de Stirling para calcular 50! Exemplo 10 - Simplifique: 102!/(103!-102!) 102! 103! 102! 10! 6! Exemplo 14 - De quantas maneiras diferentes uma comissao de 5 pessoas pode ser escolhida entre 9 ? Combinação : Uma combinação de n objetos diferentes, tomados p de cada vez, é uma escolha p dos n objetos, não se levando em consideração a ordem de sua disposição: Cn, p 10! (10 4)! A10,4 n! An , p 4 102! 102!.(103 1) n! 1 102 2 nnne n S 2 505050 e 50 Também chamamos: Exemplo 11 - Dadas as letras A, B e C encontre:A3,2 e determine C3,2 explicitando seus valores: n Cn, p n! ( n p )! p! p n A3,2 3! (3 2)! 3! 1! 3.2.1! 1! onde 6 São: A,B , C,A , C,B , B,A , B,C C3,2 3! (3 2)!2! 3! 1!2! A,C , 3.2.1! 1!2.1! p é denominado de numero Binomial, ou binomial de n, p. A seguir discutiremos sua aplicação no Triângulo de Pascal. 3 São: A,B , A,C , C,B Aproximação de Stirling para n!. Exercícios Para n grande, n! torna-se impraticavel. Assim, usa-se a aproximação devida a Stirling. n! n 2 nn e 1. Determine : a) n! (n 1)! n Aqui e 2.71828… é a base dos logarítmos naturais ou neperianos. b) Exemplo 12 - De quantas maneiras diferentes podem ser dispostas uma fila de 5 pedaços de mámore de cores diferentes? c) d) 5! 5.4.3.2.1! 120 Exemplo 13 - De quantas maneiras diferentes 10 pessoas podem sentar em um banco se houver apenas 4 lugares ? n! (n 1)! (n 2)! 87! 86! 80! 87! 45! 44! 43! 2. Determine a probabilidade de obter filhos com tipo de sangue O quando o pai tem sangue AB e a mãe possui sangue B (IBi). 3. Determine a probabilidade de obter filhos com tipo de sangue A quando o pai tem sangue AB e a mãe possui sangue B (IBi). 4 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas 4. Determine a probabilidade de obter filhos com tipo de sangue B quando o pai tem sangue AB e a mãe possui sangue B (IBi). 5. Determine a probabilidade de obter filhos com tipo de sangue AB quando o pai tem sangue AB e a mãe possui sangue B (IBi). 6. Qual a probabilidade de se ganhar na loteria somente com jogos simples ? 7. Qual a probabilidade de se ganhar na loto? 8. Um dado honesto é lançado duas vezes. Determine a probabilidade de ocorrer um 4,5 ou 6 no primeiro lance e 1,2,3 ou 4 no segundo lance. 9. Uma bola é retirada de uma urna ao acaso. A urna contém 6 bolas vermelhas, 4 brancas e 5 azuis. Determine a probabilidade dela: a) Ser vermelha. b) Ser azul. c) Ser branca. d) Não ser vermelha. e) Ser vermelha ou branca. 10. Em uma urna há 5 bolas pretas e 4 azuis. Retira-se 2 bolas sem reposição. Determine a probabilidade das duas bolas serem pretas ou das duas bolas serem azuis. 11. Lança-se uma moeda honesta 5 vezes. Construa o espaço de todas as possibilidades. 5 5 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas Algumas binomiais: Triângulo de Pascal Desenvolvendo os termos: (p q) 0 1 (p q)1 1 p 1q (p q) 2 2 1p 2 pq 1q 6 2 ( p q)3 1p3 3p2 q 3pq2 1q3 Se dispormos os coeficientes na forma de um triângulo, obteremos propriedades n n n n 0 1 n n 1 n p n dos números 1 n n p 1 1 1 Blaise Pascal (1623 - 1662) 1 2 1 Blaise Pascal (extraído de http://www.mundodosfilosofos.com.br/pascal.htm) 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 Pode-se escrever também: 0 0 1 0 1 1 2 0 2 1 2 2 3 0 3 1 3 2 3 3 4 0 4 1 4 2 4 3 4 4 5 0 5 1 5 2 5 3 5 4 n 0 n 1 n 2 Nascido em Clermont-Ferrand, a 19 de junho de 1623, Blaise Pascal era filho de Étienne Pascal, presidente da Corte de Apelação, e de Antoinette Bégon. Segundo sua irmã e biógrafa, Gilberte Périer, Pascal revelou desde cedo um espírito extraordinário, não só pelas respostas que dava a certas questões, mas, sobretudo pelas questões que ele próprio levantava a respeito da natureza das coisas. Perdeu a mãe aos três anos de idade; era o único filho do sexo masculino. Assim, o pai apegouse muito a ele e encarregou-se de sua instrução, nunca o enviando a colégios. Mesmo quando, em 1631, a família Pascal mudou-se para Paris, a educação de Blaise permaneceu ao encargo do pai. A irmã Gilberte escreverá mais tarde: "A máxima dessa 5 5 n n n 2 n 1 n n Assim, pode-se afirmar que: p q N N N i 1 i pn iqi Denominado de Binômio de Newton. 6 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas educação consistia em manter a criança acima das tarefas que lhe eram impostas; por esse motivo só deixou que aprendesse latim aos doze anos, para que aprendesse com maior facilidade. Durante esse intervalo não o deixou ocioso, pois o ocupava com todas as coisas de que o julgava capaz. Mostrava-lhe de um modo geral o que eram as línguas; ensinou-lhe como haviam sido reduzidas as gramáticas sob certas regras, que tais regras tinham exceções assinaladas com cuidade, e que por esses meios todas as línguas haviam podido ser comunicadas de um país para outro. Essa idéia geral esclarecia-lhe o espírito e fazia-o compreender o motivo das regras da gramática, de sorte que quando veio a aprendê-las sabia o que fazia e dedicava-se aos aspectos que lhe exigiam maior dedicação". a) 16 a) a) a) c) 76! 74! 73! d) n n 1 5 d) n 2 2x y2 5 b) x2 2y 6 9. três moedas são lançadas. Se ocorrerem coroas e caras, determine a probabilidade de ocorrer exatamente uma cara. 10. Uma bolsa contém 4 bolas brancas e duas pretas. Outras contém 3 brancas e 5 pretas. Se for retirada 1 bola de cada bolsa, qual a probabilidade de : a) Ambas serem brancas. b) Ambas serem pretas. c) Serem uma branca e uma preta. 11. Uma bola é retirada ao acaso de uma urna que contém 6 bolas vermelhas, 4 brancas e 5 azuis. Determine a probabilidade dela : a) Ser vermelha. b) Ser branca. c) Ser azul. d) Não ser vermelha. e) Ser vermelha ou branca. c) 13!/11!d) 7!/10! b) 5 n c) 7. Numa classe há nove rapazes e 3 moças. a) De quantas maneiras o professor pode escolher uma comissão de 4 pessoas? b) Quantos poderão ter ao menos uma moça? c) Quantos poderão ter exatamente uma moça? 8. Um dado é lançado. Se o número é ímpar, qual a probabilidade de ele ser primo? Calcule: n! (n 1)! 3 12 b) 6. Expandir e simplificar : Exercícios: a) 7! b) 8! 2. Simplifique: n! b) (n 2)! c) 76! 74! d) 5!74! (n 1)! n! 73! 73! 4. Quantos anagramas podem ser formados com os caracteres: a) ESTA b)OVO c) H2O d) PALADAR e) SOCIOLÓGICAS 5. Calcule: Além das línguas, Étienne Pascal ensinava outras coisas ao filho: dava-lhe rudimentos sobre as leis da natureza e sobre as técnicas humanas. Tudo isso aguçava ainda mais a curiosidade do menino, que queria saber a razão de todas as coisas e não se satisfazia diante de explicações incompletas ou superficiais. Diante de uma explicação insuficiente, passava a pesquisar por conta própria até encontrar uma resposta satisfatória e, quando se defrontava com um problema, não o largava até resolvê-lo plenamente. Aos onze anos, suas experiências sobre os sons levaram-no a escrever um pequeno tratado, considerado muito bom para sua idade. Étienne Pascal era matemático e sua casa era muito freqüentada por geômetras. Como queria que Blaise estudasse línguas e, sabendo como a matemática é apaixonante e absorvente, evitou por muito tempo que o filho a conhecesse, prometendo-lhe que a ensinaria quando ele já soubesse grego e latim. Essa precaução serviu apenas para aumentar a curiosidade de Blaise, que passou a se divertir com as figuras geométricas que o pai lhe havia mostrado. Procurava tracá-las corretamente; depois passou a buscar as proporções entre elas e, afinal, depois de propor axiomas relativos às figuras, dedicou-se a fazer demonstrações exatas. Com isso chegou até a 32ª proposição do livro I de Euclides. Estarrecido, o pai verificou que o filho descobrira sozinho a matemática. A partir de então, Blaise recebeu os livros dos Elementos de Euclides e pôde dedicar-se à vontade ao estudo da geometria. Os avanços foram rápidos: aos dezesseis anos escreveu Tratado Sobre as Cônicas, que, no entanto, por sua própria vontade, não foi impresso na época. 1. 7 (n 2)! n! 12. Calcular: a)5! 5!74! 73! c) 3. Simplifique: 7 A9,3 b) d) C 8,3 C9,3 A9,3 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas 8 A distribuição Binomial ou de Bernoulli: p ( x ) CN , x p x q N p ( x) x N x pxqN N! pxqN ( N x)! x ! P*X) Se p é a probabilidade de um evento ocorrer em uma única tentativa (denominada probabilidade de sucesso) e q = 1 - p é a de que o evento não ocorra (denominada probabilidade de insucesso), então a probabilidade do evento ocorrer exatamente x vêzes, em N tentativas, isto é, que haja x sucessos e N - x insucessos é dada por: x x 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 N=2 1 2 3 i N = 2; (p+q)2 ; (2 caras, 1 cara e corôa, 2 corôas) A média para a distribuição binomial e o desvio padrão são dados abaixo: 0,35 0,30 P(X) Npq Desvio Padrão Npq Coeficiente de simetria N=3 0,40 Distribuição Binomial Média =Np Variância 2 0,25 0,20 0,15 0,10 q p Npq 0,05 0,00 1 Exemplo 1- Em 100 lances de uma moeda, a média do número de caras é =Np=100 e o desvio 100 12 12 Npq padrão é 2 3 i 4 N = 3; (p+q)3 ; (3 caras, 2 caras e1 corôa, 1 cara e 2 corôas,3 corôas) 5 A seguir mostramos os dados de distribuição de probabilidade de Bernoulli para N lançamentos de uma moeda honesta (p=1/2=q) 0,40 0,35 N=4 0,30 0,5 P(X) 0,25 N=1 0,4 0,20 P(X) 0,15 0,10 0,3 0,05 0,00 0,2 1 2 3 4 5 N = 4; (p+q)4 ; (4 caras, 3 caras e1 corôa, 2 caras e 2 corôas,1 cara e 3 corôas, 4 corôas) 0,1 0,0 1 2 i N = 1 ; (1p+1q) ; (1 cara ou 1 corôa) 8 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas Exemplo – Encontre a distribuição de Bernoulli para p = 0,5 e N = 10. Determine também sua média e seu desvio padrão. 0,30 N=5 0,25 Acessando “Intervalo de Confiança” → “Distribuição de Bernoulli”, inserindo N=10 e p = 0,5 nas correspondentes caixas e clicando nos botões para gerar os parâmetros Solicitados, teremos: 0,20 P(X) 9 0,15 0,10 0,05 0,00 1 2 3 4 5 6 i Figura 1 – Distribuição de Bernoulli gerada pelo DPA. N = 5; (p+q)5 ; (5 caras, 4 caras e1 corôa, 3 caras e 2 corôas,2 caras e 3 corôas, 1 cara e 4 corôas, 5 corôas) Veja que unindo as extremidades do histograma, à medida que o valor de N cresce indefinidamente (N tende a infinito, ou N ) o caso discreto tende a um caso contínuo. A distribuição Binomial é chamada de Bernoulli por ter sido descoberta por James Bernoulli em fins do século XVII. Jacob Bernoulli (1623-1708) - As primeiras contribuições importantes de Jacob Bernoulli foi sobre lógica e álgebra publicado em 1685, probabilidade e geometria em 1687. O resultado de seu trabalho em geometria gerou um método de construção para dividir todo triângulo em quatro porções iguais com duas linhas perpendiculares. O trabalho mais original de Jacob Bernoulli foi Ars Conjectandi publicado na Basileia em 1713, oito anos após sua morte. O trabalho estava na época de sua morte, mesmo assim é considerado o mais importante na teoria da probabilidade. No livro, Bernoulli reviu o trabalho de outros autores em probabilidade, Schooten , Leibniz , e Prestet. Os números de Bernoulli aparecem no livro em uma discussão da série exponencial. Muitos exemplos são dados em quanto se esperaria ganhar jogar o jogo de possibilidade. Em 1689 publicou um trabalho importante sobre série infinita e sobre teoria de probabilidade: a interpretação da probabilidade como a freqüência relativa, numa experiência que ocorre grande número de repetições. Sua lei é uma interpretação matemática deste resultado. Jacob Bernoulli publicou trabalhos em séries infinitas entre 1682 e 1704. Em maio 1690 publicou no acta Eruditorum. O papel de Jacob Bernoulli foi importante para a historia do cálculo, e em 1696 resolveu uma equação na Mecânica dos Fluidos, hoje chamada "a equação de Bernoulli". 9 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas 10 A distribuição de Poisson Distribuição de Poisson Média =Np 2 Variância N(1 Outra distribuição discreta importante, que é uma aproximação da distribuição binomial quando N >> 1 e p << 1 é a distribuição de Poisson. Desvio Padrão Coeficiente de simetria Siméon Denis Poisson - (1781 em Pithiviers, France - 25 April 1840 em Sceaux France) – Teve como professores Laplace e Lagrange que o propiciaram seus talentos matemáticos. Aos 18, atraiu a atenção Legendre. Poisson encontrou essa geometria descritiva, um tópico importante no École Polytechnique. Escreveu um trabalho de teoria de Bézout, e este era de tal qualidade que foi permitido se graduar em 1800 sem fazer exame de admissão, fato incomum pois a maioria dos matemáticos superiores tiveram que servir nas províncias antes de retornar a Paris. Poisson foi nomeado professor École Polytechnique em 1802, uma posição que prendeu até 1806. Poisson teve pouco tempo para a política para suas energias inteiras foi dirigido arduamente para suportar a matemática, a ciência, a instrução e o École Polytechnique. Durante este período Poisson estudou os problemas que relacionam-se às equações diferenciais ordinárias e equações diferenciais parciais; estudou aplicações a um número de problemas físicos tais como o pêndulo em um meio resistivo e na teoria do som. Seus estudos eram puramente teóricos. Em 1811 publicou seu Traité de mécanique, de dois volumes que era um tratamento excepcionalmente desobstruído baseou em suas notas do curso no École Polytechnique. p) N (1 p) ' Np Exemplo – Encontre a distribuição de Poisson para p = 0,4 e N = 25. Determine também sua média e seu desvio padrão. Acessando “Intervalo de Confiança” →”Distribuição de Poisson”, e completando o valor de N e de p nas caixas correspondentes, teremos após clicar no botão “distribuição”: Figura 2 – Distribuição de Poisson gerada pelo DPA. É dada por: x P ( x) x! e Note que a medida que N → e p = 0,5, a distribuição de Bernoulli aproximará da distribuição Gaussiana. 10 Prof. Dr. Cláudio S. Bioestatística Sartori – Distribuições Estatísticas 11 A distribuição Normal ou de Gauss: (&&) Carl Friedrich Gauss (1777-1855), Brunswick, Germany From the outside, Gauss' life was very simple. Before his 25th birthday, he was already famous for his work in mathematics and astronomy. When he became 30 he went to Göttingen to become director of the observatory. He rarely left the city except on scientific business. From there, he worked for 47 years until his death at almost 78. In contrast to his external simplicity, Gauss' personal life was tragic and complicated. Due to the French Revolution, Napoleonic period and the democratic revolutions in Germany, he suffered from political turmoil and financial insecurity. Gauss kept an amazingly rich scientific activity. An early passion for numbers and calculations extended first to the theory of numbers, to algebra, analysis, geometry, probability, and the theory of errors. At the same time, he carried on intensive empirical and theoretical research in many branches of science, including observational astronomy, celestial mechanics, surveying, geodesy, capillarity, geomagnetism,electromagnetism, mechanism optics, actuarial science. His publications, abundant correspondence, notes, and manuscripts show him to have been one of the greatest scientific virtuosos of all time. It is said, that without any help, Gauss was able to calculate before he could even talk. He taught himself to read, and must have continued his arithmetical experimentation intensively, because in his first arithmetic class at the age of eight, he astonished his teacher by instantly solving a busywork problem: to find the sum of the first hundred integers. (n(n+1)/2) Veja que a medida que N tende a infinito, o caso discreto da distribuição de Bernoulli ou Binomial, tende a se aproximar indefinidamente de uma curva contínua, denominada curva de Gauss. Essa curva é representada por uma função que tem como base o número e, denominado número de Napier. A tabela a seguir mostra a origem desse número, descoberto por John Napier (&). Ilustração de lim 1 x 1 x x e 1 x 1 10 100 1000 10000 100000 1000000 10000000 100000000 1E+09 1E+10 1E+11 1 x x 2,0000000000000000 2,5937424601000000 2,7048138294215300 2,7169239322355200 2,7181459268243600 2,7182682371975300 2,7182804691564300 2,7182816939803700 2,7182817863958000 2,7182820308145100 2,7182820532347900 2,7182820533571100 (&) John Napier - (Edinburgh:Scottish ( 15501617)) -Although the interpretation of Revelation was Napier's major intellectual endeavor, he was interested in mathematics from an early age. An early MS, published only in 1835, De arte logistica, would have contributed seriously to algebra had it been published at the time. Mirifici logarithmorum canonis descriptio, 1614, and Mirifici logarithmorum canonis constructio,1619, set forth the concept of logarithms and published the first table of them. In explaining logs, he also systematized spherical trigonometry. Napier made systematic use of decimal notation and was an important agent in its acceptance. Napier was apparently reputed to be a magician in his own age. Podemos trabalhar com a variável denominada de variável reduzida z: z Nesse caso, a distribuição Normal ou Gaussiana fica: Y Y 1 2 e 1 2 e z2 2 Esta ºe uma expressão mais simplificada, cujo gráfico está dado a seguir: Foi Gauss (&&) quem deduziu a expressão para a chamada distribuição Gaussiana ou Normal: x x 2 2 2 11 Prof. Dr. Cláudio S. – Bioestatística Sartori Distribuições Estatísticas 12 Veja que há uma área sob a curva de 1. Quando o x se encontra no intervalo de ( - , + ), a área sob a curva é de 68,7%; já quando x se encontra no intervalo ( - 2 , + 2 ) a área já é de 95% ou 0.95. A distribuição de Bernoulli b(N,X,p) se aproxima da distribuição normal ou gaussiana quando é grande e nem p e nem q se aproximam de 0. Z é chamado de normalmente distribuído, com média 0 e variância 1. A seguir veja a variação da forma da curva com o desvio padrão : =1 =2 =3 0,4 0,3 Desvio Padrão Coeficiente de simetria Y Distribuição Normal ou Gaussiana Média Variância 2 0,1 0 Observe que a curva Gaussiana ou Normal é uma curva simétrica em relação ao eixo Oy, tendo 50% de área à esquerda e a direita do eixo Oy. Veja como se aproxima da distribuição Normal um resultado para N=8 para um exemplo de lançamento de moeda ) p = 0.5 = q: 0,0 -8 0,30 0,25 P(X) 0,20 0,15 0,10 0,05 0,00 2 4 6 8 X 0,4 Y 0,3 68,7% 0,2 0,1 95,45% 0,0 -4 -2 0 2 -6 -4 -2 0 Z N = 8; p = 1/2 q = 1/2 = 4 = 1,41 0 0,2 4 Z 12 2 4 6 8 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas 1 A área sob a curva Normal padrão está dada na tabela a seguir. (Área de 0 a z). z 0 1 2 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,33151 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 1 0,5000 0,5000 0,5000 0,5000 0,5000 Prof. Dr. Cláudio S. Sartori Bioestatística – Distribuições Estatísticas Exercícios – Distribuição de Bernoulli e Distribuição Gaussiana 1. a) b) c) d) e) f) g) Calcular: 5! C6,2 C8,3 C7,5 C7,5 C4,4 C4,0 2. Determinar a probabilidade de, ao lançar três vezes uma moeda honesta, aparecerem: a) b) c) d) Três caras 2 caras e uma coroa 2 coroas e uma cara 3 coroas 3. Determinar a probabilidade de, em 5 lances de um dado honesto, aparecer um 3: a) b) c) d) e) f) nenhuma vez uma vez duas vezes três vezes quatro vezes cinco vezes 4. Escrever os desenvolvimentos dos binômios: a) (p+q)6 b) (p+q)9 5. Determinar a probabilidade de uma família de 4 crianças haver: a) pelo menos um menino b) pelo menos um menino e uma menina. 1 1