Universidade Federal de Alagoas Centro de Tecnologia Estatística Aula 15 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado pelos Prof. Wayne Santos de Assis e Christiano Cantarelli Rodrigues Aula 15 Distribuição Binomial Distribuição Binomial Introdução Até o momento vimos: O que é um experimento aleatório e a função variável aleatória f(x) função de probabilidade para v.a. discretas e função de densidade de probabilidade para v.a. contínuas Vimos o que é esperança matemática e variância para distribuições discretas Variáveis aleatórias podem ser discretas ou contínuas A partir delas podemos construir a distribuição de probabilidade e a função f(x) = P(X=x) A partir de agora vamos estudar distribuições de probabilidade consagradas Distribuição Binomial Introdução Imagine uma prova com 4 questões. Em cada questão há 5 alternativas (a, b, c, d e d). Qual a probabilidade de alguém acertar no chute 3 questões? Solução: Temos 4 tentativas, independentes uma da outra A probabilidade de acertar uma questão (probabilidade de sucesso) é 1 p 0,20 5 A probabilidade de não acertar uma questão qualquer (probabilidade de falha) é q = 1 – p = 0,80 Estas probabilidades permanecem constantes a cada questão (tentativa ou prova) Distribuição Binomial Introdução Imagine uma prova com 4 questões. Em cada questão há 5 alternativas (a, b, c, d e d). Qual a probabilidade de alguém acertar no chute 3 questões? Solução: Chamando de x o número de sucessos (acertos de questões): P (X = 3) = 0,20.0,20.0,20.0,80 = 0,23.0,8 = 0,0064 ou 0,64% Esta resposta está errada! Não existe somente uma maneira de alguém acertar 3 questões! Distribuição Binomial Introdução Imagine uma prova com 4 questões. Em cada questão há 5 alternativas (a, b, c, d e d). Qual a probabilidade de alguém acertar no chute 3 questões? Solução: Q1 Q2 Q3 Q4 C E E E P1 (X = 3) = 0,0064 E C E E P2 (X = 3) = 0,0064 E E C E P3 (X = 3) = 0,0064 E E E C P4 (X = 3) = 0,0064 Existem 4 maneiras! P (X = 3) = 4 . 0,0064 = 0,0256 Distribuição Binomial Introdução Imagine uma prova com 4 questões. Em cada questão há 5 alternativas (a, b, c, d e d). Qual a probabilidade de alguém acertar no chute 3 questões? Solução: O número total de permutações (arranjos) é 4 n n! x x!(n x)! Para nosso caso número total de arranjos de n itens quando x deles são idênticos entre si 4! P(X 3) 0,203 0,80 0,0256 3!(4 3)! Distribuição Binomial Introdução Imagine uma prova com 4 questões. Em cada questão há 5 alternativas (a, b, c, d e d). Qual a probabilidade de alguém acertar no chute 3 questões? Solução: Caso típico de experimento aleatório binomial A fórmula da distribuição de probabilidade binomial é uma combinação da regra da multiplicação da probabilidade (eventos independentes) com a regra da contagem de arranjos de n itens quando x deles são idênticos entre si Distribuição Binomial É a mais famosa distribuição de probabilidade de v.a. Discreta responde à pergunta: qual a probabilidade de haver x sucessos em n tentativas em um experimento aleatório? com: (a) número fixo de provas ou tentativas n; (b) provas que são independentes; (c) Cada prova deve ter todos os resultados classificados em 2 categorias (cara ou coroa, candidato A ou candidato B, marca A ou marca B, chuva ou não, ........) (d) as probabilidades de sucesso (p) ou falha (q = 1 - p) devem permanecer constantes para cada prova. Distribuição Binomial Exemplo: Se 10% dos alunos são canhotos, qual a probabilidade de se obter exatamente 3 estudantes canhotos em uma turma de 15 estudantes? n! n x PX x px 1 p x!n x ! n x n x PX x p q x No de tentativas fixo = 15 Resultados classificados em 2 categorias = canhoto ou destro p = 0,10 e q = 0,90 15! 15-3 3 PX 3 0,1 1 0,1 0,129 12,9% 3!15 3! Distribuição Binomial Outros exemplos Jogue uma moeda 10 vezes. Seja X = no de caras obtidas Um tear produz 1% de peças defeituosas. Seja X = no de peças defeituosas nas próximas 25 peças produzidas Cada amostra de ar tem 10% de chance de conter uma molécula rara particular. Seja X = no de amostras de ar que contêm a molécula rara nas próximas 18 amostras analisadas De todos os bits transmitidos através de um canal digital de transmissão, 10% são recebidos com erros. Seja X = no de bits com erro nos próximos 5 bits transmitidos Nos próximos 20 nascimentos em um hospital, seja X = no de nascimentos de meninas Sabe-se que há a probabilidade de vazões médias diárias máximas anuais serem maiores que 1.000 m3/s é de 1%. Seja X = no de vezes em que este valor é superado nos próximos 10 anos Distribuição Binomial Em um experimento binomial, a variável aleatória X, que é igual ao número de tentativas que resultam em um sucesso, tem uma distribuição binomial com parâmetros p e n = 1, 2, 3, … A função de probabilidade de X é: n x f ( x) P( X x) p (1 p)n x x p = probabilidade de sucesso em cada tentativa n = número de tentativas f(x) = probabilidade de x sucessos em n tentativas Distribuição Binomial n x n x f ( x) p (1 p) x onde xn representa o número de combinações de n objetos tomados x de cada vez, calculado como: n n! x x!(n x)! Distribuição Binomial Exemplo Suponha que 30% dos clientes de uma empresa de aviação civil têm por destino o exterior. Se sortearmos 10 clientes ao acaso, qual é a probabilidade estimada de que exatamente 4 indivíduos estejam viajando para o exterior? p(exterior ) 0,30 e n 10 n x f ( x) p (1 p) n x x 10! f (4) (0,30) 4 (0,70) 6 4!10 4 ! 0, 2001 Portanto, a chance de que exatamente 4 indivíduos estejam viajando ao exterior é de aproximadamente 20%. Distribuição Binomial Exemplo Um produto eletrônico possui 42 circuitos integrados. A probabilidade de que qualquer circuito integrado seja defeituoso é de 0,02. Os circuitos integrados são independentes. O produto opera somente se não houver circuitos integrados defeituosos. Qual é a probabilidade de que o produto opere? Se X designar os circuitos defeituosos, é necessário que X = x =0 para que o produto opere. Daí, p = 0,02, com n = 42. n x f ( x) p (1 p)n x x 42 f (0) .0,020.0,9842 0 f (0) 1.1.0,98 0,428 42 Distribuição Binomial Exemplo Se historicamente a ocorrência de produtos defeituosos de um processo é p = 0,10, qual é a probabilidade de encontrar um produto defeituoso em uma amostra de tamanho n = 15? f( 1 ) 151 . 0 ,101. (1 0 ,10)151 15.0 ,10.0 , 23 0 ,34 15 15! 15 1 1!(15 1)! Distribuição Binomial Exemplo Considerando uma amostra constituída por 10 pessoas observadas ao acaso, qual a probabilidade de a maioria das pessoas ser favorável ao governo? Distribuição Binomial Exemplo Temos um experimento binomial, para o qual n =10 e p = 0,7, admitindo-se que X é a v.a. associada ao número de pessoas favoráveis ao governo n x f ( x) p (1 p)n x x 10 x f ( x) 0,7 (0,3)10 x x P(X > 5) = f(6) + f(7) + f(8) + f(9) + f(10) f(x) P(X > 5) = 0,8497 Distribuição Binomial Esperança E ( X ) n. p Variância Var ( X ) n p (1 p) n. p.q 2 Desvio padrão n. p.q Parâmetros da Distribuição Binomial: n, p. Distribuição Binomial Demonstração E ( X ) n. p n. p.q 2 Consideremos a v.a. de Bernoulli X, definida como 1 no caso de sucesso na k-ésima prova Xk 0 no caso de falha na k-ésima prova k 1, 2,..., n Então, E ( X k ) xk f ( xk ) 0.(1 p) 1. p 0.q 1. p p x 2 E ( X k p) 2 ( xk p) 2 f ( xk ) (0 p ) 2 q (1 p) 2 p p 2 q q 2 p k xk 2 pq ( p q ) pq (1) pq Distribuição Binomial Demonstração Considerando os valores x1, x2, …, xn , referentes às n provas independentes: E( X ) E( X1 ) E( X 2 ) ... E( X n ) n. p Como as provas são independentes, a variância de X é a soma das variâncias individuais. Logo: x x x ... x n. p.q 2 2 1 n. p.q 2 e n. p.q 2 2 2 n Distribuição Binomial Simulações – Distribuição binomial Distribuição Binomial Simulações – Distribuição binomial Distribuição Binomial Simulações – Distribuição binomial Distribuição Binomial Vê-se que: Para p = 0,5, a forma da distribuição é simétrica Para p ≠ 0,5, a distribuição é assimétrica n=30, p=0,50 0,16 0,14 n=30, p=0,50 0,12 P(x) 0,1 0,08 0,06 0,04 0,02 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 n=30, 0=0,25 0,18 0,18 0,16 0,16 0,14 16 17 18 19 20 21 22 23 24 25 26 27 P(x) 0,1 30 0,1 0,08 0,06 0,06 0,04 0,04 0,02 0,02 0 29 n=30, p=0,75 0,12 0,08 28 n=30, p=0,75 0,14 n=30, p=0,25 0,12 P(x) 15 x 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 x 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 x 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Distribuição Binomial Exemplo Fez-se a contagem de E. Coli em 10 amostras de água. As contagens positivas, expressas em centenas de organismos por 100 ml de água (102/100ml), são 17, 21, 25, 23, 17, 26, 24, 19, 21 e 17, com média e a variância amostrais iguais a 21 e 10,6 respectivamente. Suponha que N represente o número total dos diferentes organismos presentes em cada amostra (número de ‘tentativas’) e que p represente a fração correspondente ao organismo E. Coli (probabilidade de ‘sucesso’). Se X denota o número de E. Coli (102/100ml) em cada amostra, estimar P(X = 20). (adap. de Kottegoda e Rosso, 1997). Solução: No caso presente, não conhecemos os verdadeiros valores numéricos da média e da variância populacionais. Entretanto, podemos estimá-los pelos valores amostrais de média e desvio padrão n p q q 2 21 43 n 0,495 p 2 s2 10,6 q 0,505 p 0,495 X 21 43 P(X 20) 0,49520 0,50523 0,1123 20 Universidade Federal de Alagoas Centro de Tecnologia Estatística Aula 15 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado pelos Prof. Wayne Santos de Assis e Christiano Cantarelli Rodrigues