Estatística I Aula 5 Prof.: Patricia Maria Bortolon, D. Sc. PROBABILIDADE Os Postulados de Probabilidade 1. As probabilidades são números reais positivos maiores que zero e menores que 1; simbolicamente, 0 ≤ P(A) ≤ 1 para qualquer evento A. 2. Qualquer espaço amostral tem probabilidade 1, P(Ω) = 1 para qualquer espaço amostral Ω. 3. Se dois eventos são mutuamente excludentes, a probabilidade de ocorrência de um ou do outro é igual à soma de suas probabilidades. Simbolicamente, P(A U B) = P(A) + P(B) para dois eventos A e B quaisquer mutuamente excludentes. Propriedade básicas da Probabilidade 1. P (O) = 0 , a probabilidade de ocorrência do conjunto vazio é nula. O conjunto vazio é também chamado evento impossível. 2. ΣP(Ei) = 1 , a soma das probabilidades de todos os eventos possíveis é sempre igual a 1. 3. P(Ei) + P(Ei) = 1 , a soma da probabilidade de um evento com a probabilidade de seu evento complementar é sempre igual a 1. Exemplo • Se A e B são os eventos de o Dr. Paulo estar em seu consultório às 9 horas da manhã ou de estar no hospital, se P(A) = 0,48 e P(B)=0,27, encontre: – – – – (a) P (A) (b) P (A U B) (c) P (A ∩ B) Solução: • P(A) representa a probabilidade de Dr. Paulo não estar no hospital às 9h, pela terceira propriedade básica, P(A) = 1 – 0,48 = 0,52 • P(AUB) = 0,48 + 0,27 = 0,75, pelo terceiro postulado, pois os eventos são mutuamente excludentes. Ou seja, a probabilidade de Dr. Paulo estar ou no hospital ou no consultório é de 75%. • P(A ∩ B) = 0, pois como os eventos são excludentes a intersecção dos mesmos é o conjunto vazio, que tem probabilidade igual a 0. Regras de Adição • Generalização do Postulado 3 – k eventos são mutuamente excludentes quando não há dois quaisquer deles que tenham algum elemento em comum. Nesse caso o terceiro postulado pode ser aplicado repetidamente até que: Se k eventos são mutuamente excludentes, a probabilidade de ocorrência de qualquer um deles é igual à soma de suas probabilidades individuais, simbolicamente, P(A1 U A2 U...U Ak) = P(A1) + P(A2) + ... + P(Ak) para quaisquer eventos mutuamente excludentes A1, A2, ... e Ak. Exemplo • As probabilidades de uma pessoa que deseja adquirir um carro novo escolher um Chevrolet, um Ford ou um Honda são 0,17, 0,22 e 0,08, respectivamente. Supondo que ela compre apenas um carro, qual é a probabilidade de ser de uma dessas três marcas? – Solução: como as três possibilidades são mutuamente excludentes, uma substituição direta dá 0,17 + 0,22 + 0,08 = 0,47. Regra Geral de Adição • Até aqui trabalhamos com eventos mutuamente excludentes, mas como somar probabilidades de eventos que não sejam excludentes? P(A U B) = P(A) + P(B) – P(A∩B) Para entendermos o porquê vamos a um exemplo utilizando o diagrama de Venn... Regra Geral de Adição • No diagrama abaixo o conjunto I representa a probabilidade de um recém-formado receber uma proposta de uma indústria e o conjunto B a probabilidade do mesmo receber uma proposta de um banco. Observe que há uma probabilidade de que ele receba proposta dos dois, representada pela área de intersecção entre I e B. B I 0,18 Ω 0,12 0,24 Regra Geral de Adição • Pelo diagrama podemos ver que: – – – – P(I) = 0,18 + 0,12 = 0,30 P(B) = 0,12 + 0,24 = 0,36 P(I U B) = 0,12 + 0,18 + 0,24 = 0,54 Mas se tivéssemos aplicado a regra de adição para eventos excludentes calcularíamos P(I) + P(B) = 0,30 + 0,36 = 0,66 o que estaria errado. B I 0,18 Ω 0,12 0,24 Regra Geral de Adição • Cont.: – Esse erro resulta de somar duas vezes P(I ∩ B) = 0,12. A correção se faz subtraindo 0,12 de 0,66. Assim, poderíamos escrever, de acordo com a regra geral de adição: P(I U B) = P(I) + P(B) – P(I∩B) = 0,30 + 0,36 – 0,12 = 0,54 B I 0,18 Ω 0,12 0,24 Exemplo • As probabilidades de que choverá no Recife num certo dia de agosto, de que haverá trovoadas nesse dia, e de que choverá e haverá trovoadas nesse dia são de 0,27, 0,24 e 0,15, respectivamente. Qual é a probabilidade de chover e/ou haver trovoadas nesse dia no Recife? – Solução: Se R denota chuvas e T denota trovoadas, temos P(R) = 0,27, P(T) = 0,24 e P(R ∩ T) = 0,15. Substituindo estes valores na expressão da regra geral de adição obtemos P(R U T) = P(R) + P(T) - P(R ∩ T) = 0,27 + 0,24 – 0,15 = 0,36 Probabilidade Condicional • Se quisermos saber a probabilidade de um evento, sem especificar o espaço amostral, o que fazer? • É bem possível que encontremos respostas diferentes, todas corretas. • Exemplo: qual a probabilidade de um contador ganhar mais de $200.000/ano dentro dos 10 anos seguintes à formatura? – Podemos obter uma resposta que se aplique aos contadores que trabalham em empresas, outra diferente para contadores que trabalham para o governo, e ainda outra para os contadores com escritórios próprios. – Ou seja, a resposta depende da escolha do espaço amostral. – Como a definição do espaço amostral não é óbvia, em geral costumamos dizer “a probabilidade de A dado Ω” – Expressamos a probabilidade condicional com P(A | Ω) Probabilidade Condicional • Suponha que uma pesquisa tenha estudado os serviços prestados dentro da garantia por 200 lojas de pneus em uma grande cidade. Os resultados foram: Bom serviço dentro da garantia (G) Serviço deficiente dentro da garantia Total Lojas especializadas numa marca (N) 64 16 80 Lojas não especializadas 42 78 120 Total 106 94 200 • Selecionando uma loja aleatoriamente quais as probabilidades de: – Escolher uma loja especializada numa marca (evento N) – Escolher uma loja que preste bom serviço dentro da garantia (evento G) – Escolher uma loja especializada numa marca e que preste bom serviço dentro da garantia (evento N ∩ G) Probabilidade Condicional Bom serviço dentro da garantia (G) Serviço deficiente dentro da garantia Total Lojas especializadas numa marca (N) 64 16 80 Lojas não especializadas 42 78 120 Total 106 94 200 – Escolher uma loja especializada numa marca (evento N) 80 Até aqui usamos P( N ) = = 0,40 a definição de 200 probabilidade – Escolher uma loja que preste bom serviço dentro da garantia (evento G) 106 s/n P(G ) = 200 = 0,53 !!!! – Escolher uma loja especializada numa marca e que preste bom serviço dentro da garantia (evento N ∩ G) P( N ∩ G ) = 64 = 0,32 200 Probabilidade Condicional Bom serviço dentro da garantia (G) Serviço deficiente dentro da garantia Total Lojas especializadas numa marca (N) 64 16 80 Lojas não especializadas 42 78 120 Total 106 94 200 – O que acontece se limitarmos a escolha a lojas especializadas numa marca? Isso reduz o espaço amostral à primeira linha da tabela, e daí a probabilidade de prestar bons serviços dentro da garantia é 64 P(G | N ) = = 0,80 Bem melhor que 0,53!! – Mas note que: 80 64 P( N ∩ G ) P (G | N ) = 200 = 80 P( N ) 200 Probabilidade Condicional • Definição: Se P(B) é diferente de zero, então a probabilidade de A em relação a B, isto é, a probabilidade de A dado B, é P( A ∩ B) P( A | B) = P( B) Exemplo • Com referência às lojas de pneus, qual a probabilidade de uma loja que não é especializada numa marca prestar bons serviços sob garantia? Ou seja, qual a probabilidade P(G|N)? 42 120 = 0,21 e P( N ) = = 0,60 200 200 P(G ∩ N ) 0,21 P(G | N ) = = = 0,35 P( N ) 0,60 P(G ∩ N ) = • Mas também poderíamos ter obtido o mesmo resultado diretamente na segunda linha da tabela, escrevendo: 42 P (G | N ) = = 0,35 120 Exemplo • Numa certa escola de primeiro grau, a probabilidade de um aluno selecionado aleatoriamente provir de um lar com somente o pai ou a mãe presente é 0,36 e a probabilidade de ele provir de um lar com somente o pai ou a mãe presente e ser um estudante fraco (que geralmente é reprovado) é 0,27. Qual é a probabilidade de um aluno selecionado aleatoriamente ser um estudante fraco, dado que ele provém de um lar com somente o pai ou a mãe presente? – Definindo F como um estudante fraco e O um estudante que provém de um lar com somente o pai ou a mãe, temos que P(O)=0,36 e P(F∩O)=0,27 – Assim a probabilidade de ser um estudante fraco dado que provém de um lar com somente pai ou mãe é denotado por P( F | O) = P ( F ∩ O) 0,27 = = 0,75 P(O) 0,36 Regras de Multiplicação • Se na expressão da probabilidade condicional multiplicarmos ambos os lados por P(B), obteremos a fórmula que permite calcular a probabilidade de ocorrência simultânea de dois eventos. P(A ∩ B) = P(B) . P(A | B) • A regra geral da multiplicação afirma que a probabilidade de ocorrência de dois eventos é o produto da probabilidade de ocorrência de um deles pela probabilidade condicional da ocorrência do outro, dado que o primeiro ocorreu, está ocorrendo, ou ocorrerá. Como não interessa qual dos dois eventos designamos por A e qual por B, também podemos escrever: P(A ∩ B) = P(A) . P(B | A) Exemplo • Um júri consiste em 15 pessoas que somente completaram o Ensino Médio e em 9 pessoas que tiveram alguma educação superior. Se um advogado seleciona ao acaso dois dos membros do júri para uma arguição, qual é a probabilidade de nenhum dos dois ter tido alguma educação superior? – Solução: Se A é o evento de a primeira pessoa selecionada não ter tido alguma educação superior, então P(A)=15/24. Também, se B é o evento de a segunda pessoa selecionada não ter tido educação superior, segue que P(B|A)=14/23, já que há somente 14 pessoas sem alguma educação superior dentre as 23 que restam depois de ter sido selecionada uma pessoa sem alguma educação superior. Portanto, a regra geral de multiplicação fornece 15 14 105 P( A ∩ B) = P( A) ⋅ P( B | A) = ⋅ = = 0,38 24 23 276 Regra Especial de Multiplicação Eventos Independentes • Dois eventos são independentes quando a probabilidade de ocorrência de um não afeta a probabilidade de ocorrência de outro. • Na linguagem de probabilidade podemos escrever: – P (A | B) = P (A), ou seja, o fato de B ter ocorrido não altera a probabilidade de A ocorrer – P (B | A) = P (B), ou seja, o fato de A ter ocorrido não altera a probabilidade de B ocorrer • A regra de multiplicação anteriormente definida fica: P(A ∩ B) = P(B) . P(A | B) = P(B) . P(A) P(A ∩ B) = P(A) . P(B | A) = P(A) . P(B) Exemplo • Foram pesquisados 300 domicílios que compraram aparelhos de TV, foi perguntado se estavam satisfeitos com a compra. A tabela abaixo, classifica de forma cruzada, a satisfação e se o aparelho tem tela de plasma ou não. Verifique se estar satisfeito com a compra e o tipo de aparelho de TV comprado são estatisticamente independentes. Tipo de Aparelho De tela de plasma Sem tela de plasma Total Satisfeito com a compra? Sim Não Total 64 16 80 176 44 220 240 60 300 P (Satisfeito | Tela de plasma) = 64/300 = 0,80 80/300 que é igual a P (Satisfeito) = • 240 = 0,80 300 Logo, estar satisfeito com a compra e o tipo de aparelho comprado são eventos estatisticamente independentes. O conhecimento de um dos eventos não afeta a probabilidade do outro evento. Exemplo • Se for de 0,70 a probabilidade de uma pessoa entrevistada em um shopping ser contra o aumento de impostos para o financiamento da saúde, qual é a probabilidade de entrevistar quatro pessoas no shopping e as três primeiras serem contra o aumento de impostos, mas a quarta não ser contra? – Solução: Admitindo que o fato de uma pessoa ser contra independe do fato da outra ser ou não contra, ou seja, admitindo a independência dos eventos, multiplicamos todas as probabilidades e obtemos: – (0,70) (0,70) (0,70) (0,30) = 0,1029 Teorema de Bayes • É utilizado para rever probabilidades anteriormente calculadas com base em novas informações. • Desenvolvido por Thomas Bayes no século 18, o teorema de Bayes é uma extensão do que aprendemos anteriormente sobre probabilidade condicional. P(A ∩ B) = P(B) . P(A | B) P(A ∩ B) = P(A) . P(B | A) P(A) . P(B | A) = P(B) . P(A | B) P(B | A) = P(B) . P(A | B) P(A) Exemplo • Em um estado onde os carros são submetidos a testes quanto à emissão de gases: – P(A) = ? = prob. do automóvel ser reprovado no teste – P(B) = 0,25 = prob. de emitir gases em excesso – P(A | B) = 0,99 = prob. de ser reprovado dado que emite gases em excesso – P(A | B’) = 0,17 = prob. de ser reprovado dado que não emite gases em excesso – P(B | A) = ? = qual a prob. de dado que foi reprovado ele emitir gases em excesso? P(B | A) = P(B) . P(A | B) P(A) Mas não sabemos qual é a P(A)!! Exemplo A ocorre de duas formas, quando B ocorre ou quando B’ ocorre. B P(A | B) = 0,99 A P(B) . P(A | B) = (0,25)(0,99) = 0,2475 Como as duas formas como A pode ocorrer são mutuamente excludentes a probabilidade de A é a soma das duas probabilidades calculadas P(A) = 0,2475 + 0,1275 = 0,3750 B’ P(A | B’) = 0,17 A P(B’) . P(A | B’) = (0,75)(0,17) = 0,1275 E a probabilidade que procurávamos é: P( B | A) = P( B) ⋅ P( A | B) (0,25)(0,99) = = 0,66 P( A) (0,3750) Generalizando... • ... para o caso em que há mais de duas “causas” possíveis para o evento A, ou seja, mais de dois ramos conduzindo ao evento A. • Podemos dizer que P(Bi | A) é a probabilidade de o evento A ter sido alcançado através do i-ésimo ramo da árvore (com i = 1, 2, ..., k) e pode ser mostrado que essa probabilidade é igual à razão da probabilidade associada ao i-ésimo ramo pela soma das probabilidades associadas com todos os k ramos que alcançam A. • Formalmente escrevemos o Teorema de Bayes Teorema de Bayes Se B1 , B2 ,L , Bk são eventos mutuamente excludentes dos quais um deve ocorrer, então P( Bi A) = P( Bi ) ⋅ P ( A Bi ) P( B1 ) ⋅ P( A B1 ) + P( B2 ) ⋅ P( A B2 ) + L + P( Bk ) ⋅ P( A Bk ) para i = 1, 2,L , k . Veja que o denominador nada mais é que P(A), quando A é alcançado através de vários passos intermediários Diagrama de árvore para o Teorema de Bayes B1 P(A | B1) B2 P(A | B2) etc. Bk P(A | Bk) A P(B1) . P(A | B1) P(B2) . P(A | B2) etc. A P(Bk) . P(A | Bk) Exemplo • Numa fábrica de enlatados, as linhas de produção I, II e III respondem por 50, 30 e 20% da produção total. Se 0,4% das latas da linha I são lacradas inadequadamente e as percentagens correspondentes às linhas II e III são de 0,6% e 1,2%, respectivamente, qual é a probabilidade de uma lata lacrada impropriamente (e descoberta na inspeção final de produtos prontos) provir da linha de produção I? – Vamos nomear os eventos A = lata ser lacrada impropriamente; B1, B2 e B3 uma lata provir das linhas I, II e III. – As probabilidades fornecidas • P(B1) = 0,50; P(B2) = 0,30 e P(B3) = 0,20 • P(A | B1) = 0,004; P(A |B2) = 0,006 e P(A | B3) = 0,012 – A probabilidade procurada • P(B1 | A) = ? Exemplo Linha I 0,004 Linha II 0,006 Linha III 0,012 A (0,50)(0,004) = 0,0020 A (0,30)(0,006) = 0,0018 A (0,20)(0,012) = 0,0024 P(A) = 0,0020 + 0,0018 + 0,0024 = 0,0062 P( B1 | A) = P( B1 ) ⋅ P ( A | B1 ) P ( B1 ) ⋅ P( A | B1 ) + P ( B2 ) ⋅ P( A | B2 ) + P ( B3 ) ⋅ P ( A | B3 ) P( B1 | A) = 0,0020 = 0,32 0,0062