Universidade Federal de Alagoas Centro de Tecnologia Estatística Aula 12 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado pelos Prof. Wayne Santos de Assis e Christiano Cantarelli Rodrigues Aula 12 Independência de Eventos (continuação) Teorema de Bayes Aplicações Independência de Eventos Se A e B são eventos independentes, a ocorrência de B não traz qualquer informação adicional sobre A Informalmente falando, um evento não tem “nada a ver” com o outro! Independência de Eventos Dois eventos A e B são estatisticamente independentes quando: P(A B) P(A) P(B) Do contrário, A e B são eventos dependentes Se P(A) e P(B) são ambos maiores que zero: P(A|B) = P(A) e P(B|A) = P(B) Independência de Eventos E se A e B são mutuamente exclusivos ... São também independentes? Suponha P(B) > 0 Mas A B Suponha P(A) > 0 Mas A B P(A | B) P(A B) P(B) P(A B) 0 P(B | A) P(A | B) 0 P(A B) P(A B) 0 P(A) P(B | A) 0 Independência de Eventos Então - Se P(A) e P(B) são estritamente positivos (>0) e A e B são eventos mutuamente exclusivos: Então A e B NÃO SÃO estatisticamente independentes, pois P(A|B) = 0 ≠ P(A) e P(B|A) = 0 ≠ P(B) - Logo, se os eventos A e B são independentes e mutuamente exclusivos: Pelo menos um deles tem probabilidade nula, pois é a única forma de P(A|B) = P(A) e P(B|A) = P(B) Independência de Eventos Exemplo 1 Se P(A) = 0,35 , P(B) = 0,8 e P(A∩B) = 0,28, A e B são independentes? P(A).P(B) = 0,35.0,8 = 0,28 Como P(A).P(B) = P(A∩B), A e B são independentes Exemplo 2 Se P(A|B) = 0,4 , P(B) = 0,8 e P(A) = 0,6, os eventos A e B são independentes? Uma vez que P(A|B) ≠ P(A), os eventos não são independentes Independência de Eventos Exemplo 3 Se P(A) = 0,2 e P(B) = 0,2 e se os eventos A e B forem mutuamente excludentes, eles serão independentes? Se A e B são mutuamente excludentes, e admitimos que eles são independentes, então: P(A).P(B) = P(A∩B) = 0, pois pelo menos um deles tem probabilidade nula Mas .. Como P(A).P(B) = 0,04 ≠ 0, os eventos A e B não são independentes Independência de Eventos Exemplo 4 Tomou-se uma amostra com 1000 pessoas em um shopping-center com o objetivo de investigar a relação entre a renda familiar e a posse de cartões de crédito. A partir dos dados da próxima tabela pergunta-se: existe independência entre “renda” e “posse de cartões de crédito”? Independência de Eventos Se existe independência entre as duas variáveis, então: P(Ai∩Bj) = P(Ai).P(Bj) para todos i e j Onde Ai indica o nível de renda e Bj o número de cartões de crédito Logo, basta provar que a igualdade acima não é válida para ALGUMA célula na tabela para concluir que as duas variáveis são dependentes Independência de Eventos Se olharmos para a célula superior esquerda vemos que: P(renda abaixo de R$500 E nenhum cartão) = 260/1000 = 0,26 Mas: P(renda abaixo de R$500) = 330/1000 = 0,33 P(nenhum cartão) = 530/1000 = 0,53 Ora, como 0,33.0,53 = 0,17 (≠0,26), segue-se que as variáveis renda familiar e número de cartões de crédito são dependentes. Partição do Espaço Amostral Vamos dividir (partir) o espaço amostral abaixo em vários pedaços E B1 Qual é o B B2 ? conjunto 1 Qual é o B B5 ? conjunto 4 B3 Qual é o B1 B5 ? conjunto B2 B4 Qual é o conjunto B5 B1 B2 B3 B3 B5 ? Partição do Espaço Amostral Um conjunto de eventos {Bi}, i = 1,..., n constitui uma partição do espaço amostral E quando satisfaz as duas condições a seguir: 1) B i B j , i , j 1, ..., n ( i j ) n Bi E 2) i 1 Os eventos que compõem uma partição são - mutuamente exclusivos e, - quando unidos, englobam todo o espaço amostral Partição do Espaço Amostral 1) B i B j , i , j 1, ..., n ( i j ) n Bi E 2) E i 1 Teorema da Probabilidade Total Se A e B são eventos mutuamente excludentes, então: P(A U B) = P(A) + P(B) P(E1 U E2 U ... U Ek) = P(E1) + P(E2) + ... + P(Ek) A E1 E2 B E3 E4 Teorema da Probabilidade Total E A A B∩A B∩A B Como posso escrever B? Como posso escrever P(B)? Teorema da Probabilidade Total Probabilidade Condicional P(A│B) = P(A ∩ B) / P(B) P(A ∩ B) = P(A│B).P(B) = P(B│A).P(A) P(B│A) = P(A ∩ B) / P(A) Para uma situação representada pelo diagrama: A A B∩A B∩A B B = (B ∩ A) U (B ∩ A) P(B) = P(B ∩ A) + P(B ∩ A) = P(B│A).P(A) + P(B│A).P(A) Regra da probabilidade total para dois eventos quaisquer A e B Teorema da Probabilidade Total Na fabricação de semicondutores, seja 0,10 a probabilidade de que um chip que esteja sujeito a altos níveis de contaminação durante a fabricação cause uma falha no produto. A probabilidade é de 0,005 de um chip que não esteja sujeito a altos níveis de contaminação durante a fabricação, cause uma falha no produto. Em uma corrida particular de produção, 20% dos chips estão sujeitos a altos níveis de contaminação. Qual é a probabilidade de que um produto usando um desses chips venha a falhar? Faça F denotar o evento em que o produto falhe e faça A denotar o evento em que o chip está exposto a altos níveis de contaminação. F evento em que o produto falhe; A evento em que o chip está exposto a altos níveis de contaminação; A evento em que o chip não está exposto a altos níveis de contaminação P (F│A) = 0,10 P (F│A) = 0,005 P (A) = 0,20 P (A) = 0,80 P(F) = P (F│A).P(A) + P (F│A).P(A) = 0,10 . 0,20 + 0,005 . 0,80 = 0,024 Teorema da Probabilidade Total Para uma situação representada pelo diagrama: E2 E1 B ∩ E1 B ∩ E2 E3 E4 B B ∩ E3 B ∩ E4 B = (B ∩ E1) U (B ∩ E2) U (B ∩ E3) U (B ∩ E4) P(B) = P(B ∩ E1) + P(B ∩ E2) + ... + P(B ∩ Ek) = P(B│E1).P(E1) + P(B│E2).P(E2) + ... + P(B│Ek).P(Ek) Regra da probabilidade total para eventos múltiplos quaisquer E1, E2, ..., Ek. Teorema da Probabilidade Total Continuando com o exemplo da fabricação de semicondutores, considere que a probabilidade seja: - 0,1 de que um chip sujeito a níveis altos de contaminação durante a fabricação cause uma falha no produto; - 0,01 de que um chip sujeito a níveis médios de contaminação durante a fabricação cause uma falha no produto; -0,001 de que um chip sujeito a níveis baixos de contaminação durante a fabricação cause uma falha no produto. Em corrida particular de produção, 20% dos chips estão sujeitos a níveis altos de contaminação, 30% a níveis médios de contaminação e 50% a níveis baixos de contaminação. Qual é a probabilidade de que um produto, usando um desses chips, falhe? H é o evento em que um chip seja exposto a níveis altos de contaminação; M é o evento em que um chip seja exposto a níveis médios de contaminação; L é o evento em que um chip seja exposto a níveis baixos de contaminação; P(F) = P(F│H).P(H) + P(F│M).P(M) + P(F│L).P(L) P(F) = 0,10.0,20 + 0,01.0,30 + 0,001.0,50 P(F) = 0,0235 Teorema da Probabilidade Total Considere um evento A e uma partição do espaço amostral {Bi}, i = 1,..., m. Para essa partição e esse evento, tem-se que: m P ( A) P(A B j ) j 1 Ou ainda: m P ( A) P(A | B j 1 j )P(B j ) Teorema da Probabilidade Total Demonstração E A A E A A Bj j 1 m Teorema da Probabilidade Total A A Bj j 1 m Tendo em vista que a interseção é distributiva em relação à união, tem-se que: A ( A B j ) j 1 m Como B j B k , j k ( j , k 1,..., m ) pois {Bi}, é uma partição, então: ( A B j ) ( A Bk ) Teorema da Probabilidade Total Dessa forma, os termos de A ( A B j ) j 1 m são mutuamente exclusivos Portanto: m P ( A) P(A B j 1 j ) Teorema de Bayes Thomas Bayes (1702-1761) no problema do semicondutor, podemos querer saber: se o chip semicondutor no produto falhar, qual a probabilidade de que ele tenha sido exposto a altos níveis de contaminação? antes queríamos saber qual a probabilidade de falhar. Agora, falhando , queremos saber uma probabilidade associada a uma origem da falha procurando saber a causa Teorema de Bayes Considere uma partição do espaço amostral {Bj}, j = 1,..., m, com P(Bj) > 0 para todo j. Seja ainda A um evento com P(A) > 0 Da definição de probabilidade condicional: P(B j | A) P(B j A) P(A | B j ) P(A) P(A B j ) P(B j ) P(B j | A) iguais P(A B j ) P(A | B j ) P(B j ) P(A | B j ) P(B j ) P(A) Pelo teorema da probabilidade total: P(A) m k 1 P(A | Bk ) P(B k ) P(B j | A) P(A | B j ) P(B j ) m P(A | B k 1 k ) P(B k ) Teorema de Bayes P ( B j | A) P ( A | B j ). P ( B j ) m P(A | B k j 1, ..., m ). P ( B k ) k 1 A expressão acima é conhecida como Teorema de de Bayes As probabilidades P(Bj) são conhecidas como probabilidades a priori, e indica um valor de probabilidade inicial originalmente obtido antes que seja obtida qualquer informação adicional As probabilidades P(Bj|A) são conhecidas como probabilidades a posteriori , e indica um valor de probabilidade que foi revisto usando-se informação adicinal obtida posteriormente. Resumo Regra da adição E A A∩B B A P(A U B) = P(A) + P(B) - P(A ∩ B) E B Se A e B eventos mutuamente excludentes: P(A U B) = P(A) + P(B) Resumo Regra da multiplicação P(A ∩ B) = P(A) . P(B) estatisticamente independentes Probabilidade condicional E A P(A | B) A∩B P(A B) P(B) B faz o papel do espaço amostral B P(B | A) P(A B) P(A) A B A faz o papel do espaço amostral A∩ B Resumo Partição do espaço amostral {Bj}, j = 1,..., m Teorema da probabilidade total 1) B i B j , i , j 1, ..., n ( i j ) n Bi E 2) A i 1 P(A) m P(A | B k ) P(B k ) k 1 P(Bj) > 0 para todo j. Seja A um evento com P(A) > 0 Teorema de Bayes P(B j | A) P(A | B j ) P(B j ) m P(A | B k 1 k ) P(B k ) Teorema de Bayes Exemplo 1 Uma fábrica tem três máquinas, A, B e C, que respondem, respectivamente, por 40%, 35% e 25% de sua produção. A proporção de peças defeituosas na máquina A é de 2%, essa proporção é de 1% para a máquina B e de 3% para a máquina C. Toma-se uma peça ao acaso. É defeituosa. Qual a probabilidade de ela ter sido produzida pela máquina B? Defeituosa dado que foi produzida pela máquina B Defeituosa | produzida pela máquina B d|B Teorema de Bayes Chamemos de B o evento fabricado pela máquina B, e de d o evento defeituosa Queremos, dessa forma, a probabilidade P(B|d) Quais os conceitos utilizados até o momento? i intacta E A i=d i B d C Teorema de Bayes E A i B d A∩d C B∩d C∩d Teorema de Bayes d = (d ∩ A)U(d ∩ B)U(d ∩ C) P(d) = P(d∩A)+P(d∩B)+P(d∩C) = = P(d|A).P(A)+P(d|B).P(B)+ + P(d|C).P(C) d∩A Por outro lado: d∩B P(B | d) P(B d) P(d) P(d B) P(d) d∩C P(d | B) P(B) P(d) P(B | d) P(d | B) P(B) P(d | A) P(A) P(d | B) P(B) P(d | C) P(C) Teorema de Bayes P(B | d) 0,35 0,01 0,40 0,02 0,35 0,01 0,25 0,03 0,184 18,4% d∩A d∩B d∩C Teorema de Bayes Sem o uso do diagrama, temos que reconhecer que queremos a probabilidade P(B|d): P(B | d) P(B d) P(d) P(d B) P(d) P(d | B) P(B) P(d) Reconhecer também que a peça defeituosa pode provir (origem do problema) de qualquer uma das três máquinas (e só de uma). Em seguida, aplica-se a fórmula do Teorema de Bayes: P(d) P(A) P(d | A) P(B) P(d | B) P(C) P(d | C) P(d) 0,40 0,02 0,35 0,01 0,25 0,03 0,019 P(B | d) 0,35 0,01 0,40 0,02 0,35 0,01 0,25 0,03 0,184 18,4% Teorema de Bayes Uma coisa interessante na fórmula do Teorema de Bayes: Partição de interesse P(B | d) 0,35 0,01 0,40 0,02 0,35 0,01 0,25 0,03 Somatório em todas as partições Teorema de Bayes A visualização do problema é facilitada pela utilização do seu correspondente diagrama em árvore d 0,02 i 0,98 Cada avanço por 1 ramo multiplicação 0,40 A d B P(d) P(A) P(d | A) P(B) P(d | B) P(C) P(d | C) 0,01 P(d) 0,40 0,02 0,35 0,01 0,25 0,03 0,35 i 0,99 P(B | d) C 0,35 0,01 0,40 0,02 0,35 0,01 0,25 0,03 0,25 d i 0,03 0,97 Somam-se os resultados dos caminhos (avanços) Teorema de Bayes Exemplo 2 Um transmissor de localização de emergência de uma aeronave (TLE) é um aparelho projetado para transmitir um sinal no caso de queda. A Altigauge Manufacturing Company faz 80% dos TLEs, a Bryant Company faz 15% deles, e a Chartair Company faz os outros 5%. Os TLEs feitos pela Altigauge têm taxa de defeituosos de 4%, os da Bryant têm taxa de defeituosos de 6%, e os da Chartair, taxa de 9% (o que ajuda a explicar por que a Chartair tem a menor fatia do mercado). (a) Se um TLE é selecionado aleatoriamente da população original de todos os TLEs, ache a probabilidade de que tenha sido fabricado pela Altigauge Manufacturing Company; (b) Se um TLE é selecionado aleatoriamente e testado e se verifica que é defeituoso, ache a probabilidade de ele ter sido fabricado pela Altigauge Manufacturing Company. Teorema de Bayes A = TLE fabricado pela Altigauge P(A) = 0,80 B = TLE fabricado pela Bryant P(B) = 0,15 C = TLE fabricado pela Chartair P(C) = 0,05 D = TLE é defeituoso D = TLE não é defeituoso (ou é bom) Solução: A E D D B C Teorema de Bayes Exemplo 2 a) Se um TLE é selecionado aleatoriamente da população geral de todos os TLEs, a probabilidade de ter sido fabricado pela Altiguage é 0,8 (porque a Altigauge fabrica 80% deles). b) Se sabemos agora que o TLE foi testado e é defeituoso, desejamos revisar a probabilidade da parte (a) de modo que a nova informação possa ser usada. Desejamos encontrar o valor de P(A│D), que é a probabilidade de que o TLE tenha sido fabricado pela Altigauge, dado que é defeituoso. Com base na informação dada, sabemos estas probabilidades. P(D│A) = 0,04 Taxa de defeituosos da Altigauge é de 4% P(D│B) = 0,06 Taxa de defeituosos da Bryant é de 6% P(D│C) = 0,09 Taxa de defeituosos da Chartair é de 9% Teorema de Bayes D|A D|A 0,80 A 0,8.0,04 = 0,032 0,04 D|B B 0,06 0,15.0,06 = 0,009 0,15 D|B C 0,05 D|C 0,09 0,05.0,09 = 0,0045 P(D) = 0,0455 D|C P( A D ) P(A) P( D A ) P(D) P(A) P( D A ) P(A) P( D A ) P(B) P( D B ) P(C) P( D C ) 0,032 0,0455 0,703 Universidade Federal de Alagoas Centro de Tecnologia Estatística Aula 12 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado pelos Prof. Wayne Santos de Assis e Christiano Cantarelli Rodrigues