Cinco anos de Nerdyard: o teorema de Bayes Em 19 de fevereiro o Nerdyard completa cinco aninhos! E, como é praxe, a festa é para agradecer você, para quem o Nerdyard deve sua existência e razão de ser! Grato deveras! Hoje, porém, além de mencionar o aniversário e agradecer você, também vou demonstrar o teorema de Bayes, já começando o ano sem moleza! Esse teorema é sobre probabilidades condicionais e para ilustrá-lo, antes mesmo de enunciá-lo, vamos considerar uma situação hipotética. Suponha que, em um determinado curso, a probabilidade de um estudante qualquer passar seja p. Em uma turma de três estudantes, qual é a probabilidade de que somente dois sejam aprovados? Ora, vamos chamar os estudantes de a, b e c. Temos um caso em que a e b são aprovadas e c é reprovado. Também temos o caso em que a e c são aprovados e b é reprovada. Finalmente, também há a situação em que b e c são aprovados e a é reprovada. Não há mais caso algum em que exatamente dois estudantes são aprovados e um é reprovado. Em cada caso, a probabilidade de que dois sejam aprovados é p2 e a de que um seja reprovado é 1 − p. Então, a probabilidade de ocorrer cada um dos três casos particulares é o produto p2 (1 − p) . Veja que esses três casos são equiprováveis, isto é, têm a mesma probabilidade, cada um, de ocorrer. Como são três casos, a probabilidade total de termos dois quaisquer estudantes aprovados ao mesmo tempo em que um é reprovado dá 3p2 (1 − p) . Não foi tão difícil, foi? Agora, considere que você já sabe que dois estudantes foram aprovados e o outro foi reprovado. Sabendo isso, qual é a probabilidade de que um dos aprovados seja a estudante a? Esta probabilidade é chamada “probabilidade condicional,” pois depende do conhecimento de que dois estudantes foram aprovados e o outro, reprovado. Dos três casos possíveis e equiprováveis em que dois estudantes são aprovados e um, reprovado, a estudante a figura como aprovada em apenas dois deles. Assim, a probabilidade de que ela seja aprovada, dado que dois dos três são aprovados e o outro, reprovado, é 2/3. Vamos agora chamar o evento em que a é aprovada de evento α. Seja β o evento em que dois dos três estudantes são aprovados e o outro, reprovado. A probabilidade condicional que calculamos acima, de que a estudante a seja aprovada, dado que dois estudantes foram aprovados e o outro, reprovado, é escrita como P (α|β) = 2 . 3 (1) A probabilidade condicional P (α|β) é lida como “a probabilidade de ocorrer o evento α, dado que ocorre o evento β.” Cuidado para não fazer confusão: a probabilidade condicional da Eq. (1) não é a probabilidade de que a seja um dos estudantes aprovados no caso em que dois estudantes são aprovados e o outro, reprovado. Como vimos, a probabilidade de que o evento β ocorra, independentemente de ocorrer o evento α, é dada por P (β) = 3p2 (1 − p) . 1 (2) A probabilidade da Eq. (2) é a de que dois estudantes são aprovados, enquanto o outro é reprovado, sem importar se a é aprovada ou não. A estudante a figura como aprovada somente em dois dos três possíveis casos em que dois estudantes são aprovados e o outro, reprovado. Como cada um dos três casos tem probabilidade p2 (1 − p) , então a probabilidade de ambos os eventos β e α ocorrer é dada por P (β ∩ α) = 2p2 (1 − p) . (3) Veja, portanto, que a Eq. (3) é dada pelo produto das probabilidades das Eqs. (1) e (2): P (β ∩ α) = P (α|β) P (β) . (4) Podemos usar a Eq. (4) como a definição da probabilidade condicional P (α|β) no caso geral, isto é, P (α|β) ≡ P (β ∩ α) . P (β) (5) Vamos inverter a nossa questão original agora. Suponha que sabemos que o evento α acontece, isto é, é dado que a estudante a passa no curso. Com esse evento dado, qual é a probabilidade condicional de que dois dos estudantes são aprovados enquanto o outro é reprovado? Queremos, portanto, calcular P (β|α) . Por hipótese sabemos que a probabilidade de a passar no curso, independentemente de qualquer outro evento, é dada por P (α) = p. (6) Há quatro casos distintos em que o evento α ocorre. Há o caso em que os três estudantes passam, com probabilidade p3 . Há também o caso em que só 2 a é aprovada, com probabilidade p (1 − p) . Finalmente, há mais dois casos equiprováveis, com probabilidade p2 (1 − p) : aquele em que b passa e c, não, e o caso em que c passa e b, não. Estes dois últimos casos são aqueles em que ambos os eventos, α e β, ocorrem ao mesmo tempo. Vemos, assim, que a probabilidade de ocorrer, ao mesmo tempo, os eventos α e β é, como anteriormente, dada por P (α ∩ β) = 2p2 (1 − p) = P (β ∩ α) , (7) como deveria ser, já que, logicamente, α∩β = β ∩ α. (8) Mas ainda não encontramos a probabilidade condicional P (β|α) . Usando a definição da Eq. (5), podemos escrever P (β|α) = P (α ∩ β) = 2p (1 − p) , P (α) 2 (9) onde usamos as Eqs. (6) e (7). Evidentemente, das Eqs. (5), (8) e (9) segue que P (β|α) = P (α|β) P (β) , P (α) (10) que é o chamado “teorema de Bayes”. Há muitas aplicações, em diferentes áreas, do teorema de Bayes. Meu interesse particular está em retrodição em mecânica quântica. Tendo um ensemble de sistemas quânticos, podemos fazer uma pós-seleção de resultados de medida e construir um sub-ensemble do original, com cada membro tendo resultado no mesmo valor da medida de uma determinada observável. Podemos, então, usando o teorema de Bayes, calcular a probabilidade de que uma medida anterior, no início do experimento, tenha resultado em um específico valor de outra observável, por exemplo. Mas tudo isso é outra estória, para uma postagem futura. 3