Muitos já devem ter ouvido falar no Teorema de Bayes: uma expressão bastante simples, desenvolvida por um pastor inglês em meados do século XVIII, mas que dá sustentação a inúmeras aplicações da estatística. Uma das mais importantes é quando desejamos avaliar a probabilidade de uma hipótese. Nesses casos, o Teorema de Bayes é usado para atualizar nosso conhecimento a priori da probabilidade de uma hipótese à luz de novas evidências.
Muitas vezes, por termos opiniões muito fortes a respeito de um determinado assunto, esquecemos de combiná-las com os dados disponíveis, o que acaba atrapalhando nossas conclusões. Um enigma clássico é o seguinte: imagine que você está em uma fila de espera qualquer e escuta alguém recitar perfeitamente versos de Shakespare, falar a respeito de filósofos gregos e conversar com bastante eloquência sobre diversos eventos históricos. Qual é a profissão mais provável dessa pessoa: caminhoneiro ou professor de literatura de Oxford?
A primeira resposta que veio à cabeça de muita gente deve ter sido a segunda. Afinal, imagina-se que os professores de literatura de Oxford falem de maneira natural sobre esses assuntos, enquanto deve haver uma fração mínima de caminhoneiros capazes de dissertar sobre eles. Esse, porém, é apenas nosso conhecimento a priori, que ainda precisa ser cruzado com as evidências, para que possamos responder a pergunta com mais confiança. O segredo dessa charada é perceber que há milhões de caminhoneiros no mundo, enquanto o número de professores de literatura de Oxford não deve passar de dez. É, de fato, bastante improvável que um caminhoneiro tenha um conhecimento tão peculiar, mas com a quantidade de motoristas de caminhão que existem, é muito mais plausível você encontrar uma dessas exceções do que dar de cara com um dos dez professores de literatura clássica de Oxford no mundo. Assim, ao contrário da nossa suspeita inicial e por mais contraintuitivo que pareça para alguns, entre as duas profissões, é bem mais provável que o sujeito conduza caminhões.
Esse é um caso clássico em que por mais fortes que pareçam nossas convicções, quando as combinamos com os dados disponíveis, a conclusão pode virar ao avesso. Vamos agora para o caso contrário.
Se alguém aqui já se perguntou porque não é aconselhável que mulheres antes dos 40 anos façam mamograma rotineiramente, o Teorema de Bayes também ajuda a desvendar essa questão. Ora, já se sabe que a chance de uma mulher antes dessa idade desenvolver um câncer de mama é bem baixa (por volta de 1,5%), mas qual seria o problema de fazer esse exame? Caso o exame desse positivo apenas para, em média, as 15 de cada 1000 mulheres que de fato estivessem doentes, não haveria qualquer problema. A questão, entretanto, são os falsos positivos, que acontecem em cerca de 10% dos exames. Ainda que o resultado do exame para uma mulher jovem dê positivo, é muito mais provável que esse resultado seja devido a um erro da mamografia do que ao desenvolvimento de um câncer de fato. Com efeito, quando também levamos em consideração os falsos negativos do exame, a chance de uma mulher antes dos 40 anos ter um câncer de mama,
dado que ela testou positivo, ainda é de míseros 10%.
Moral da história: nem toda nova evidência, por mais contudente que ela pareça (como o resultado positivo de um exame), é capaz de alterar nossas conclusões a respeito de determinado tópico. Da mesma forma, nem toda opinião prévia (como a diferença de conhecimento entre caminhoneiros e professores de literatura de Oxford) é infalível frente às evidências. Ou seja, o Teorema de Bayes nos mostra que não há nada escrito em pedra: ao combinarmos nosso conhecimento prévio com as evidências disponíveis podemos chegar a resultados bem surpreendentes.