As redes bayesianas são grafos que representam relações de probabilidade condicional, ou seja, como que a ocorrência de certas variáveis depende do estado de outra. Elas foram desenvolvidas no início dos anos 1980 para facilitar a tarefa de predição e “abdução” em sistemas de inteligência artificial (AI).[1]
Em resumo, redes bayesianas, também conhecidas como redes de opinião, redes causais e gráficos de dependência probabilística, são modelos gráficos para raciocínio (conclusões) baseados em incerteza, onde os nós representam as variáveis (discretas ou contínuas), e os arcos representam conexões diretas entre eles.[2] Redes bayesianas vem se tornando a metodologia padrão para a construção dos sistemas que confiam no conhecimento probabilístico e tem sido aplicada em uma variedade de atividades do mundo real.[3]
Matematicamente, uma rede bayesiana é uma representação compacta de uma tabela de conjunção de probabilidades do universo do problema. Do ponto de vista de um especialista, redes bayesianas constituem um modelo gráfico que representa de forma simples as relações de causalidade das variáveis de um sistema.
Essa representação tem como uma das suas principais características a adaptabilidade, podendo, a partir de novas informações, e com base em informações de cunho verdadeiro, gerar alterações nas dependências e nos seus conceitos. Permite, dessa forma, que as probabilidades não sejam meros acasos, podendo confirmar e criar novos conceitos.
A representação das redes bayesianas é feita por meio de um grafo acíclico direcionado, no qual os nós representam variáveis de um domínio e os arcos representam a dependência condicional entre as variáveis. Para representar a força da dependência, são utilizadas probabilidades, associadas a cada grupo de nós pais-filhos na rede.[4]
Exemplo
Dois eventos podem fazer a grama ficar molhada: um regador ativo ou a chuva. A chuva tem um efeito direto no uso do regador (pois quando chove, o regador geralmente está inativo). Essa situação pode ser modelada com uma rede bayesiana. Cada variável tem dois valores possíveis: V (Verdadeiro) ou F (Falso).
A Distribuição de probabilidade conjunta é:
onde G = grama molhada (verdadeiro/falso), R = regador ligado (verdadeiro/falso) e C = chovendo (verdadeiro falso).
O modelo pode responder questões sobre a presença de uma causa dada a presença de um efeito (também chamado de probabilidade inversa), como por exemplo "Qual é a probabilidade que esteja chovendo, dado que a grama está molhada?", usando a fórmula da probabilidade condicional:
Usando a expansão para a probabilidade conjunta e as probabilidades condicionais das tabelas mostradas no diagrama, pode-se obter o valor de cada termo no numerador e no denominador. Por exemplo,
↑(Bobbio, et al., 2001) Improving the analysis of dependable systems by mapping fault trees into Bayesian networks. Reliability Engineering & System Safety, 71(3).