Réseau bayésien

Un article de Wikipédia, l'encyclopédie libre.

Les Réseaux bayésiens sont à la fois :

  1. Des modèles de représentation des connaissances
  2. Des "machines à calculer" les probabilités conditionnelles

Pour un domaine donné (par exemple médical), on décrit les relations causales entre variables d'intérêt par un graphe.

Dans ce graphe, les relations de cause à effet entre les variables ne sont pas déterministes, mais probabilisées. Ainsi, l'observation d'une cause ou de plusieurs causes n'entraîne pas systématiquement l'effet ou les effets qui en dépendent, mais modifie seulement la probabilité de les observer.

L'intérêt particulier des réseaux bayésiens est de tenir compte simultanément de connaissances a priori d'experts (dans le graphe) et de l'expérience contenue dans les données.

Les réseaux bayésiens sont surtout utilisés pour le diagnostic (médical et industriel), l'analyse de risques, la détection des spams et le data mining.

Sommaire

[modifier] Un exemple très simple dans la modélisation des risques

Un opérateur travaillant sur une machine risque de se blesser, s’il l’utilise mal. Ce risque dépend de l’expérience de l’opérateur et de la complexité de la machine. «Expérience» et «Complexité» sont deux facteurs déterminants de ce risque (fig. 1)

Bien sûr, ces facteurs ne permettent pas de créer un modèle déterministe. Si l’opérateur est expérimenté, et la machine simple, cela ne garantit pas qu’il n’y aura pas d’accident. D’autres facteurs peuvent jouer : l’opérateur peut être fatigué, dérangé, etc. La survenance du risque est toujours aléatoire, mais la probabilité de survenance dépend des facteurs identifiés.

Le schéma ci-dessous représente la structure de causalité de ce modèle (graphe).


Le suivant représente la probabilisation de la dépendance : on voit que la probabilité d'accident augmente si l'utilisateur est peu expérimenté ou la machine complexe.


On voit ici comment intégrer des connaissances d'expert (les facteurs déterminants) et des données (par exemple, la table de probabilité d'accident en fonction des déterminants peut venir de statistiques).

[modifier] Construction de réseaux bayésiens

Construire un réseau bayésien c'est donc :

  1. Définir le graphe du modèle
  2. Définir les tables de probabilité de chaque variable, conditionnellement à ses causes.

Le graphe est aussi appelé la "structure" du modèle, et les tables de probabilités ses "paramètres". Structure et paramètres peuvent être fournis par des experts, ou calculés à partir de données, même si en général, la structure est définie par des experts et les paramètres calculés à partir de données expérimentales.

[modifier] Utilisation d'un réseau bayésien

L'utilisation d'un réseau bayésien s'appelle "inférence". Le réseau bayésien est alors véritablement une "machine à calculer des probabilités conditionnelles". En fonction des informations observées, on calcule la probabilité des données non observées. Par exemple, en fonction des symptômes d'un malade, on calcule les probabilités des différentes pathologies compatibles avec ces symptômes. On peut aussi calculer la probabilité de symptômes non observés, et en déduire les examens complémentaires les plus intéressants.

[modifier] Liens & Outils logiciels

[modifier] Lecture

Les réseaux bayésiens, P. Naïm, P. Wuillemin, P. Leray, O. Pourret, A. Becker, Eyrolles 2004 http://www.eyrolles.com/Sciences/Livre/9782212111378/livre-reseaux-bayesiens.php

[modifier] Voir aussi