Méthode
Comprendre les causes à partir des effets

Le théorème de Bayes assoit sa validité sur les règles de base de la théorie des probabilités. Il nous permet de faire des inférences et de rafraîchir nos croyances sur un événement donné, autant d’éléments importants pour être en mesure de prendre des décisions rationnelles dans une multitude de contextes.

Malgré sa simplicité apparente, le théorème de Bayes cache ses pièges : il devient terriblement complexe à appliquer lorsque les variables en jeu sont multiples, ce qui est souvent le cas. Il a fallu attendre les années 1980 pour que la puissance du théorème de Bayes puisse à être réellement déployée. Deux événements ont marqué le tournant. D'une part, la capacité de calcul a commencé à être généralement accessible. D’autre part, deux autres chercheurs, Judea Pearl et Richard Neapolitan, ont formalisé ce qu’on appelle les "réseaux bayésiens" et formulé des algorithmes permettant une application efficace du théorème de Bayes. Une nouvelle ère dans le raisonnement probabiliste et la prise de décision a ainsi vu le jour.


DE QUOI S’AGIT IL?

D'un point de vue formel, un réseau bayésien est un graphique, c'est-à-dire un ensemble de nœuds et de flèches. Les nœuds indiquent les variables d'un enjeu problématique, tandis que les flèches indiquent les relations de causalité entre elles. Comme il est montré dans les images, cela constitue un moyen puissant de modéliser un problème et d'exprimer les relations entre les grandeurs en jeu.

Chaque nœud est composé d'états représentant les différentes valeurs qu'une variable peut avoir. Dans le réseau représenté, par exemple, le nœud "Dyspnea" comporte deux états, indiquant respectivement si un sujet souffre ou ne souffre pas de dyspnée. À chaque état est associée la probabilité qu’il se produise, et cela dépend de la structure du réseau, de la "force" des relations aléatoires (représentées par les flèches) et est obtenue grâce au théorème de Bayes.


PROPRIÉTÉS

Un réseau modélise un problème. Le réseau reproduit représente un problème de diagnostic dans lequel un médecin doit estimer la probabilité qu'un patient ait une maladie (tuberculose ou cancer) en fonction de son historique clinique (a-t-il été en Asie? Fume-t-il?), de ses symptômes (souffre-t-il de dyspnée ou de bronchite?) et du résultat de tests diagnostiques tels qu’une radio des poumons. Une fois ces variables connues, les probabilités des nœuds d'intérêt (Tuberculose et Cancer) se mettent à jour en tenant compte de l'information disponible. Le médecin peut ainsi correctement mesurer l'influence que certains facteurs ont sur la possibilité que le patient souffre d’une certaine maladie.

reti bayesiane

Ainsi, on peut doter un réseau bayésien de "preuves", c’est à dire de valeurs connues de variables problématiques. Le réseau calcule comment la connaissance de ces variables modifie la probabilité des autres variables.

Mais en réalité le réseau peut faire beaucoup plus. Grâce aux algorithmes dits d'apprentissage, le réseau peut évaluer la "force" des dépendances entre les variables en jeu. Dans le petit exemple de diagnostic présenté, certaines conditions (telles que la probabilité de contracter la tuberculose en ayant voyagé en Asie ou pas) étaient des paramètres d'input. Dans votre entreprise, dans de nombreux cas, vous pouvez savoir quelles variables dépendent de quelles autres, mais vous ignorez le "combien", en quelle mesure. Les algorithmes d'apprentissage peuvent déduire l'intensité des rapports à partir de données parfois disponibles.

Et même si on ignore totalement les rapports de dépendance réciproque entre des variables (ou si on ne dispose que de vagues indications), les algorithmes "d'apprentissage de la structure" réussissent à reconstruire la correcte structure du réseau, pourvu que l’on dispose d’une base de données adéquate (prérequis presque toujours satisfait dans le monde de "big data").

Fondamentalement, les Réseaux Bayésiens peuvent être utilisés comme des puissants moyens de "machine learning". Ils sont capables d'identifier les facteurs décisifs qui déterminent les valeurs d'une variable, identifient la catégorie ("profilage") auxquelles appartiennent certaines observations et prédisent les comportements futurs en fonction de l'expérience passée.


CHAMPS D’APPLICATION

À ce jour, l'utilisation des Réseaux Bayésiens concerne d’innombrables enjeux dans des domaines très différents. Par exemple:

Dans la diagnostique (médicale ou autre), des Réseaux bayésiens ont été développés et utilisés pour extraire la cause la plus probable de certains symptômes. Ils permettent de détecter plus rapidement où, avec la plus grande probabilité, le problème peut résider et simplifient considérablement le processus de diagnostic.

Également, des grands succès ont été réalisés dans le domaine du profilage. Beaucoup de filtres à spam utilisent des systèmes experts basés sur des Réseaux Bayésiens programmés pour identifier efficacement les courriels indésirables parmi ceux qui arrivent dans nos inbox.

Dans le domaine du marketing, des Réseaux Bayésiens sont utilisés pour identifier quels éléments doit avoir une campagne pour atteindre un certain résultat ou pour repérer rapidement le profil de la clientèle pouvant être intéressé par un produit ou une promotion. Dans le commerce électronique, ce sont des Réseaux Bayesiens qui suggèrent les produits les plus susceptibles d’intéresser le client, en fonction des achats qu'il a déjà réalisés et de ceux réalisés par des clients ayant des profils similaires.

Il est très difficile de faire des prévisions,
notamment si elles concernent le futur
Niels Bohr

Ce site web utilise des cookies pour analyser son utilisation et permettre l’accès aux pages réservées. Nos cookies ne permettent pas d’identifier les utilisateurs. Les cookies sont enregistrés dans votre navigateur et sont utilisés pour personnaliser votre expérience sur notre site web. Continuer la navigation sans modifier vos préférences actuelles implique l’acceptation des cookies. Vous pouvez modifier vos préférences d’utilisation de cookies à tout moment.