Metodologia

Il Teorema di Bayes deve la sua validità alle regole di base della teoria della probabilità. Esso ci permette di compiere inferenza e di aggiornare la nostra credenza su un dato evento, elementi imprenscindili per poter prendere una decisione razionale in una moltitudine di contesti.

Nonostante la sua apparente semplicità, il Teorema di Bayes nasconde un'insidia: esso diventa terribilmente complesso da applicare quando le variabili in gioco sono molteplici, come accade spesso. Si è dovuto arrivare agli anni '80 perché la piena potenza del Teorema di Bayes potesse essere utilizzata. Due fatti segnarono la svolta. Da una parte, la potenza di calcolo cominciò ad essere generalmente accessibile. Dall'altra due ricercatori, Judea Pearl e Richard Neapolitan, formalizzarono le cosiddette "Reti Bayesiane" e formularono algoritmi che permettono l'applicazione efficace del Teorema di Bayes. Una nuova era nel ragionamento probabilistico e nel decision-making stava iniziando.


COSA SONO

Dal punto di vista formale, una Rete Bayesiana è un grafo, ossia un'insieme di nodi e frecce. I nodi indicano le variabili di un problema in gioco, mentre le frecce indicano i rapporti di causalità tra di esse. Come si vede dalle immagini a destra, esse costituiscono un potente mezzo per modellizzare un problema ed esprimere i rapporti tra le grandezze in gioco.

Ogni nodo è composto di stati, che rappresentano i vari valori che una variabile può avere. Nella rete mostrata, ad esempio, il nodo "Dyspnea" ha due stati, che rispettivamente indicano se un soggetto soffre o non soffre di dispnea. Ogni stato ha associata una sua probabilità, che dipende dalla struttura della rete, dalla "forza" delle relazioni casuali (rappresentate dalle frecce) ed è ottenuta tramite il teorema di Bayes.


PROPRIETÀ

Una rete modellizza un problema. La rete riprodotta raffigura un problema diagnostico, in cui un medico deve stimare quanto è verosimile che un paziente abbia una malattia (tubercolosi o cancro), in funzione della sua storia clinica (è stato in Asia? Fuma?), dei suoi sintomi (soffre di dispnea o di bronchite?) e del risultato di test diagnostici, come l'esame dei raggi X. Note queste variabili, le probabilità dei nodi di interesse (Tubercolosis e Cancer) si aggiornano, tenendo conto delle informazioni disponibili. Il medico quindi può correttamente pesare quanta influenza alcuni fattori abbiano sulla possibilità che il paziente abbia una determinata malattia.

reti bayesiane

Come abbiamo visto, ad una rete bayesiana possono essere fornite delle "evidenze", ossia valori noti di variabili del problema. La rete calcola come la conoscenza di queste variabili modifica la probabilità delle altre variabili.

In realtà la rete può fare ancora di più. Grazie a cosiddetti algoritmi di apprendimento, la rete può valutare la "forza" delle dipendenze tra le variabili in gioco. Nel semplice esempio diagnostico presentato, alcune condizioni (come ad esempio quanto fosse probabile contrarre la tubercolosi avendo visitato o meno l'Asia) erano parametri di input. In realtà, in molti casi si può sapere quali variabili dipendono da quali altri, ma si ignora il "quanto". Gli algoritmi di apprendimento riescono ad inferire l'intensità dei rapporti da casistiche eventualmente disponibili.

Anche se non si ha idea di quali siano i rapporti di mutua dipendenza tra variabili (o se se ne hanno solo vaghe indicazioni), algoritmi di "structure learning" riescono a ricostruire la corretta struttura della rete, sempre che si abbia a disposizione un adeguata base dati (requisito che è quasi sempre soddisfatto nel mondo dei "big data").

Sostanzialmente le Reti Bayesiane possono essere utilizzate come potenti mezzi di "machine learning". Esse riescono ad individuare i fattori decisivi che determinano i valori di una variabile, individuare la categoria ("profiling") cui appartengono determinate osservazioni e prevedere comportamenti futuri in base all'esperienza di quelli passati.


UTILIZZI

Ad oggi, l'utilizzo delle Reti Bayesiane investe una grande quantità di ambiti e problematiche.

In diagnostica (sia essa medica o di altro tipo), Reti Bayesiane sono state sviluppate ed utilizzate per estrarre la causa più probabile di alcuni sintomi. Esse permettono di individuare più velocemente dove, con maggior probabilità, il problema possa risiedere e semplificano notevolmente il processo diagnostico.

Grandi successi sono stati ottenuti nel campo del profiling. Molti dei filtri anti-spam in forza ai gestori delle caselle di posta elettronica utilizzano sistemi esperti basati su Reti Bayesiane. Esse individuano efficacemente quali siano le mail di spam tra quelle che arrivano alla casella di posta di un utente.

Nel campo del marketing le Reti Bayesiane sono utilizzate per individuare quali elementi una campagna debba avere per ottenere un certo successo o per individuare velocemente il profilo di cliente che possa essere interessato ad un prodotto o ad una promozione. Nel e-commerce, le Reti Bayesiane suggeriscono i prodotti che più probabilmente interessano il cliente, sulla base degli acquisti che egli ha effettuato fino a quel momento e su quelli effettuati da clienti con profilo simile.

Fare previsioni è molto difficile,
specialmente se riguardano il futuro
Niels Bohr

Questo sito web utilizza i cookie per capire come viene utilizzato il sito e per permettere l'accesso all'area riservata. I cookie non permettono di identificare l'utente. I cookie sono salvati sul tuo browser e sono utlizzati per personalizzare la tua esperienza sul nostro sito web. Continuando la navigazione sul nostro sito senza modificare le impostazioni, accetti il nostro utilizzo dei cookie. Comunque potrai modificare le tue impostazioni dei cookie in qualsiasi momento.