La costruzione della rete bayesiana

Come costruire una rete bayesiana. Una rete bayesiana è la rappresentazione di un dominio di conoscenza. Uno dei primi passi da compiere per la sua costruzione è, pertanto, l'analisi del dominio che deve rappresentare. Per disegnare una rete bayesiana efficiente ed efficace, è necessario seguire i seguenti passi operazionali:

  1. Elenco dei nodi. Elencare tutti i fattori del problema e trasformarli in variabili. Ogni variabile identifica un nodo della rete bayesiana. Si individuano i nodi rilevanti di un problema e si eliminano quelli non rilevanti.
    la selezione dei nodi rilevanti del problema
  2. Individuazione dei nodi-genitori. Individuare le variabili che influenzano altre variabili del problema. I nodi genitori hanno maggiore importanza rispetto ai nodi figli, poiché condizionano gli eventi del dominio. Si eliminano i nodi-foglie ( nodi terminali ) e si lasciano soltanto i nodi-genitori tra quelli rilevanti.
    la selezione dei nodi-genitori rilevanti nella rete bayesiana, si eliminano i nodi-rilevanti foglie
  3. Individuazione dei nodi-radice ( cause ). Selezionare tra i nodi genitori quelli che non sono influenzati da altre variabili del problema. Questi nodi sono detti nodi-radice o nodi-causa.
    la selezione dei nodi-radice o nodi-causa, tra i nodi-genitori rilevanti, come punto di partenza per la costruzione della rete bayesiana
  4. Lo sviluppo della rete. A partire dai nodi-radice del problema, si può sviluppare la rete bayesiana, seguendo le relazioni padre-figlio, fino agli ultimi nodi del problema ( nodi-foglie ). A ciascun nodo della rete sono associate le probabilità condizionali di esistenza. Il risultato finale è una rete ad elevata efficienza computazionale.

Un esempio pratico

Analizziamo un semplice dominio. Tom può andare in vacanza e/o ricevere un regalo dei genitori. Questi eventi sono influenzati dal fatto che Tom sia promosso, o abbia studiato durante l'anno, Tom può anche prendere ripetizioni. Questo dominio è molto semplice ma può essere rappresentato in vari modi e in molteplici reti bayesiane. Per costruire la rete, come primo passo si compila l'elenco delle variabili del problema.

l'elenco delle variabili ( nodi ) del problema ( dominio )

Il secondo passo consiste nell'analisi delle relazioni di dipendenza tra le variabili. Per indicare una relazione di dipendenza si può utilizzare una freccia, in cui il nodo-genitore ( variabile indipendente ) punta verso il nodo figlio ( variabile dipendente ).

l'analisi delle relazioni di dipendenza tra le variabili

A questo punto dobbiamo individuare i nodi-radice, ossia le cause che non sono influenzate da altre variabili. Nel nostro esempio, gli unici nodi che presentano queste caratteristiche sono gli eventi "Tom prende ripetizioni" e "Tom studia". Una volta individuati, possiamo iniziare a costruire i primi nodi della rete, associando loro le relative probabilità di esistenza.

i primi nodi radice della rete bayesiana e le probabilità di esistenza

Per continuare a costruire la rete si aggiungono i nodi-figli. In questo caso, nel nostro esempio i due nodi-radice hanno il medesimo nodo-figlio ( Tom viene promosso ). Gli eventi sul nodo-figlio sono influenzati da quelli dei nodi-genitori. Possiamo, quindi, associare al nodo-figlio la tabella CPT delle probabilità condizionate di esistenza.

alla rete sono aggiunti i nodi-figli

Il processo viene ripetuto a partire dal nodo figlio. Quali variabili sono influenzate dal fatto che Tom sia promosso? Sappiamo che quest'evento influisce sulle possibilità di Tom di andare in vacanza e/o di ricevere un regalo. Possiamo, quindi, aggiungere alla rete gli altri nodi-figli. A ciascuno di essi viene associata la tabella delle probabilità condizionata nei confronti del nodo genitore ( Tom viene promosso ).

la rete bayesiana completa

Il processo di costruzione della rete si conclude. Gli ultimi nodi-figli non influenzano altre variabili. Questo significa che siamo giunti ai nodi foglie ( nodi terminali ) della rete bayesiana.

Per semplificare la rete è preferibile concentrare l'attenzione soltanto sulle relazioni dirette. È importante sottolineare questo aspetto, poiché le probabilità condizionate dei nodi sono influenzate soprattutto dai suoi nodi genitori ( nessi causali diretti ) e non anche dai nodi precedenti ( nessi causali indiretti ). Questo consente di ridurre la struttura del problema, evitare le ridondanze e semplificare la rappresentazione del problema. Nella figura seguente viene mostrato il caso di una rete bayesiana inefficiente e ridondante:

esempio di rete bayesiana non efficiente, con nessi indiretti ridondanti

Ad esempio, se Tom prende ripetizioni ha maggiori probabilità di essere promosso e, quindi, di andare in vacanza. Lo stesso può dirsi se Tom studia. È però ridondante aggiungere questi nessi indiretti. Per rendere più snella la rappresentazione, è sufficiente considerare che le ripetizioni e lo studio aumentano le probabilità di Tom di essere promosso e la promozione aumenta la probabilità di andare in vacanza.

https://www.okpedia.it/costruzione_rete_bayesiana


Segnala un errore o invia un suggerimento per migliorare la pagina


note


Un esempio di costruzione inefficiente della rete

Se avessimo iniziato a costruire la rete bayesiana a partire dai nodi-foglie, ossia dagli effetti o dai sintomi, avremmo disegnato una curva meno efficiente. Ad esempio, proviamo a progettare la rete dai nodi terminali, chiedendoci quali sono le variabili che influenzano la possibilità di Tom di ricevere un premio. Potremmo essere indotti a pensare che Tom riceva un premio se viene promosso ma anche se, semplicemente, si impegna nello studio o sacrifica parte del suo tempo libero per andare a ripetizioni.

un esempio di rete bayesiana non efficiente, costruita a partire dai nodi terminali

Così facendo costruiamo una rete molto più complessa, inefficiente e ridondante. Per associare la tabella CPT delle probabilità condizionate sul nodo terminale ( Tom riceve un premio ) è necessario considerare tre nodi genitori anziché uno. Due di questi nodi genitori influenzano ( Tom prende ripetizioni e Tom studia ) anche l'esito del terzo ( Tom viene promosso ). È evidente che, a parità di efficacia, la rete bayesiana diventa notevolmente più complessa rispetto alla precedente. In conclusione, una rete progettata dai sintomi ( diagnosi ) è meno efficiente rispetto a quella progettata a partire dalle cause.



FacebookTwitterLinkedinLinkedin