La semantica numerica della rete bayesiana
La semantica numerica della rete bayesiana è una rappresentazione quantitativa della distribuzione delle probabilità congiunte di un particolare dominio della conoscenza. Conferisce un significato alla rete bayesiana e lo esprime sotto forma di un indicatore numerico. Ad esempio, data una rete bayesiana, la semantica numerica assegna a un evento la probabilità di verificarsi.
L'analisi delle probabilità condizionate
Il grafo seguente mostra la distribuzione completa delle probabilità condizionate in un determinato dominio. Il grafo è composto da cinque nodi, ognuno dei quali è legato almeno a un altro con una relazione di dipendenza. Le probabilità dei primi nodi A e B ( nodi genitori ) sono indipendenti dagli altri. Il nodo C ha una probabilità condizionata dagli eventi A e B. Infine, i nodi C e D hanno una probabilità condizionata dal nodo C.
L'analisi semantica numerica ci consente di calcolare la probabilità di un evento senza ricorrere all'enumerazione completa. Ad esempio, è possibile calcolare la probabilità che Tom vada in vacanza, dopo essere stato promosso senza aver preso ripetizioni e senza aver studiato durante l'anno. Questo evento può essere espresso nella seguente forma:
Il risultato finale del calcolo è la probabilità (3%) dell'evento D nella situazione ipotizzata, date le premesse del problema. Utilizzando lo stesso procedimento di calcolo è possibile rispondere a qualsiasi altra domanda, all'interno del dominio di conoscenza. È sufficiente cambiare le ipotesi e l'evento finale, sostituendo le relative probabilità nel procedimento calcolo del prodotto.
Il vantaggio della semantica numerica di una rete bayesiana
La semantica numerica della rete bayesiana permette di gestire le informazioni con maggiore efficienza rispetto alla distribuzione completa delle probabilità condizionate di un dominio. Le singole tabelle CPT sono influenzate dagli status dei nodi genitori e non da quelli di tutti i nodi del dominio.
I vantaggi della semantica numerica sono i suguenti:
- Rappresentazione semplificata. La rappresentazione del dominio è più semplice, compatta e non presenta le ridondanze della tabella della distribuzione completa.
- Accesso più rapido. L'accesso alle informazioni della rete è più rapido. Si riduce la complessità temporale dell'algoritmo.
Esempio
Ad esempio, l'enumerazione completa delle probabilità condizionate in un'unica tabella è la seguente:
Come si può notare, sono necessarie 32 combinazioni ( righe ) per memorizzare tutti i possibili casi che possono verificarsi nel dominio di riferimento. Per ciascuna riga sono indicate le relative probabilità condizionate. Per accedere all'ultima combinazione della tabella ( F F F F F ) sono necessarie 32 operazioni di lettura dei record.
Con la semantica numerica, invece, la stessa informazione della tabella precedente può essere ottenuta in soli 5 nodi nella rete bayesiana.