Apprendimento agente razionale

L'apprendimento dell'agente razionale è un processo che consente all'agente stesso di migliorare la sua conoscenza dell'ambiente operativo e indirettamente di aumentare l'efficacia delle proprie azioni nel raggiungimento dell'obiettivo prefissato. Gli algoritmi di apprendimento, detti learning algorithm o learning suboroutine, sono componenti separati da quelli decisionali (performance algorithm). Le due tipologie di algoritmi svolgono funzioni diverse.

Algoritmo di apprendimento. Il principale scopo degli algoritmi di apprendimento (learning subroutine) è di aumentare la conoscenza dell'ambiente operativo sulla base dell'osservazione (sensori) o dell'esperienza (feedback) dell'agente stesso.
Algoritmo decisionale. Il principale scopo degli algoritmi decisionali (performance algorithm) è di prendere la decisione migliore, quella in grado di massimizzare l'utilità attesa, sulla base della conoscenza acquisita da parte dell'algoritmo. In sintesi, l'algoritmo decisionale è l'elemento operativo dell'agente razionale.

Il risultato ottenuto dalle decisioni è una importante informazione di feedback per l'algoritmo di apprendimento, a cui spetta il compito di valutare la performance della scelta e di alimentare il processo di apprendimento per consentire all'algoritmo decisionale di non ricommettere gli stessi errori.

Il processo di apprendimento è un processo ciclico. L'algoritmo decisionale prende in input sia le informazioni provenienti dall'ambiente esterno, tramite i sensori, e sia le informazioni provenienti dalla base di conoscenza. Il risultato delle decisioni è successivamente elaborato come input dall'algoritmo di apprendimento, tramite l'analisi dei feedback, che provvede a modificare la base di conoscenza.

Il sistema di apprendimento basato su due algoritmi è sub-ottimale in quanto l'apprendimento potrebbe essere limitato alla conoscenza maturata. In altri termini, se l'agente continuasse ad eseguire le azioni che reputa migliori sulla base della propria conoscenza potrebbe smettere di fare esperienza. E' quindi necessario includere un algoritmo di esplorazione che consenta all'agente di compiere azioni diverse da quelle conosciute al fine di poterle valutare. Tale algoritmo svolge la funzione di generatore di problemi.

https://www.okpedia.it/apprendimento_agente_razionale

Hai una domanda? Scrivila nei commenti e ti risponderemo qui sulla pagina.