Algoritmo di apprendimento con e senza supervisione ( rete neurale )
Un algoritmo di apprendimento in una rete neurale può essere eseguito con o senza la supervisione esterna di un esperto. In un sistema di apprendimento con supervisione esterna, un esperto del domini di conoscenza fornisce al sistema la propria risposta ( o migliore azione da compiere ) sulla base delle condizioni dell'ambiente. Il sistema elabora la propria risposta e la confronta con quella indicata dall'esperto. L'analisi di casi diversi consente al sistema esperto di modificare i pesi della rete neurale per far convergere le risposte automatiche verso le risposte dell'esperto.
Nel caso dell'algoritmo di apprendimento con supervisione l'algoritmo produce una tabella input-output per associare le condizioni dell'ambiente con le migliori azioni possibili. In tale circostanza l'esperto svolge la funzione di trainer del sistema informatico. Ad esempio, un algoritmo OCR ( Optical Character Recognition ) riconosce i caratteri alfabetici in un file grafico, chiedendo conferma a un soggetto estero. Un sistema di apprendimento senza supervisione, invece, costruisce la propria base di conoscenza senza alcun confronto con le risposte dell'esperto del dominio di conoscenza.
In questo caso l'algoritmo di apprendimento senza supervisione rileva i dati ambientali tramite i dispositivi sensori. Sulla base dei dati ambientali l'agente prende la propria decisione ( azione da intraprendere ) e associa le condizioni dell'ambiente iniziale ( ex-ante ) con la propria risposta ( azione ) e con i risultati ottenuti sull'ambiente ( ex-post ). L'agente si adatta e reagisce all'ambiente circostante mediante i dispositivi attuatori ma, essendo anche l'agente una parte dell'universo, deve valutare anche le conseguenze delle proprie azioni sull'ambiente circostante, rilevando nuovamente i dati ambientali tramite i dispositivi sensori. Questo processo di apprendimento automatico consente all'agente di scartare le decisioni meno efficaci a favore di quelle più efficaci, sulla base di una determinata funzione obiettivo.