OKPEDIA PIANIFICAZIONE

Pianificazione online

La pianificazione online è un tipo di pianificazione in cui l'agente razionale opera in un ambiente sconosciuto. La pianificazione online è detta anche ripianificazione. In una pianificazione online l'agente razionale effettua un monitoraggio dell'azione e dei suoi effetti. Nel mondo reale non è sufficiente eseguire un'azione ( fase esecutiva ) ma, in molti casi, è necessario verificare che l'azione abbia prodotto gli effetti desiderati ( fase di verifica ). Nello schema seguente è rappresentata una ripianificazione. L'azione a2 non conduce dallo stato S2 allo stato S3, in quanto l'agente riscontra uno stato imprevisto S5. A questo punto l'agente annulla il precedente piano di azione ( piano 1 ) ed elabora una nuova ripianificazioe per determinare quale sequenza di azioni gli consente di raggiungere l'obiettivo O1 dalla situazione corrente S5.

PIANIFICAZIONE ONLINE

La pianificazione online è un metodo comunemente utilizzato dagli esseri umani per risolvere i problemi. Ad esempio la seguente pianificazione di contingenza è composta da una sequenza di azioni condizionate. Se il bicchiere è pieno d'acqua e c'è acqua nel bicchiere ( precondizioni ), la persona può bere ( azioni ) l'acqua nel bicchiere.

PIANIFICAZIONE SENZA RIPIANIFICAZIONE ( PIANIFICAZIONE DI CONTINGENZA SEMPLICE )

Si tratta di una semplice pianificazione di contingenza che svolge egreggiamente il suo lavoro fin quando gli effetti delle azioni sono quelli previsti e non subentrano fattori esterni, eventi aleatori e imprevisti. Ad esempio, una persona si accorge della presenza del bicchiere pieno d'acqua sul tavolo e lo prende per berlo. Mentre sta eseguendo l'azione ( bere ) si verifica un imprevisto, il bicchiere gli sfugge di mano e si rompe in mille pezzi e il pavimento si bagna d'acqua. In una pianificazione di contingenza l'agente razionale non si rende conto del problema, pensa di aver bevuto e nemmeno si accorge dei pezzi di vetro e dell'acqua per terra. Si tratta di un comportamento meccanico e poco intelligente da parte dell'agente razionale. Poche persone si comporterebbero allo stesso modo.

PIANIFICAZIONE CON IMPREVISTO DURANTE L'ESECUZIONE

Per affrontare questi imprevisti è necessario eseguire una ripianificazione ( pianificazione online ) che consente all'agente razionale di verificare gli effetti delle azioni, di osservare l'ambiente ed eventualmente prendere decisioni non previste nella sequenza di azioni di contingenza. Ad esempio, l'agente si accorge della presenza dei vetri e dell'acqua sul pavimento ed esegue delle azioni ( subroutine ) per riportare tutto alla normalità.

Dopo aver ripulito il pavimento, l'agente razionale ha un altro problema da risolvere. Il monitoraggio dell'effetto della precedente azione ( bere il bicchiere d'acqua ) ha restituito un segnale negativo. L'agente razionale sa di non aver bevuto. Non vedendo altri bicchieri sul tavolo, ne cerca uno nella credenza, lo prende e lo pone sul tavolo.

RIPIANIFICAZIONE

A questo punto la sequenza di azioni torna all'inizio. L'agente osserva un bicchiere d'acqua vuoto sul tavolo e ha ancora l'obiettivo di bere. Prende la bottiglia d'acqua, versa l'acqua nel bicchiere e, infine, beve l'acqua. Questa volta il bicchiere non gli cade di mano e non si presentano altri imprevisti. Il monitoraggio finale dell'azione restituisce un segnale di feed-back positivo. L'agente razionale ha raggiunto il suo obiettivo.

https://www.okpedia.it/pianificazione_online


Segnala un errore o invia un suggerimento per migliorare la pagina


note


  • Efficienza. Nella pianificazione online l'agente razionale elabora una pianificazione iniziale sulle principali situazioni di contingenza lungo il percorso da uno stato iniziale a uno stato finale ( obiettivo ). Il piano iniziale è composto soltanto da un sottoinsieme di contingenze possibili e non da tutte. Durante l'esecuzione del piano monitora gli effetti delle singoli azioni e le condizioni di ambiente. Quando l'agente rileva uno stato diverso rispetto al piano di azione, elabora una nuova pianificazione ( ripianificazione ) per generare un nuovo piano dallo stato corrente, quello in cui si trova, a quello finale. Una volta ultimata la nuova pianificazione, l'agente torna a eseguirla. Questo approccio consente di limitare le risorse e il tempo della pianificazione iniziale, evitando di considerare le situazioni ipotetiche meno probabili. Quando l'agente rileva una situazione non prevista dalla pianificazione di origine, l'agente torna alla pianificazione per considerare un nuovo percorso ( piano ) di azioni.
  • Monitoraggio. Il monitoraggio consente all'agente razionale di verificare gli effetti delle azioni tramite l'analisi dei feed-back. In questo modo l'agente mette sempre in dubbio se stesso e può rilevare subito l'efficacia o meno dell'ultima azione eseguita. Nel grafico seguente l'agente esegue un piano ( piano 1 ). Quando si trova nello stato S2 esegue l'azione a2 che, a differenza rispetto a quanto previsto dal piano, non conduce alla situazione S3 bensì alla situazione imprevista S5. L'agente può accorgersi del problema tramite l'analisi del feed-back dell'azione a2. Ad esempio, se per andare in ufficio (S3) da casa (S2) devo prendere l'automobile (a2), non è detto che questa mi conduca sul luogo di lavoro. L'automobile potrebbe guastarsi o potrei bucare una gomma. Nel primo caso (automobile guasta) l'agente è costretto a ripianificare altre azioni per arrivare al lavoro ( es. prendere i mezzi pubblici o chiamare un meccanico ). Nel secondo caso ( gomma bucata ) è costretto a ripianificare altre azioni ( es. sostituire la gomma con la ruota di scorta ). In entrambi i casi l'aver preso l'automobile (a2) non ha condotto alla situazione prevista (S3) a causa del presentarsi di eventi aleatori esogeni imprevisti. Indipendentemente dal fatto che gli eventi siano spiegabili o meno, l'agente razionale deve ripianificare un'altra sequenza di azioni a partire dalla situazione corrente (S5).
  • Monitoraggio online delle precondizioni. Il monitoraggio non è soltanto una mera analisi dei feed-back delle azioni ma anche qualcosa di più ampio. Il monitoraggio può essere esteso allo studio delle precondizioni delle azioni. Durante l'esecuzione del piano le condizioni di ambiente potrebbero mutare, rendendo non più possibili alcune azioni. Ad esempio, se per giocare a tennis è necessario verificare che non piova (a1), recarsi al centro sportivo (a2) e giocare (a3), potrebbe non piovere quando l'agente compie l'azione a1 ma iniziare subito dopo, mentre l'agente si reca al centro sportivo (a2). La pioggia elimina una precondizione dell'azione a3 ( giocare ). Una volta arrivato al centro sportivo (a2) l'agente rileva che ha piovuto e, quindi, torna a casa.
    MONITORAGGIO ONLINE DELLE PRECONDIZIONI
    Dando per scontato che si tratti di un campo da tennis all'aperto, sarebbe irrazionale giocare su un campo bagnato o mentre piove, soltanto perché inizialmente non pioveva. È un esempio banale ma rende l'idea sull'importanza dell'analisi continua delle precondizioni. Nel corso del tempo sono mutate le condizioni di ambiente e le precondizioni delle azioni potrebbero non essere più soddisfatte.
  • Monitoraggio obiettivo. Durante la pianificazione potrebbero verificarsi eventi esogeni aleatori che costringono l'agente a variare l'obiettivo finale. In questi casi la ripianificazione viene eseguita anche se non si rilevano scostamenti sul piano di azione corrente. Se l'obiettivo finale della pianificazione non è più raggiungibile, l'agente deve necessariamente ripianificare le azioni su un obiettivo sostitutivo o rinunciare all'obiettivo.
    RIPIANIFICAZIONE OBIETTIVO
    Ad esempio, se l'agente razionale deve comprare il vino bianco e l'ultima bottiglia di vino bianco viene venduta ad altri durante la pianificazione, l'agente deve cercare un nuovo obiettivo ( es. vino rosso ) oppure rinunciare all'acquisto o cambiare negozio. In questi casi si verifica una ripianificazione dell'obiettivo.
  • Monitoraggio piano. Il monitoraggio è utilizzato anche per verificare che il piano sia ancora efficace durante la fase di esecuzione ed eventualmente per analizzare la presenza di soluzioni alternative più efficienti. Durante l'esecuzione del piano le variabili di ambiente possono variare, rendendo impossibili alcune azioni del piano iniziale ( es. giocare a tennis se piove ) oppure aprendo nuove possibilità di azione che inizialmente non erano previste. Ad esempio, l'agente razionale sta eseguendo il piano e si trova nello stato S2. A questo punto dovrebbe compiere l'azione a2 per eseguire il piano iniziale. Nello stato S2 l'agente razionale si accorge che è possibile seguire anche un percorso alternativo S3-O1 fino all'obiettivo tramite l'azione a5. È quindi razionale apportare una correzione al piano originale.
    RIPIANIFICAZIONE SU PIANO ALTERNATIVO
    Inizialmente l'azione a5 non era prevista o era inattuabile, altrimenti sarebbe stata prescelta come prima pianificazione. Dopo aver pianificato la sequenza di azioni a1-a2-a3-a4, ossia la pianificazione iniziale, variano le condizioni di di ambiente e l'azione a5 torna ad essere disponibile. Ad esempio, durante l'esecuzione del piano viene riaperta una scorciatoia ( es. una strada a senso unico viene momentaneamente aperta a doppio senso di circolazione ) che consente di arrivare prima all'obiettivo finale (O1). Grazie al monitoraggio online del piano in corso e dei piani alternativi a partire dallo stato corrente, l'agente rileva questa possibilità ed esegue una ripianificazione online della sequenza di azioni, scegliendo il piano più efficiente. Il monitoraggio in avanti del piano consente anche di verificare l'efficacia del piano di azione. Nel corso della fase di esecuzione un'azione inizialmente possibile potrebbe non esserlo più a causa del mutare delle variabili di ambiente. La pianificazione originale cessa di essere efficace. In questi casi l'agente rielabora la pianificazione ( ripianificazione ) per trovare un percorso alternativo.

    Ad esempio, nel piano originale ( piano 1 ) l'azione a3 cessa di essere possibile. Una volta giunto allo stato S3 l'agente non può più andare avanti. L'agente razionale ricerca altri percorsi alternativi e, infine, sceglie quello (a5-a6-a7) che consente di raggiungere il medesimo obiettivo ( O1 ). Ad esempio, se l'agente razionale deve passare da una stanza a un'altra e la porta è aperta, elabora un piano per muoversi senza aprire la porta. Durante l'esecuzione qualcuno chiude la porta. In una pianificazione di contingenza semplice l'agente andrà a sbattere contro la porta in quanto inizialmente era aperta. In una pianificazione online l'agente rielabora la sequenza di azioni, modifica il percorso oppure riapre la porta.
  • Ambiente non deterministico. La pianificazione online è particolrmente idonea in situazione di ambiente non deterministico, quando sussiste una relazione incerta tra le cause e gli effetti. In un ambiente non deterministico le azioni non producono sempre gli effetti attesi. Prevale una situazione di incertezza. In tali circostanze sono di fondamentale importanza il monitoraggio continuo dell'ambiente e l'analisi dei feed-back dopo l'azione. L'agente razionale è costretto a ripianificare continuamente la sequenza di azioni ( pianificazione online ).

Pianificazione ( agente razionale )


FacebookTwitterLinkedinLinkedin