OKPEDIA MINIMAX

Expectiminimax

L'expectiminimax è una versione dell'algoritmo minimax applicata in condizioni di incertezza. Nell'algoritmo di expectiminimax ( minimimax atteso ) l'albero di gioco è caratterizzato dalla presenza di nodi di casualità, ossia da nodi il cui valore non è determinato con certezza. Ogni nodo di casualità è, infatti, legato a una variabile stocastica ( variabile casuale ) che può assumere diversi valori. In tali circostanze un agente razionale deve calcolare il valore atteso dal nodo, tenendo conto della distribuzione delle probabilità per ogni valore possibile del nodo. Ad esempio, nel seguente albero di gioco i nodi di casualità sono indicati con il colore rosso.

EXPECTMINIMAX

L'agente blu ( MAX ) ha l'obiettivo di massimizzare il valore del nodo terminale. Viceversa, l'agente verde ( MINI ) ha l'obiettivo di minimizzarlo. Il primo nodo di casualità ( A ) può assumere il valore 5 nel 10% dei casi ( p=0,1 ) e il valore 2 nel 90% ( p=0,9 ) dei casi. Il valore atteso del nodo di casualità è dato dalla somma dei valori possibili pesati in base alla loro probabilità. In questo caso, il valore atteso del nodo A è pari a 0,5+1,8 ossia 2,3. Il secondo nodo di casualità ( B ) può assumere il valore 2 nel 90% dei casi e il valore 3 nel 10% dei casi. Il valore atteso del nodo di casualità B è pari a 1,8 + 0,3 ossia 2,2. In conclusione, al giocatore MAX conviene scegliere il nodo di casualità A poiché gli garantisce una utilità attesa maggiore ( 2,3 ) rispetto al nodo di casualità B ( 2,1 ).

https://www.okpedia.it/expectiminimax


Segnala un errore o invia un suggerimento per migliorare la pagina


  1. teoria dei giochi
  2. gioco / giocatori
  3. interazione strategica
  4. tipi di gioco
  5. rappresentazione del gioco
  6. strategia di gioco
  7. payoff
  8. gioco a somma zero
  9. gioco a somma costante
  10. albero di gioco
  11. equilibrio di Nash
  12. dilemma del prigioniero
  13. minimax
  14. induzione a ritroso
  15. effetto orizzonte
  16. gioco stocastico
  17. minacce / promesse
  18. reputazione
  19. folk theorem
  20. trigger strategy
  21. il gioco del pollo

FacebookTwitterLinkedinLinkedin