funkcija vrednosti akcije
DEFINICIJA:
predpis, ki pri spodbujevanem učenju za vsak par stanja okolja in akcije agenta določa pričakovano vrednost skupne nagrade, ki jo agent pridobi, če začne v danem stanju in izvede dano akcijo, v nadaljevanju pa akcije izvaja glede na svojo trenutno strategijo
SINONIM:
funkcija Q


ANGLEŠČINA
TERMIN:
action-value function, Q-function



Vir: Terminološki slovar s področja umetne inteligence - Skupina avtorjev

Komentiraj slovarski sestavek