Iskani niz je bil najden v DRUGI VSEBINI:
Več ...
umetna inteligenca
sl
nagrada
pri spodbujevanem učenju številski povratni signal iz okolja, ki ga agent prejme za izvedbo akcije in katerega vrednost predstavlja stopnjo ugodnosti spremembe stanja okolja
en reward