Termania - Rezultati iskanja

učenje mimo strategije

spodbujevano učenje, pri katerem agent optimizira drugo strategijo od tiste, ki jo uporablja za izbiro akcij
en off-policy learning

Več ... umetna inteligenca sl

učenje s časovno razliko

spodbujevano učenje, pri katerem agent po izvedbi akcije posodobi vrednost stanja v smeri vrednosti naslednjega stanja
en temporal difference learning

Več ... umetna inteligenca sl

učenje s strategijo

spodbujevano učenje, pri katerem agent optimizira tisto strategijo, ki jo uporablja tudi za izbiro akcij
en on-policy learning

Več ... umetna inteligenca sl

nezmožnost zaznavanja pomembnih dogodkov v prihodnosti igre, ki se pojavi pri nasprotniškem iskanju, ko zaradi časovne omejitve agent gradi drevo igre le do omejene globine in ne more predvideti celotnega razpleta izbranih potez
en horizon effect

Več ... en-sl veliki en