Aproximácia funkcie ohodnotení v algoritmoch Q-learning neurónovou sieťou
Autor práce: Ing. Michal ChovanecŠkoliteľ: prof. Ing. Juraj Miček, PhD.
Dátum obhajoby: 22.8.2016
Študijný program: 9.2.9 Aplikovaná informatika
Oponent 1: doc. RNDr. Katarína Bachratá, FRI, UNIZA
Oponent 2: prof. Ing. Karel Šotek, CSc., UP, Pardubice
Slovenský abstrakt:
MICHAL CHOVANEC: Aproximácia funkcie ohodnotení v algoritmoch Q-learning neurónovou
siet’ou [Dizertačná práca]
Žilinská univerzita v Žiline, Fakulta riadenia a informatiky, Katedra technickej kybernetiky.
Vedúci: prof. Ing. Juraj Miček, PhD.
FRI ŽU v Žiline, 2016
Práca sa zaoberá aproximáciou funkcie ohodnotení konania agenta, v algoritmoch Qlearning.
V priestoroch s malým počtom stavov predstavuje vhodné riešenie tabul’ka. Pre
prípady vel’kého počtu stavov je tabul’kové riešenie t’ažko vypočítatel’né. Je tak nutné použit’
aproximáciu. Vhodným kandidátom je neurónová siet’. Tradičné riešenie doprednej siete je
však nepoužitel’né z dôvodov nemožnosti takúto siet’ uˇcit’. V práci je preto venovaný priestor
neurónovej sieti bázických funkcií ktorú už je možné na daný problém trénovat’ iteračnými
metódami.
Anglický abstrakt:
MICHAL CHOVANEC: Q-function aproximation in Q-learning algortihms using neural network
[Disertation thesis]
University of Žilina, Faculty of Management Science and Informatics, Department of technical
cybernetics.
Tutor: prof. Ing. Juraj Miˇcek, PhD
FRI ŽU v Žiline, 2016
This thesis is focused on Q-value function approximation, in Q-learning algorithms. In
state spaces with small numbers of states can be solution using table used well. In cases with
large numbers of states is table solution difficult to solve. It is necessary to use approximation,
where good candidate can be neural network. Common solution, using feed forward neural
network can’t be used, because impossible to learn this network. Thesis is focused to use basis
functions neural network, which can be learned using iterations methods.
Autoreferát dizertačnej práce
Text práce