Enhancing stochasticity in reinforcement learning schemes
Φόρτωση...
Ημερομηνία
Συγγραφείς
Likas, A
Kontoravdis, D.
Stafylopatis, A.
Τίτλος Εφημερίδας
Περιοδικό ISSN
Τίτλος τόμου
Εκδότης
Περίληψη
Τύπος
Είδος δημοσίευσης σε συνέδριο
Είδος περιοδικού
peer reviewed
Είδος εκπαιδευτικού υλικού
Όνομα συνεδρίου
Όνομα περιοδικού
Journal of Intelligent Systems
Όνομα βιβλίου
Σειρά βιβλίου
Έκδοση βιβλίου
Συμπληρωματικός/δευτερεύων τίτλος
Περιγραφή
The paper develops reinforcement algorithms for networks of stochastic units which select their output based on a distribution whose dependence on the controllable parameters (weights) of the network is not deterministic. A special case of the proposed schemes concerns those applied to Normal/Bernoulli units, which are binary units with two stochastic levels. Both REINFORCE algorithms as well as algorithms not belonging to the REINFORCE class have been developed. All schemes are designed to exploit the two parameters of a normal distribution in order to explore discrete domains. The ability of the proposed algorithms to perform efficient exploration is tested in a number of optimization problems concerning the maximization of a set of functions defined on binary domains. Particular emphasis has been given on deriving schemes having the property of sustained exploration. Obtained results indicate the superiority of the reinforcement schemes applied to Normal/Bernoulli units over reinforcement schemes applied to single-parameter Bernoulli units.
Περιγραφή
Λέξεις-κλειδιά
Θεματική κατηγορία
Παραπομπή
Σύνδεσμος
Γλώσσα
en
Εκδίδον τμήμα/τομέας
Όνομα επιβλέποντος
Εξεταστική επιτροπή
Γενική Περιγραφή / Σχόλια
Ίδρυμα και Σχολή/Τμήμα του υποβάλλοντος
Πανεπιστήμιο Ιωαννίνων. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής