Contribution à des ouvrages collectifs (Parties d’ouvrages)
Bayesian Reinforcement Learning
VLASSIS, Nikos; Ghavamzadeh, Mohammad; Mannor, Shie et al.
2012In Wiering, Marco; van Otterlo, Martijn (Eds.) Reinforcement Learning: State of the Art
Peer reviewed
 

Documents


Texte intégral
BRLchapter.pdf
Postprint Auteur (201.27 kB)
Télécharger

Tous les documents dans ORBilu sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Résumé :
[en] This chapter surveys recent lines of work that use Bayesian techniques for reinforcement learning. In Bayesian learning, uncertainty is expressed by a prior distribution over unknown parameters and learning is achieved by computing a posterior distribution based on the data observed. Hence, Bayesian reinforcement learning distinguishes itself from other forms of reinforcement learning by explic- itly maintaining a distribution over various quantities such as the parameters of the model, the value function, the policy or its gradient. This yields several benefits: a) domain knowledge can be naturally encoded in the prior distribution to speed up learning; b) the exploration/exploitation tradeoff can be naturally optimized; and c) notions of risk can be naturally taken into account to obtain robust policies.
Centre de recherche :
Luxembourg Centre for Systems Biomedicine (LCSB): Machine Learning (Vlassis Group)
Disciplines :
Sciences informatiques
Identifiants :
UNILU:UL-CHAPTER-2012-428
Auteur, co-auteur :
VLASSIS, Nikos ;  University of Luxembourg > Luxembourg Centre for Systems Biomedicine (LCSB)
Ghavamzadeh, Mohammad
Mannor, Shie
Poupart, Pascal
Co-auteurs externes :
yes
Langue du document :
Anglais
Titre :
Bayesian Reinforcement Learning
Date de publication/diffusion :
2012
Titre de l'ouvrage principal :
Reinforcement Learning: State of the Art
Editeur scientifique :
Wiering, Marco
van Otterlo, Martijn
Maison d'édition :
Springer
ISBN/EAN :
978-3-642-27645-3
Pagination :
359-386
Peer reviewed :
Peer reviewed
Disponible sur ORBilu :
depuis le 04 juillet 2013

Statistiques


Nombre de vues
235 (dont 13 Unilu)
Nombre de téléchargements
3975 (dont 8 Unilu)

citations Scopus®
 
57
citations Scopus®
sans auto-citations
57
OpenCitations
 
23
citations OpenAlex
 
60

Bibliographie


Publications similaires



Contacter ORBilu