State Distribution-aware Sampling for Deep Q-learning

发表时间:2018(Neural Processing Letters 2019) 文章要点:这篇文章认为之前的experience replay的方法比如PER没有将transition的分布情况考虑在内,于是提出一个新的experience replay的方法,将occurrence frequ
posted @ 2024-02-24 01:04  initial_h  阅读(12)  评论(0编辑  收藏  举报