ChinaXiv.org 中国科学院科技论文预发布平台

注册登录

EN | 中文

按提交时间

2018
1

按主题分类

计算机科学的集成理论
1

按作者

夏宗涛
1
秦进
1

按机构

贵州大学计算机科学与技术学院
1

当前资源共 1条

隐藏摘要

点击量

时间

您选择的条件: 夏宗涛

1. ChinaXiv:201810.00021
下载全文

一种深度Q网络的改进算法

分类：计算机科学 >> 计算机科学的集成理论提交时间： 2018-10-11 合作期刊: 《计算机应用研究》

夏宗涛秦进

摘要：深度Q网络存在严重的过估计问题，导致智能体寻找最优策略的能力下降。为了缓解深度Q网络中存在的过估计问题，提出一个更正函数用于对深度Q网络中的评价函数进行改进，当选择的动作为最优动作时更正函数为1，不对当前状态—动作值进行修改，当选择的动作不是最优动作时更正函数小于1，缩小当前状态—动作值，从而使得最优状态—动作值与非最优状态—动作值的差异增大，减少过估计问题的影响。实验证明改进的算法在Playing Atari 2600视频游戏以及OpenAI Gym中取得了更好的性能。说明改进的算法比深度Q网络寻得了更优的策略。

点击量 2152 下载量 1111 评论 0

友情链接: PubScholar 哲学社会科学预印本

运营单位: 中国科学院文献情报中心
制作维护：中国科学院文献情报中心知识系统部
邮箱: eprint@mail.las.ac.cn
地址：北京中关村北四环西路33号

招募预印本评审专家许可声明法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心