基于目标的域随机化方法在机器人操作方面的研究

作者： 张夏禹 ¹ 陈小平 ¹
作者单位：

1. 中国科学技术大学
提交时间：2022-05-18 16:08:25

摘要: 使用强化学习解决机器人操作问题有着诸多优势，然而传统的强化学习算法面临着奖励稀疏的困难，且得到的策略难以直接应用到现实环境中。为了提高策略从仿真到现实迁移的成功率，提出了基于目标的域随机化方法：使用了基于目标的强化学习算法对模型进行训练，可以有效的应对机器人操作任务奖励稀疏的情况，得到的策略可以在仿真环境下良好运行，于此同时在算法中还使用了目标驱动的域随机化的方法，在提高策略泛用性以及克服仿真和现实环境之间的差距上有着良好的效果，仿真环境下的策略容易迁移到现实环境中并成功执行。结果表明，使用了基于目标的域随机化方法的强化学习算法有助于提高策略从仿真到现实迁移的成功率。

强化学习域随机化机器人操作仿真到现实迁移

期刊： 计算机应用研究
分类： 计算机科学 >> 计算机科学的集成理论
引用： ChinaXiv:202205.00123 (或此版本 ChinaXiv:202205.00123V1)
DOI:10.12074/202205.00123V1
CSTR:32003.36.ChinaXiv.202205.00123.V1
推荐引用方式： 张夏禹,陈小平.(2022).基于目标的域随机化方法在机器人操作方面的研究.计算机应用研究.[ChinaXiv:202205.00123] (点此复制)

版本历史

[V1]

2022-05-18 16:08:25

ChinaXiv:202205.00123V1

下载全文

相关论文推荐

1. 面向低资源语言机器翻译的平行语料句对齐评分	2024-06-05
2. Turing’s thinking machine and ’t Hooft’s principle of superposition of states	2024-05-14
3. 恶意代码SCMP分类方法框架与风险行为多标签机制	2024-05-09
4. SteganoDDPM: A high-quality image steganography self-learning method using diffusion model	2024-04-23
5. 引导大语言模型生成计算机可解析内容	2024-04-21
6. 基于大语言模型的中英文整合复杂性建模研究	2024-04-10
7. 大模型与标准文献知识库的融合应用探索	2024-04-10
8. 简体中文LIWC2024(SCLIWC2024)词典的修订与验证	2024-04-09
9. 引导大语言模型生成计算机可解析内容	2024-04-07
10. 基于 Python 中 MeCab 库对日语文章进行文本分析处理实现	2024-04-04


公开评论匿名评论仅发给作者