棋盘局面数据标定方法研究

作者： 丁濛 ^1,2 张亦鹏 ^1,2 李淑琴 ^1,2
作者单位：

1. 北京信息科技大学计算机学院

2. 北京信息科技大学感知与计算智能联合实验室
提交时间：2018-12-13

摘要: AlphaGo的成功使得深度学习方法在计算机博弈领域得到广泛关注。而基于深度学习模型的有监督训练依赖于大量高质量标定数据，但众多小众计算机博弈比赛棋种，存在缺少人类对局记录作为训练样本的问题,因此在使用深度学习模型前如何生成一个合理标定的局面数据集是值得研究探讨的问题。针对点格棋博弈问题，提出了一种数据哈希去重以及局面标定方法。根据不同阶段回合局面数据的特点，通过Alpha-Beta完全搜索、回溯标定、并行化MCTS算法标定以及对称扩展技巧，收集并标定不同回合数的点格棋局面样本。实验共获得了包含15000000个带标定点格棋局面样本的数据集，为基于深度学习模型的点格祺有监督训练提供了保障。此外，所提方法也为其他棋种训练数据的获取提供有价值的借鉴。

数据标定点格棋棋盘局面计算机博弈

期刊： 计算机应用研究
分类： 计算机科学 >> 计算机科学的集成理论
引用： ChinaXiv:201812.00097 (或此版本 ChinaXiv:201812.00097V1)
DOI:10.12074/201812.00097V1
CSTR:32003.36.ChinaXiv.201812.00097.V1
推荐引用方式： 丁濛,张亦鹏,李淑琴.(2018).棋盘局面数据标定方法研究.计算机应用研究.[ChinaXiv:201812.00097] (点此复制)

版本历史

[V1]

2018-12-13 16:12:30

ChinaXiv:201812.00097V1

下载全文

相关论文推荐

1. 引导大语言模型生成计算机可解析内容	2024-04-21
2. 基于大语言模型的中英文整合复杂性建模研究	2024-04-10
3. 大模型与标准文献知识库的融合应用探索	2024-04-10
4. 简体中文LIWC2024(SCLIWC2024)词典的修订与验证	2024-04-09
5. 引导大语言模型生成计算机可解析内容	2024-04-07
6. 基于 Python 中 MeCab 库对日语文章进行文本分析处理实现	2024-04-04
7. 一种基于能量-信息转换的智能测度	2024-03-30
8. 基于大语言模型的中庸思维对心理健康的影响机制研究——道德中心性的中介作用	2024-03-23
9. 收入分配不平等对心理健康的影响机制研究——道德中心性的中介作用	2024-03-23
10. 基于文本数据增强的生活满意度预测模型优化	2024-02-29


公开评论匿名评论仅发给作者