您当前的位置: > 详细浏览

棋盘局面数据标定方法研究

请选择邀稿期刊:
摘要: AlphaGo的成功使得深度学习方法在计算机博弈领域得到广泛关注。而基于深度学习模型的有监督训练依赖于大量高质量标定数据,但众多小众计算机博弈比赛棋种,存在缺少人类对局记录作为训练样本的问题,因此在使用深度学习模型前如何生成一个合理标定的局面数据集是值得研究探讨的问题。针对点格棋博弈问题,提出了一种数据哈希去重以及局面标定方法。根据不同阶段回合局面数据的特点,通过Alpha-Beta完全搜索、回溯标定、并行化MCTS算法标定以及对称扩展技巧,收集并标定不同回合数的点格棋局面样本。实验共获得了包含15000000个带标定点格棋局面样本的数据集,为基于深度学习模型的点格祺有监督训练提供了保障。此外,所提方法也为其他棋种训练数据的获取提供有价值的借鉴。

版本历史

[V1] 2018-12-13 16:12:30 ChinaXiv:201812.00097V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量1141
  •  下载量628
评论
分享