您当前的位置: > 详细浏览

深度强化学习复原多目标航迹的TOC奖励函数

请选择邀稿期刊:
摘要: 针对航迹探测领域中探测器获得的目标地理位置通常是同一帧下无法区分的多目标场景,需要利用目标位置信息还原各航迹并区分各目标的问题进行研究,提出采用深度强化学习方法复原目标航迹的方法。依据目标航迹的物理特点,提取数学模型,结合目标航迹的方向、曲率等提出轨迹曲率圆(trajectory osculating circle,TOC)奖励函数,使深度强化学习能够有效复原多目标航迹并区分各目标。首先描述多目标航迹复原问题,并将问题建模成深度强化学习能够处理的模型;结合TOC奖励函数对多目标航迹复原问题进行实验;最后给出该奖励函数的数学推导和物理解释。实验结果表明,TOC奖励函数驱动下的深度强化网络能够有效还原目标的航迹,在航向和航速方面切合实际目标航迹。

版本历史

[V1] 2019-05-10 10:28:40 ChinaXiv:201905.00021V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量2996
  •  下载量1428
评论
分享