分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-04-01 合作期刊: 《计算机应用研究》
摘要: 利用出租车司机经验,提出约束深度强化学习算法(CDRL)在线计算不同时间段内OD间最快路线。首先,描述了路段经验数据库(ERSD)的提取。然后,介绍了CDRL方法,该方法主要包括两个阶段:可选择约束路段生成和深度Q-learning算法,在第一阶段,生成OD(起终点)间可选择约束路段;在第二阶段,设计深度Q-learning算法学习出租车司机的经验,并根据他们的出发时间计算给定OD间的最快路线。最后,在广州CBD进行了应用实验。结果表明,CDRL方法计算在旅行时间上,优于最短路径(SR)方法,且与最快路径(FR)方法计算路径差别不大。此外,CDRL方法在计算效率方面明显优于FR和SR方法,因此更适合OD间最快路径在线计算。