科技成果

阅读数: 1950

成果名称: 一种深度强化学习的实时在线路径规划方法

成果登记号: 9612020Y2589

第一完成单位: 西北工业大学

联 系 人: 秦飞

成果类型: 应用技术

成果体现形式 : 新技术

技术领域: 电子信息

应用行业: 信息传输、软件和信息技术服务业

成果简介:

本发明提出了一种深度强化学习的实时在线路径规划方法,利用深度学习方法来得到图像的高层语义信息,并利用强化学习的方法来完成从环境的端到端的实时场景的路径规划。

训练过程中将在环境中采集到的图像信息作为当前状态带入场景解析网络中得到解析结果,然后将解析结果输入到设计好的深度循环神经网络中,通过训练得到特定场景中智能体的每步决策动作,进而得到最优的完整路径。

实际应用过程,利用训练好的深度强化学习网络,将相机采集到的图像信息输入,即可得到智能体行走的方向信息。

本发明在保证其鲁棒性、在对环境依赖比较少的前提下,最大限度利用获取到的图像信息,实现即时的场景行走信息路径规划。