科技成果
成果名称: 一种基于神经网络的快速行人检测方法
成果登记号: 9612021Y0984
第一完成单位: 西北大学
联 系 人: 西北大学科技处
成果类型: 应用技术
成果体现形式 : 新技术
技术领域: 电子信息
应用行业: 信息传输、软件和信息技术服务业
成果简介:
随着人工智能的发展,各种新技术和新应用层出不穷。
人们越来越关注"衣食住行"中的"行"。
"滴滴打车"的出现丰富了人们的出行的方式。
而无人驾驶技术是人们以及研究者所关注的另一个热点。
无人驾驶又称为自动驾驶。
百度、谷歌、特斯拉等公司都在大力研发无人驾驶。
而在自动驾驶中,核心问题就是行人检测、车辆检测方法。
因为行人检测和车辆检测的好坏是保证交通安全的基础,也是自动驾驶从理论到实际应用的必要条件。
在高速公路上,汽车以每小时60到110公里的速度行驶,也就是每秒17到30米。
假设视频采集装置每秒30帧。
则每一帧汽车会行驶0.5到1米。
这对检测的实时性以及可靠性要求很高。
但是现在的方法有的有很高的准确率,而检测速度比较慢。
有的方法检测速度快,而准确率比较低。
现有的行人检测方法主要包含两个步骤:(1)生成窗口(2)窗口判别。
生成窗口步骤会生成很多窗口。
最简单的生成窗口方法即滑动窗口法。
滑动窗口法穷尽了行人所在的所有位置和大小,这大大增加了该步骤的时间。
生成窗口的质量和速度影响了检测的速度和准确率。
现有的方法生成的窗口大约有1000到2000个窗口,耗时0.2秒到几秒不等。
窗口判别步骤主要是对第一步生成的窗口进行判别,给出每一个窗口是行人的概率。
经典的方法首先提取图像的特征,如梯度方向直方图(HOG)、二进制局部描述子(LBP)等。
得到这些图像特征之后,再利用支持向量机方法(SVM)对这些特征进行训练,训练结束之后会得到模型参数。
由于每一个窗口都要提取特征,然后再进行判别。
时间主要花费在重复地提取特征的过程。
从学科上说,行人检测属于图像识别。
而深度学习近几年大大推进了图像识别领域的发展。
微软研究人员提出了一种基于深度学习的快速基于区域的卷积神经网络检测方法(Faster RCNN)。
Faster RCNN使用同一个深度模型包含两个网络:候选区域生成网络(Proposal Network)、检测网络(Detection Network)。
Proposal Network负责生成窗口,Detection Network负责判别窗口。
但是,此类方法存在以下不足: 1.候选区域生成网络和检测网络在训练过程需要分阶段训练。
2.检测网络依然对每一个窗口进行判别。
虽然从特征映射中提取深度特征可以加快窗口判别的速度,但是此类方法仍旧重复提取特征,再进行判别。
3.目前的生成窗口和窗口判别存在先后顺序。
由于其存在先后顺序,窗口判别一直在等待生成窗口的结果,然后才能对窗口进行判别。
本方法针对现有行人检测过程的缺点,提出基于神经网络的快速行人检测方法。
该方法提出了一种全新的检测流程,有效的解决了行人检测速度慢的缺点。
由于该方法的检测过程在检测行人时,网络仅仅前向传播一次,不需要重复地从特征图中重复地多次提取特征。
所以该方法的检测速度可以达到42幅图像每秒。