科研学术

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
机器人研究中心博士生获IEEE ICME2017最佳学生论文奖
文:曾凡玉 图:曾凡玉 来源:计算机学院 机器人研究中心 时间:2017-07-14 7838

  近日,从在香港召开的第18届IEEE国际多媒体年会(IEEE International Conference on Multimedia and Expo, ICME 2017)传来喜讯,由我校机器人研究中心副主任、计算机科学与工程学院叶茂教授指导的博士生李旭冬以第一作者发表的论文《Memory-Based Pedestrian Detection Through Sequence Learning》获得IEEE ICME大会最佳学生论文奖(Best Student Paper Award,仅4名)及最佳论文提名奖(Finalist of World’s First 10K Best Paper Award,提名率3%)。论文的通讯作者为叶茂教授,机器人研究中心副主任朱策教授、四川大学刘怡光教授为共同作者,电子科技大学作为第一署名单位。

图1 由左至右: 朱策教授,  ICME大会主席 Jorn Ostermann教授, 李旭冬, 叶茂教授

  该论文提出了一种基于序列学习的行人检测方法,在记忆行人序列模式的同时学习合适的行人序列次序,使行人检测器可以更快速且更准确地记忆和识别行人的序列模式。首先,如下图所示,该论文设计了一种基于记忆预测的序列学习模型,在卷积神经网络和长短时记忆模型之间添加次序交换的步骤,利用交换矩阵将特征序列按照重要程度重新排序。

图2 基于记忆预测的序列学习模型

  其次,该论文提出了一种联合学习方法,分别采用反向传播算法和通过时间的反向传播算法训练交换矩阵和长短时记忆模型。最后,如下图所示,该论文设计了一种基于序列学习的行人检测模型,采用基于候选区的目标检测框架,识别每个候选区中图像序列的模式。实验表明,在加入次序交换后,该论文设计的行人检测器成功地学习了行人序列次序并且准确地记忆了行人的序列模式,在检测准确度和检测速度上都与当前最好的行人检测器不相上下。

图3 基于序列学习的行人检测模型

  机器人研究中心社会服务机器人研究所由叶茂教授任执行所长,研究所现有教授3人、副教授2人、博士讲师1人、博士生11人、硕士研究生40余人,主要研究领域为模式识别与智能机器人、计算机视觉、机器学习、虚拟现实、控制科学与工程、量子理论等。社会服务机器人研究所与我校计划财务处联合研发的财务机器人——“财宝”目前已入驻我校计划财务处,得到了《科技日报》等国内主流媒体的报道关注。

  IEEE ICME由IEEE Computer Society、Circuits and Systems Society、Signal Processing Society以及Communications Society共同主办,是多媒体研究领域两大旗舰类国际学术会议之一,也是IEEE协会下最权威的多媒体学术交流和展示平台之一,主要关注多媒体信号处理等领域最新的研究、应用和产品发布,具有很强的影响力。会议至今已连续举办17届,涵盖文本分析、图形图像、视频、语音音频等多媒体数据的处理、传输、分析与应用等主题。同时,ICME是中国计算机学会推荐的B类知名国际会议。

  本次大会由42位多媒体领域国际顶级学者从850多篇论文中评选出7篇最佳论文及4篇最佳学生论文奖,获奖公告将同时刊发在IEEE Transactions on Multimedia、IEEE Multimedia、IEEE Communications以及IEEE Signal Processing Magazine等多媒体领域主要期刊上。


编辑:林坤  / 审核:林坤  / 发布:一戈

"