科技成果

阅读数: 2209

成果名称: 三维复杂场景认知的关键技术与方法研究

成果登记号: 9612017J0114

第一完成单位: 西安理工大学

联 系 人: 王锵

成果类型: 基础理论

成果体现形式 : 论文

技术领域: 电子信息

应用行业: 科学研究和技术服务业

成果简介:

    该课题为三维识别领域应用基础类研究课题。

    对三维场景,特别是三维复杂场景的认知,是实现计算机与人或者计算机与环境交互的关键科学难题。 

    合作团队以三维复杂场景为研究对象,基于视觉感知理论和几何处理技术,以场景数据分析方法和技术为手段,探寻复杂场景认知过程中的关键技术和难点问题的解决方法。课题重点在形状分析、物体提取、场景表达以及场景理解四个方面,提出相关的基础理论与技术方案,解决复杂场景认知中的物体遮挡、形状分析、目标分割与检索、复杂场景语义抽象等问题,形成理论方法体系,这些成果必将推动复杂场景计算机认知理论的发展,也为人机交互、虚拟现实、三维数据场可视化、机器自动导航等应用领域提供基础理论支撑。 

    合作团队开展了如下几个方面的创新性工作:⑴建立一套三维复杂场景数据自适应区域平滑滤波的统一框架方法,实现滤波精度和滤波速度的兼顾,解决了三维场景中由于点集散乱、遮挡、测量设备局限等带来的多噪声和场景结构复杂带来的"类噪声"所产生的问题。⑵提出一种基于视觉一致性的复杂场景对象的形状分析方法,取得与视觉认知一致的形状分解结果,实现场景的结构描述和形状编码,提高了场景中基本形状表示的准确度。⑶提出一种层次化的多目标物体特征提取综合策略和重构方法,解决由于场景目标多样性和结构复杂性造成的物体提取与识别率下降的问题,提高场景中物体重构的精度。⑷提出一种基于图构造的场景语义编码与理解方法,解决三维复杂场景表达的语义抽象问题与编码规则不一致问题。 

    本次申报的20篇代表作中,SCI-JCR 1区论文占25%,2、3区论文占45%,此外有1篇EI检索论文发表在国际计算机图形学顶级会议SIGGRAPH Asia上(当时为西北地区唯一1篇),该会议为CCF A类。成果授权国家发明专利10项、软件著作权15项。对20篇代表作,经过Thomson Reuters 的Web of Science 核心库搜索查证,引用这些成果中,SCI一区论文占30%、二、三和四区分别占33%。其次,经教育部科技查新工作站对国内外研究现状查新得知"未见国内、外有与本课题查新点完全相同的文献报道"。

    本课题合作研究成果受到国内、外学者的充分肯定和高度评价。课题组成员先后受邀赴芝加哥大学、北卡罗列纳大学教堂山分校、亚利桑那州立大学、日本名古屋工业大学、香港中文大学、德国康斯坦茨大学、法国国立计算机及自动化研究院等国际知名大学和科研机构做访问研究;课题成员受邀担任西班牙赫罗纳大学和印度BANASHTIHALI大学博士论文评审专家、受邀担任British Journal of Mathematics &Computer Science学术编委、担任Computers & Graphics客座编委、受邀为多个期刊约稿或会议作特邀报告,团队成员应邀2016年参与了由北京大学负责的"形状建模信息表示"国家标准的制定、2011年国际标准ISO/IEC JTC 1的制定等。加拿大British Columbia大学的T. Guha教授,在2010年出版的《模式识别》书中指出我们课题组成员首次将曲波引入复杂形状识别中,2012 年IEEE的ICDIPC(International Conference on Digital Information Processing and Communications)国际会议论文中评价到:是我们首次将曲波结合多分类支持向量机来进行复杂形状的识别;新西兰大学马特教授对我们提出的基于显著性的特征增强方法给予了较高评价,并发来邮件表示"效果不错,希望有机会合作";成果中的论文相关内容被审稿评阅人评价为"效果足够好,远超别的方法"等。

    在核心技术和方法方面,我们的一系列成果专利等,被西北最大的影视动漫公司"西安维真视界影视文化传播股份有限公司"采用,他们对技术的评价是"与其它已有方法相比,三维建模效果更逼真,运行效率更高,与实测场景数据融合性更好,动画动漫制作更方便,适应性更强"。

    由此可见,课题成果取得社会效益,并产生了学术影响。