科技成果

阅读数: 3486

成果名称: 视觉大数据紧凑表征基础理论与方法

成果登记号: 9612018J0100

第一完成单位: 西安电子科技大学

联 系 人: 朱桐

成果类型: 基础理论

成果体现形式 : 论文

技术领域: 城市建设与社会发展

应用行业: 信息传输、软件和信息技术服务业

成果简介:

(限1500字)


    视觉大数据的紧凑表征是实现视觉数据快速检索和智能分析的基础。随着信息技术和智能技术的快速发展,视觉大数据呈现出多源异构、语义关联和动态无序等特性,给视觉特征的紧凑表征提出了更加严峻的挑战。2017年国务院印发的《新一代人工智能发展规划》明确将视觉数据的统一表征列为关键共性技术,进一步凸显了开展视觉大数据紧凑表征研究的必要性和重要性。

项目在国家基金委、科技部支持下,围绕基于哈希的视觉大数据紧凑表征这一基础性问题进行了长达十余年的系统研究,取得了如下成果:

    1、构建了基于相似度逼近的视觉数据紧凑表征框架,在国际上率先提出了离散哈希迭代优化算法,并分别探索了基于核的有监督哈希学习方法和基于图的无监督哈希学习方法,其表征性能大幅超过国际同类算法;揭示了哈希表征能力与高维数据结构化分布的一致性关系,建立了通用的哈希比特自适应匹配模型,有效提升了复杂场景下的视觉紧凑表征的综合性能。

    2、系统构建了统一的多模态数据紧凑表征框架,发现了高维数据空间分布特性和多通道潜在一致性,提出了紧凑哈希编码的协同学习策略,通过研究语义主题以及各模态的判别信息,实现了单通道和跨通道的高效关联和检索;首次提出了互补哈希表集成学习策略,揭示了多模态数据最近邻的覆盖准则和互补原理,设计了查询自适应的哈希比特加权机制,提高了多哈希表查询的语义适配能力,大幅增强了互补哈希索引中紧凑编码的综合表征能力。

    3、构建了基于哈希编码的非线性机器学习加速框架,利用共生统计学原理设计了具有强局部敏感特性的哈希表征方法,支持百万量级稀疏编码的实时求解;首次提出了哈希内积逼近任意非线性核函数的近似计算思想,构造了基于紧凑哈希编码的支持向量机模型,实现了大规模非线性核机器学习的大幅加速;针对子空间、超平面、非度量数据等视觉非线性数据在国际上率先提出一系列了局部敏感哈希方法,从理论和实验上验证了算法在分类、检索等应用中的有效性。

    本项目共在计算机学科领域的一流国际期刊和会议中发表论文35篇,包括《IEEE Trans》9篇,CCF推荐的A类会议11篇。全部论文Google Scholar被引用2,153次,SCI他引614次;20篇代表性论文Google Scholar被引用2,031次,SCI他引575次;单篇最高Google Scholar被引用719次,SCI他引181次。项目围绕国家网络空间安全的战略需求,积极探索视觉大数据紧凑表征在互联网多媒体数据挖掘和分析中的应用,包括海量数据处理、敏感内容识别、跨媒体挖掘等,相关成果应用于国家网络安全监管部门、电信运营商企事业单位,系统应用效果良好,累计实现经济效益1000万元,为国家网络空间安全提供了有力保障。