科技成果

阅读数: 1445

成果名称: 非结构化数据管理与挖掘关键技术及应用

成果登记号: 9612019J0101

第一完成单位: 西安电子科技大学

联 系 人: 沈满

成果类型: 基础理论

成果体现形式 : 论文

技术领域: 其他

应用行业: 科学研究和技术服务业

成果简介:

本成果旨在研究复杂网络图数据、地理信息数据及高维数据等复杂数据管理的理论及关键技术,解决社会网络、智慧城市系统、物联网、生物信息系统等多种新兴大数据应用中涉及的网络链接预测、信息传播估计、高维数据近邻查询等问题。

具体的,在社交网络链接预测、信息传播估计问题上,复杂网络中的信息传播受诸多因素的影响,包括节点的中心性、属性偏好、网络拓扑等。然而,现有常用的复杂网络信息传播理论只关注传播者的影响力或是单一信息源,而忽略了信息传播过程中接受者的作用及多信源传播时的竞争关系。鉴于此,针对此问题,利用复杂网络节点中心性计算技术和博弈论,我们先后引入并解决了复杂网络信息传播(包括信息传播路径预测、节点重要性计算和传播范围最大化)管理问题。此外,为了解决信息传播估计问题,我们还对最短路径问题进行了深入研究。我们提出了一种最少资源无参数神经网络(MRNN)求解方法,其特点是:(1)每个神经元最简单,仅为比较取小器;所需的神经元与神经元之间的连接数最少,网络迭代次数最少,在解决问题时所用硬资源和软资源最少;(2)网络无参数,并保持全局最优解;(3)可解决(带时间窗或不带时间窗)最短路径树、k-短路径树、最短 h-hop 路径树、 label-constraint最短路径树及其它们的任何组合问题; (4)适合大规模稀疏图的最短路径树的搜索。在仿真数据和大规模美国城市数据上与传统方法, 我们的方法能够用Dijkstra 方法的 2%的时间就可以保证找到全局最优解, 在解的质量和求解的速度上都具有绝对优势。

在高维数据近邻查询问题上,大数据时代的一大特点便是数据复杂多样,特别是各种新兴的应用层出不穷,数据的维度、结构多样性达到了前所未有的新高度,这给传统的数据存储、查询和处理技术带来了巨大挑战。因此,研究者们近年来对空间数据、媒体数据等复杂数据类型进行了卓有成效的研究。尽管这些研究取得了可喜的成果,然而他们仍然不能满足人们日益增长的复杂数据处理要求。为此,针对新形势下复杂数据的处理需求,我们利用空间索引技术、降维技术等理论,先后解决了高维空间向量的距离计算问题、高维空间的近似最近邻查询问题,并进一步给出了高维空间近似最近邻及最近邻查询的安全方案。