科技成果

阅读数: 1146

成果名称: 基于社会大数据的个体行为智能分析方法

成果登记号: 9612023J0214

第一完成单位: 西安交通大学

联 系 人: 刘兴华

成果类型: 基础理论

成果体现形式 : 论文

应用行业: 信息传输、软件和信息技术服务业

学科分类: 算法理论(520.1040)

完成人: 赵玺,冯耕中,沈之浩,卢晓妮,邹建华

成果简介:

   党的十九届四中全会指出“国家治理现代化”的突出意义和时代价值。通过人类社会生活空间种类繁多的传感设备(例如手机GPS、摄像头等)、覆盖广泛的通信基础设施(例如4G/5G移动通信网络等)、功能完善的互联网(例如用户评论、电子地图、微博)等获取到的大规模、客观、连续的社会大数据为国家治理现代化建设提供重要的数据基础和决策支撑。与此同时,基于社会大数据的行为分析面临着真实场景数据采集环境干扰多、细粒度时空行为建模精度低、多源异构社会大数据融合分析难等基本挑战。针对这些挑战,项目组在国家、省自然科学基金等项目的支持下,发展了行为分析基础理论,提出了以理论驱动和先验融合为核心的行为分析新方法,为挖掘社会大数据内在价值、承载国家治理现代化战略提供了创新的理论基础与方法。主要科学发现如下:

  1)复杂实际场景下的鲁棒行为特征提取新方法。实际场景中复杂动态的数据采集条件(例如人脸图像中极端光照、多样姿势)限制了现有图像分析方法的应用范围。本项目提出了以理论驱动为核心的图像分析新方法。运用这一思想,本项目首先基于表情分析心理学模型,建立了表情动作单元空间理论,利用统计学人脸特征模型构建该空间中的表情分界超平面,进而识别模糊条件下的人脸表情特征,显著提高了图像表情特征提取的准确度和鲁棒性。其次,本项目基于非线性优化理论,建立了一种考虑非线性神经元和低秩约束的响应重建方法,有效地减少了深层神经网络训练时的累积误差,提升了行为特征提取的有效性和效率(支撑材料:必备附件-代表性论著1-2)。研究成果发表在人工智能领域排名第一和第四的国际顶级期刊IEEE Transactions on Pattern Analysis and Machine IntelligenceIEEE Transactions on Cybernetics,被评价为 取得了巨大成功(achieve great success、“取得可喜结果”(achieve promising results)、具有高度的辨别力和鲁棒性(highly discriminative and robust)”、“巨大进步(significant advancements)”。

  2先验融合的细粒度时空行为预测新方法。行为预测是社会大数据行为分析的核心问题之一。目前的研究大多关注简单行为预测任务(例如预测将发生什么行为),然而,面向高复杂度的细粒度时空行为预测问题(例如将在什么时候什么位置发生什么行为)时,现有预测方法难以满足真实场景的有效性与及时性需求。本项目提出了融入不同社会场景中行为先验信息的行为预测新方法。运用这一思想,针对现有用户手机App预测算法时间预测粒度粗的问题,探究了下一个时间槽(例如5分钟)用户将使用的App使用序列预测问题。首先,建立了手机App使用行为序列嵌入方法,利用行为序列语义相似性先验信息将手机App使用行为映射到App使用行为相似嵌入空间AppEmbed,随后提出了深度强化学习智能体Actor-AppEmbed-Critic预测网络,有效提升预测准确率和效率(支撑材料:必备附件-代表性论著3)。研究成果发表在计算机领域顶级国际会议ACM SenSys,获得评价 “非常低的时间复杂性(leads to a much lower time complexity)”、“提升App使用率及用户满意度(improve user satisfaction)”、“取得了改进的性能(achieve improved performance)”。

3)基于多层次异构融合的决策支持新方法及实际场景应用。社会大数据呈现多源异构的特点,而利用社会大数据服务现实需求决策场景需要多源异构数据的有效融合。主要难点在于缺乏从多源异构社会大数据中提取辅助智能决策的范式参考。本项目综合考虑多源异构社会大数据的特性,提出多层级联的自适应特征融合算法,并利用行为科学理论建立数据特征与场景决策的关系模型。运用这一思想,首先针对小额贷款放贷决策场景,基于移动位置、手机App使用和人口统计学等多源异构数据,提出“数据层-行为层-语义层”多层级联特征提取与融合方法,消除了不同类型特征的异构性,并建立违约行为理论驱动的自适应增强预测算法,有效提升违约预测精度;其次,针对旅游景点管理决策场景,通过提出基于空间自适应隐马尔可夫模型的路网匹配方法将多运营商手机基站轨迹与路网数据进行精确匹配,从而对全量游客的伴行轨迹进行团体划分,随后建立加权自适应特征融合方法从人口统计数据、位置兴趣点数据和移动行为中提取游客游览行为语义,最终实现对不同团体大小游客移动模式的语义比较分析,为旅游管理者在管理实践中提供决策支持支撑材料:必备附件-代表性论著4-5)。研究成果发表在决策支撑领域国际顶级期刊DSSTourism Management,被评价 “创新性(different from features discussed)地提出”、“新颖性(novelty)”、“至关重要(vital)”等。

2. 学术评价

   五篇代表性论文发表于人工智能、数据挖掘、决策支持领域权威国际期刊和会议(IEEE T-PAMI, IEEE T-Cyber, ACM SenSys, DSSKBS, 五篇论文共被引用900次,其中被 Web of Science他引 413 次,其中单篇最高他引307 次,受邀国内/国际会议学术报告13 支撑材料:必备附件-检索证明、其他附件-学术报告)。相关研究成果被授权中国发明专利 8项,被中国科学院院士、中国工程院院士、澳大利亚科学院院士、Elsevier高被引学者、长江学者等著名学者论文正面评价,单位涵盖斯坦福大学、卡内基梅隆大学、清华大学、北京大学等国内外著名高校。

3. 成果应用

   政府科学治理:开发一系列大数据模型部署在西安市公安局的社会治理大数据分析平台,应用于社会公共安全管理、治安管控及疫情防控。西安市公安局开具的函件中提到:“赵玺的多项研究成果在反恐维稳、公共安全管理、社会治安管理等多方面发挥了重要作用,为多个重大案件的侦破提供了关键技术支持,多次受到公安部、省公安厅、市公安局的高度赞扬和充分肯定。特别是赵玺在2017年举行的全国公安大数据分析模型评比中,荣获一等奖。”企业技术创新:研究成果在华为公司开具的项目结题证明中被评价“在本领域持续探索前沿技术,最终实现方法突破,达到了预期的研究目标,取得的研究成果符合合同约定的技术指标要求。”平台智能决策:支撑了山东联通、北京移动大数据分析产品。山东联通评价“在实时人群管控、群体事件预防等方面达到了出色的实际应用效果支撑材料:其它附件-社会评价-评价1-3(脱密))。