科技成果

阅读数: 3544

成果名称: 数字经济下的数据隐私保护与虚假信息过滤技术

成果登记号: 9612022R0116

第一完成单位: 西安交通大学

联 系 人: 刘兴华

成果类型: 软科学

成果体现形式 : 论文

应用行业: 信息传输、软件和信息技术服务业

学科分类: 管理信息系统(630.5045)

完成人: 王乐,孙早,刘祺,周薇,周碧玉,贠烁华,冯昕,梅楠,范勇

成果简介:

数字化转型使生产方式、生活方式和社会治理方式发生深刻变革,对世界经济、政治和科技格局产生深远影响。20211018日,在中央政治局第三十四次集体学习时,习近平总书记指出:“发展数字经济是把握新一轮科技革命和产业变革新机遇的战略选择。数字经济的发展已经上升为国家战略。近几年,陕西省政府紧跟国家号召,设立了秦创原作为陕西省数字经济发展的新引擎。数字经济发展前景广阔、充满机遇也面临挑战。工业与信息化部部长肖亚庆指出,数据隐私保护和数据质量问题是我国数字经济健康发展的重要挑战。为保障国家和陕西省数字经济的发展,本项目立足于解决数字经济中的数据隐私保护和虚假信息过滤问题。

经过6年的理论和实践研究,项目组在《经济研究》《管理世界》,《管理科学学报》,《系统工程理论与实践》Information Systems ResearchInformation Systems JournalIEEE Transaction on Software Engineering》等国内外顶级期刊发表SSCI/SCI/CSSCI论文94篇,形成专利4项,软著3项,决策建言15份(其中2份得到副国级领导批示,11份得到省级领导批示)。研究成果在数据隐私保护路径、虚假信息识别过滤策略、数字经济未来发展方向等方面取得了重要理论进展;在数据隐私保护技术、虚假信息过滤技术、和数据库管理等方面实现了重要技术突破。

本项目以数字经济中的数据隐私保护和虚假信息过滤为切入点。首先研究了数字经济对经济增长、产业结构和消费者行为的影响。然后,分析了数据隐私保护和虚假信息过滤中的挑战:如数据隐私保护的难点在于“隐私悖论”,虚假信息的过滤和治理中存在“囚徒困境”等。技术方面存在着算法精度不高、缺乏大量标准数据集和训练样本不平衡等问题。第三,本项目针对规模庞大且复杂多样的数据信息,开发了更为高效、便捷的数据存储与处理、数据系统维护、实时数据异常检测的方法及系统。第四,设计了基于协同训练(Co-Training)的虚假信息识别算法,匹配评论文本特征和评论者行为特征,通过权重法、过采样和欠采样解决了训练样本的不平衡问题,提高了虚假评论识别算法的速度和精度。最后,针对数据隐私保护和虚假信息治理从四方面提出了政策建议:一是要以“预防为主,治理为辅”;二是要提高数据隐私保护意识,形成多元共治机制;三是要切断数据隐私侵犯和虚假信息产生的利益链条;四是破解虚假信息产生的囚徒困境。此外,本项目还发明了“一种面向海量时序数据的图数据处理方法及系统”;一种基于BSP模型的实时图数据处理系统及方法”;“一种将关系型数据迁移至Hbase的方法及系统”;“一种实时在线日志检测方法及系统”,并成功申请4专利。本项目还产生了3项软著,分别为《情感分析识别系统V1.0》、《负面信息识别系统V1.0》、《负面信息识别系统V2.0》。

本项目产生的知识成果被广泛应用于陕西国测院科技发展有限公司、北京人民在线网络有限公司等30多家企业实际生产经营当中,累积产生千万以上的经济价值和一定的社会价值。例如,本项目的专利成果“一种将关系型数据迁移至Hbase的方法及系统”被中交(济南)科技创新发展有限责任公司应用于公司数据库系统的运营,于20182020年累计创造了204.5万元的经济效益。本项目的专利成果“一种面向海量时序数据的图数据处理方法及系统”被中交(济南)科技创新发展有限责任公司应用于数据处理系统,20192021年应用该技术产生的经济效益总计514.7万元。

本项目产生的观点、研究结论和决策建言被中央和省市各级部门采纳、吸收和运用,并得到副国级和省部级领导的亲笔批示。例如,刘琪同志主笔的《警惕虚拟货币“挖矿热”的不利影响》被中共中央办公厅《专报》采纳。刘祺同志完成的《警惕数据质量成为数字经济发展的“灰犀牛”》在“国家发展改革委信息”(第2190期)中被采用。刘航同志参与撰写的舆情研究成果稿件被中宣部综合采用。王乐教授、贠烁华博士和冯昕博士合作撰写的《陕西省利用秦创原建设数字经济强省的路径建议》被中共陕西省省委采纳吸收和运用

国内外学术组织、鉴定机构和科技企业对本项目成果高度评价。如王乐教授的论文《Easy Come or Easy Go? Empirical Evidence on Switching Behaviors in Mobile Payment Applications》被Clarivate评为ESI全球高被引论文。研究成果数字经济下的数据隐私保护与虚假信息过滤研究》被陕西省教育厅评为 “陕西高等学校科学技术研究优秀成果奖一等奖”,评价该成果具备前人尚未发明或尚未公开、具有先进性和创造性、经实施创造了显著经济效益和社会效益并具有较好的应用前景。王乐教授设计的《基于协同训练(Co-Training)的虚假评论识别算法》由陕西省中小企业服务中心鉴定,认为该算法技术路线具有一定的创新性,具有良好的推广前景和应用价值。

本项目在研究视角、研究框架、研究方法、研究成果转化上具有较强的创新性。首先,本项目关注数字经济中的数据安全和信息质量,研究视角响应国家战略需求。其次,理论创新与技术突破相结合,研究框架结构严密逻辑清晰。再次,研究结合经济计量模型与机器学习,研究方法引领学科前沿。最后,研究聚焦恶意软件和虚假信息的识别,研究成果具有极强的应用价值。