复杂网络的社会行为建模预测

2021-10-09 网络信息体系中的建模与计算 浏览量:3321 返回上一级

研究内容:围绕网络信息体系中的网络拓扑分析与信息传播机理,研究大规模知识图谱构建与推理技术、复杂信息网络建模与演化分析等基础理论。基于复杂网络理论与模型方法,研究面向社情民意的多模态知识图谱构建与知识推理技术,实现多模态知识图谱的快速构建及可视化;研究社情民意事件文本分类、实体识别、事件关联搜索,事件的同义实体检测和跟踪、基于深度学习和图计算的行为预测等技术,实现社会网络中主题社团、事件活动的检测与聚类、重要节点的发现;并构建基于复杂网络的社会行为建模预测实验平台,提升对潜在社情民意事件的主动发现和提前预警能力。

研究目标:(1)建立一个实体数量不少于百万个的社情民意领域知识图谱,具备知识图谱的动态变更功能,实现五度关系检索响应时间不大于1秒;(2)基于复杂网络的社会行为建模预测实验平台,在1-2个城市开展落地应用示范;(3)系统实现社会事件文本分类模型精准率超80%,实体识别模型精准率超80%,事件关联搜索精准率超80%,相同事件检测和跟踪模型精准率超80%;(4)支持不同长度时间窗口下的行为模式挖掘和最少5种社会活动类型的识别;(5)对复杂网络中的群体行为、突发事件实现风险全局感知和精准预测,实现预测模型精准率超80%。

研究方案

1)多模态知识图谱构建。以知识抽取、知识融合、知识校验为技术能力,大数据平台、本体管理平台、可视化平台为基础,结合文本、图片、视频等模态信息,实现对多模态知识图谱的快速构建及可视化。加强自主研发的国家信息交换模型CIEM与知识图谱技术深度融合,结合社会事件风险预警等应用场景,构建领域知识体系框架,满足长期动态演化建模需求,支撑业务需求精确预测预警。

2)社情民意事件文本分类技术。重点是通过有监督的深度学习技术将信访文本进行分类器训练,研究面向社情民意事件的语言模型进行多标签、多类别的文本分类方法,实现对社会事件进行三级类别分类,同时采用层次数据增加技术,构建多层级注意力网络,降低冗余长文本的数据干扰性,提高模型整体的分类预测精度。

3)社情民意事件实体识别和事件关联搜索技术。考虑到该领域的真实标注数据缺乏、获取成本高,拟研究基于迁移学习的社情民意领域实体识别技术,通过对抗学习、模型迁移等技术,提高目标领域的标注数据量,降低目标域模型对标注数据数量的需求,提升实体识别的准确率。采用中文事件关联搜索技术,实现对社情民意事件的实体(事件、内容、人物、办理过程、满意度评价)、关系、属性(概况、地理位置、来电号码、发起时间、事件分类)等的关联搜索。

4)社情民意事件同义实体检测和跟踪。使用事件抽取和事件生成算法抽取结果,构建原子事件候选集,采用语义聚类算法寻找相同信访件,迭代扩展事件实体集合,锁定目标事件集,运用语义相似度算法,确定信访件目标事件归属,进而实现相同事件检测和跟踪模型。

5)基于深度学习和图计算的行为预测技术。分析重点关系人历史行为记录,发现行为模式,构建关系人行为预测模型,预测关系人未来行为方式。以业务重点关注的群访事件为研究突破对象,通过对群访事件分析,量化事件烈度,掌握事件发展阶段,基于社区发现、图神经网络等模型建立预测模型,来实现群体事件在事前的主动预警。

核心团队:中国电科集团程静研究员课题组曾成功参与国家科技部6项社会安全领域国家重点研发计划、5项智慧城市领域国家重点研发计划、1项军委科技委预研项目、4项省部级创新基金项目。在新一代信息基础设施领域,中国电科在深圳等全国多个城市建设了城市运营管理中心,汇聚了几十个委办局的政务数据、13万路的实时监控视频数据以及200多亿条社会及物联网数据,具备开展城市新一代信息基础设施的复杂网络研究的平台基础。