知识赋能的信息系统专题前言
高 宏1, 陈华钧2, 赵 翔3, 李瑞轩4
1(浙江师范大学 计算机科学与技术学院, 浙江 金华 321019)
2(浙江大学 计算机科学与技术学院, 浙江 杭州 310027)
3(国防科技大学 大数据与决策实验室, 湖南 长沙 410073)
4(华中科技大学 计算机科学与技术学院, 湖北 武汉 430074)
通信作者: 高宏, E-mail: honggao@zjnu.edu.cn; 陈华钧, E-mail: huajunsir@zju.edu.cn;
赵翔, E-mail: xiangzhao@nudt.edu.cn; 李瑞轩, E-mail: rxli@hust.edu.cn.
中文引用格式: 高宏, 陈华钧, 赵翔, 李瑞轩. 知识赋能的信息系统专题前言. 软件学报, 2022, 33(10). http://www.jos.org.cn/1000-9825/6890.htm
伴随着人工智能的浪潮, 智慧信息系统的发展方兴未艾, 正处于由感知智能到认知智能转变的关键时期.要实现认知智能的系统跃升, 离不开知识的赋能. 在数字化转型背景下, 数据对象和交互方式的日益丰富, 对以知识图谱为中心的信息系统如何进一步形成驱动力、促进生产力, 带来了新的研究机遇和挑战. 具体地, 主要体现在两大方面: 一是, 面向信息系统的知识赋能方法与技术; 二是, 知识驱动的信息系统方法与技术. 为此, 需要发展和利用知识图谱技术构建形成下一代信息系统, 但是如何利用知识图谱的理论积淀和技术成果, 来促进信息系统及其方法的发展, 解决信息系统分析、设计、开发和应用中遇到的问题与挑战, 仍有较大的研究空间. 本专题聚焦新一代信息系统发展中的新机遇和新挑战, 探讨知识与信息系统交互结合的两个方面, 为相关研究人员和工程人员提供集中发表最新成果的平台.
本专题公开征文, 共收到投稿28篇. 论文均通过了形式审查, 内容涉及如何在信息系统中开展知识的管理与挖掘、如何利用知识优化信息系统的分析与设计、如何在典型行业与领域运用知识赋能信息系统等前沿研究成果. 特约编辑先后邀请了14位专家参与审稿工作, 每篇投稿邀请2位专家进行评审. 稿件经初审、复审、WISA 2022会议宣读和终审等4个阶段, 历时6个月, 最终有9篇论文入选本专题.
这9篇论文分别从信息系统的知识赋能研究综述、基础理论和关键技术等3个方面对知识如何赋能信息系统的相关研究进展进行了解析和总结.
首先, 对于知识赋能信息系统这一新近研究主题, 一篇综述论文从现状、发展及挑战三个方面对已有的相关工作进行了综述研究.
《知识赋能的新一代信息系统研究现状、发展与挑战》从数字线索系统出发, 介绍了数字线索使能的信息系统相关研究; 然后引出知识图谱系统, 介绍了知识图谱驱动的信息系统相关研究; 最后落脚在对数字线索和知识图谱相结合的开放问题上, 探讨了未来知识赋能的新一代信息系统的潜在受益方向.
然后, 对于信息系统中的知识如何有效表示和利用的主题, 四篇研究论文从新型知识网络模型(超图、异质图、多源图和时序图)的角度切入, 对其进行有效表示学习的方法进行了探索研究.
《自注意力超图池化网络》提出了带有自注意机制的超图池化网络, 使用超图结构建模, 通过引入自注意力的超图卷积操作, 学习带有高阶数据信息的节点隐藏层特征, 再经过超图池化操作选择并保留在结构和内容上的重要节点, 进而得到更准确的超图表示.
《多视图对比增强的异质图结构学习方法》设计了一个渐进式的图结构融合方法, 通过将元路径图和相似度图递增地加权相加, 改变图结构融合过程中相似度图所占的比例, 在抑制因模型学习能力弱引入过多错误交互的同时, 达成了用相似度图中的交互抑制干扰交互或补全缺失交互的目的, 实现了异质图结构的优化.
《基于链接实体回放的多源知识图谱终身表示学习》提出了多源知识图谱终身表示学习的新范式, 其目标是在学习新知识图谱的同时从已学习的知识图谱与模型中获得知识迁移, 并为此设计了一个基于链接实体回放的多源知识图谱终身表示学习框架.
《FS-Net:面向时序知识图谱推理的频次统计网络》提出了一个用于时序知识图谱推理且无需训练的频次统计网络FS-Net: 它基于最新的短期历史的事实频次统计, 动态地为变化的时间戳上的预测生成时变的得分;同时, 基于当前时间戳上的事实频次统计, 为预测补充历史不可见实体(关系).
最后, 对于知识如何赋能信息系统中核心任务的主题, 四篇研究论文面向智慧信息系统的代表性任务(链接预测、信息推荐、知识问答), 对涉及到的关键技术进行了探索研究.
《面向时间感知的知识超图链接预测》给出了时序知识超图的定义, 并提出一种时序知识超图连接预测模型, 同时从实体角色、位置和时序超边的时间戳中学习实体表征, 并从理论上证明了研究提出的模型具有完全表达性和线性空间复杂度.
《用于冷启动推荐的异构信息网络对比元学习》提出了一个基于异质信息网络的对比元学习框架 CM-HIN, 利用元路径和网络模式两个视图分别刻画异质信息网络的高阶以及局部结构信息, 并采用对比学习挖掘异质信息网络的无标签信息, 进而同时在数据层和模型层解决信息推荐的冷启动问题.
《面向知识图谱约束问答的强化学习推理技术》面向知识图谱约束问答, 设计了融合约束信息的奖励函数, 解决弱监督学习面临的奖励稀疏与延迟问题; 设计了基于强化学习的约束路径推理模型COPAR, 解决推理路径分支问题; 还提出了歧义约束处理策略, 解决推理路径歧义问题.
《QA-KGNet:一种语言模型驱动的知识图谱问答模型》提出一种语言模型驱动的知识图谱问答推理模型 QA-KGNet, 将QA上下文和KG连接形成一个工作图, 使用语言模型计算QA上下文节点与KG节点的关联度, 并使用多头图注意力网络更新节点表示, 提升了知识图谱问答的效果.
本专题汇集了知识赋能信息系统研究中涉及的基础理论和关键技术, 反映了我国学者在知识赋能信息系统领域最新的研究进展. 感谢《软件学报》编委会和CCF信息系统专业委员会对专题工作的指导和帮助, 感谢专题全体评审专家及时、耐心、细致的评审工作, 感谢踊跃投稿的所有作者. 希望本专题能够对知识赋能信息系统相关领域的研究与实践工作有所促进.
高宏(1966-), 女, 博士, 浙江师范大学教授, 博士生导师, CCF杰出会员, 数据库专业委员会副主任, 信息系统专业委会执行委员, 大数据专家委员会执行委员, 人工智能学会智能服务专委会常务委员. 主要研究领域为时空序列数据管理与分析、社交网络分析、低质数据管理与计算、物联网感知数据收集、分布式感知数据计算等.
陈华钧(1978-), 男, 博士, 浙江大学教授, 博士生导师, CCF杰出演讲者, 信息系统专业委员会执行委员; 中国人工智能学会知识工程专业委员会副主任. 主要研究领域为知识图谱、大数据系统、自然语言处理等.
赵翔(1986-), 男, 博士, 国防科技大学教授, CCF高级会员, 信息系统专业委员会执行委员, 数据库专业委员会执行委员, 大数据专家委员会执行委员; 中国中文信息学会网络空间大搜索专业委员会常务委员, 语言与知识计算专业委员会委员. 主要研究领域为图数据管理与分析、知识图谱、大数据知识工程等.
李瑞轩(1974-), 男, 博士, 华中科技大学教授, 博士生导师, CCF杰出会员, 信息系统专业委员会副主任; 中国人工智能学会人工智能与安全专业委员会副主任. 主要研究领域为大数据管理与分析、数据挖掘与机器学习、知识图谱与自然语言处理、数据安全与隐私保护等.