BigKE部重实验室在Science合作期刊《Intelligent Computing》上发表研究成果

一种实体对齐的无监督框架

发布时间:2023-05-10   浏览次数: 2,550

           5月5日,吴信东教授领导的研究小组在Science合作期刊《Intelligent Computing》上发表了一项知识图谱实体对齐方向的研究成果,该期刊还组织了专门的新闻报导(https://www.eurekalert.org/news-releases/988659)。

           尽管知识图谱对推荐系统等人工智能应用至关重要,但知识的每一种结构化表示通常是不完整的。因此,通过实体对齐过程融合多个知识图谱的信息是一项重要任务。该成果实现了一种无监督的实体对齐框架,以改进AI应用在多个知识图谱中搜索相关信息的过程。该框架汇集了多种方法的优势,避免依靠人力开启实体对齐过程。作者在多个数据集上评测了方法的性能,并与14种已有机器学习方法进行对比,该框架在准确率和召回率上优于大多数对比方法,且取得了优于所有对比方法的F1值。同时,该框架在鲁棒性和可扩展性上也取得了令人鼓舞的结果。

           这个名为SE-UEA的新框架包含有两个模块,一个关注于实体的表面相似性,一个关注于实体联系的相似性。二者均利用一对知识图谱作为输入。第一模块探究三种实体的表面相似性:名称、语义、位置。重要的是,第一模块的输出被用作第二模块的输入。第二模块使用图卷积网络自动检查两个知识图谱的内部结构,以发现相同的实体对。SE-UEA分析每对知识图谱并产生对齐的实体对,然后根据真实数据集提供的正确答案来验证该框架的对齐结果,并根据所选择的评价指标来计算对齐得分。

           SE-UEA框架的一个主要优点是不需要人工费力标注复杂的数据集,它也可以自动处理缺失信息的数据集,并可以合并具有不同内部结构的数据集。定量研究结果表明,结合相对简单的知识图谱自动处理方法并辅助复杂图卷积网络方法不仅方便而且有效。

           未来研究工作可通过调整框架两个模块的参数以进一步提高效率和准确性。 文章链接: Integrating Symbol Similarities with Knowledge Graph Embedding for Entity Alignment: An Unsupervised Framework | Intelligent Computing (science.org)