主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
杨陟卓,黄河燕.基于词语距离的网络图词义消歧.软件学报,2012,23(4):776-785
基于词语距离的网络图词义消歧
Graph Based Word Sense Disambiguation Method Using Distance Between Words
投稿时间:2011-03-18  修订日期:2011-09-02
DOI:10.3724/SP.J.1001.2012.04116
中文关键词:  词语距离  马尔可夫链  网络图模型  PageRank  参数估计
英文关键词:word distance  Markov chain  graph based model  PageRank  parameter estimation
基金项目:国家自然科学基金(61132009); 国防基础基金; 北京理工大学科技创新计划重大项目培育专项计划
作者单位E-mail
杨陟卓 北京市海量语言信息处理与云计算应用工程技术研究中心(北京理工大学), 北京 100081
北京理工大学 计算机学院, 北京 100081 
10907029@bit.edu.cn 
黄河燕 北京市海量语言信息处理与云计算应用工程技术研究中心(北京理工大学), 北京 100081
北京理工大学 计算机学院, 北京 100081 
 
摘要点击次数: 3584
全文下载次数: 3641
中文摘要:
      传统的基于知识库的词义消歧方法,以一定窗口大小下的词语作为背景,对歧义词词义进行推断.该窗口大小下的所有词语无论距离远近,都对歧义词的词义具有相同的影响,使词义消歧效果不佳.针对此问题,提出了一种基于词语距离的网络图词义消歧模型.该模型在传统的网络图词义消歧模型的基础上,充分考虑了词语距离对消歧效果的影响.通过模型重构、优化改进、参数估计以及评测比较,论证了该模型的特点:距离歧义词较近的词语,会对其词义有较强的推荐作用;而距离较远的词,会对其词义有较弱的推荐作用.实验结果表明,该模型可以有效提高中文词义消歧性能,与SemEval-2007:task #5 最好的成绩相比,该方法在MacroAve(macro-average accuracy)上提高了3.1%.
英文摘要:
      Almost all existing knowledge-based word sense disambiguation (WSD) methods used exploit context information contain, in certain window size around ambiguous word, are ineffective because all words in the window size have the same impact on determining the sense of ambiguous word. In order to solve the problem, this paper proposes a novel WSD model based on distance between words, which is built on the basics of traditional graph WSD model and can make full use of distance information. Through model reconstruction, optimization, parameter estimation and evaluation of comparison, the study demonstrates the feature of the new model: The words nearby ambiguous word will have more impact to the final sense of ambiguous word while the words far away from it will have less. Experimental results show that the proposed model can improve Chinese WSD performance, compared with the best evaluation results of SemEval-2007: task #5, this model gets MacroAve (macro-average accuracy) increase 3.1%.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利