主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第4期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
黄健斌,姬红兵,孙鹤立.基于混合跳链条件随机场的异构Web记录集成方法.软件学报,2008,19(8):2149-2158
基于混合跳链条件随机场的异构Web记录集成方法
Integration of Heterogeneous Web Records Using Mixed Skip-Chain Conditional Random Fields
投稿时间:2006-10-14  修订日期:2007-03-08
DOI:
中文关键词:  混合跳链条件随机场  Web数据集成  模式匹配
英文关键词:mixed skip-chain conditional random fields  Web data integration  schema matching
基金项目:Supported by the National Natural Science Foundation of China under Grant No.60202004 (国家自然科学基金); the Doctoral Innovation Foundation of Xidian University of China under Grant No.05013 (西安电子科技大学博士创新基金)
作者单位
黄健斌 西安电子科技大学 计算机学院,陕西 西安 710071
西安电子科技大学 电子工程学院,陕西 西安 710071 
姬红兵 西安电子科技大学 电子工程学院,陕西 西安 710071 
孙鹤立 西安交通大学 计算机科学与技术系,陕西 西安 710049 
摘要点击次数: 3146
全文下载次数: 3339
中文摘要:
      提出了一种混合跳链条件随机场序列统计学习模型,以实现异构Web记录与关系数据库的模式匹配.该模型可以在由手工标注样本和关系数据库记录组成的联合样本集上进行训练,减少了对繁琐手工标注样本的依赖.此外,通过在线性链条件随机场模型上增加对跳边的支持,使得该模型能够有效地处理状态变量间的长距离依赖.在多个领域的真实数据集上的实验结果表明,所提出的方法能够显著提高异构Web记录语义模式匹配的性能.
英文摘要:
      An improved sequence labeling model named Mixed Skip-Chain Conditional Random Field is presented to solve the problem of schema matching between semi-structured Web records and relational database. The proposed model can be trained on mixed samples set which consists of labeled samples and unlabeled relational database records to reduce the dependence on manually labeled training data. Moreover, it provides a novel way to incorporate the long-distance dependencies between different state variants. Experimental results using a large number of real-world data collected from diverse domains show that the proposed method can improve the performance of schema matching significantly.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利