基于全信息矩阵的多分类器集成方法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

Supported by the Science and Technology Committee of Beijing of China under Grant No.2001-0075 (北京市科委科技项目基金)


A Multiple Classifiers Integration Method Based on Full Information Matrix
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    自动文本分类是提高信息利用效率和质量的有效方法,而多分类器的有效组合能够得到更高的分类准确率.给出了样本集在多分类器下的全信息矩阵概念,并提出一种权重自适应调整的多分类器集成方法.该方法能够自适应地选择分类器组合及确定分类器权重,并利用分类统计信息指导分类结果的集成判决.通过在标准文本集Reuters-21578上的实验表明:该方法能从查准率和查全率两方面提高文本分类的整体性能,同时表明了该方法的有效性.

    Abstract:

    Automatic text categorization is an effective method to increase the efficiency and quality of information utilizing. The combination of a set of different classifiers can often achieve higher classification accuracy. The concept of full information matrix is first given, and then an integration method of multiple classifiers based on adaptive weight adjusting is presented in this paper. The classifiers and their weights are determined automatically and adaptively with this method. The effective integration of each classifier抯 result can be realized by analyzing the statistical information of the classifier on the training set. The classification performance is promoted by the improvement of the precision and the recall. The effectiveness of the method is shown by the text classification experiments on the Reuters-21578 text sets.

    参考文献
    相似文献
    引证文献
引用本文

唐春生,金以慧.基于全信息矩阵的多分类器集成方法.软件学报,2003,14(6):1103-1109

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2002-05-24
  • 最后修改日期:2002-08-14
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号