主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2020年专刊出版计划 微信服务介绍 最新一期:2019年第12期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
陈友,程学旗,杨森.面向网络论坛的高质量主题发现.软件学报,2011,22(8):1785-1804
面向网络论坛的高质量主题发现
Finding High Quality Threads in Web Forums
投稿时间:2009-08-27  修订日期:2010-03-04
DOI:10.3724/SP.J.1001.2011.03857
中文关键词:  网络论坛  高质量  特征选择  特征抽取  分类
英文关键词:Web forum  high quality  feature selection  feature extraction  classification
基金项目:国家自然科学基金(60933005, 60903139); 国家高技术研究发展计划(863)(2007AA01Z438)
作者单位E-mail
陈友 中国科学院 计算技术研究所,北京 100190
中国科学院 研究生院,北京 100049 
 
程学旗 中国科学院 计算技术研究所,北京 100190 cxq@ict.ac.cn 
杨森 中国科学院 计算技术研究所,北京 100190
中国科学院 研究生院,北京 100049 
 
摘要点击次数: 4337
全文下载次数: 4394
中文摘要:
      提出了一种通用的高质量主题发现框架.在该框架下,利用特征抽取技术提取内容特征,利用结构特征去发现高质量主题.提出了一种基于遗传算法、禁忌搜索与机器学习的特征选择算法,用来评价被抽取特征的重要性.在腾讯论坛数据集上进行了大量的实验.实验结果表明,该框架能够很好地发现高质量主题.提出的特征抽取算法、特征选择算法以及高质量主题发现框架能够在很多Web2.0 领域得到应用,例如,博客、社会网络平台等.
英文摘要:
      This paper presents a general detection framework, and develops a variety of content and structure features to find high quality threads. The feature selection algorithm, which is a combination of genetic algorithm, Tabu search and a machine learning algorithm, is designed to attain a better assessment of key features. In this paper, an experiment is done that focuses on the Tencent Message Boards. The experimental results, obtained from a large scale evaluation of over thousands of real web forum threads and user ratings, demonstrate the feasibility of modeling and detecting high quality threads. The proposed feature extraction methods, feature selection algorithms, and detection framework can be useful for a variety of domains such as Blogs and social network platforms.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利