面向微博主题的可视分析研究
作者:
作者单位:

作者简介:

王臻皇(1991-),男,福建福州人,软件工程师,主要研究领域为文本可视化,社交网络可视化;陈思明(1989-),男,博士生,CCF学生会员,主要研究领域为信息可视化,社交媒体可视分析,时空可视分析;袁晓如(1975-),男,博士,研究员,博士生导师,CCF杰出会员,主要研究领域为可视化,可视分析.

通讯作者:

袁晓如,E-mail:xiaoru.yuan@pku.edu.cn

基金项目:

国家自然科学基金(61672055);国家重点基础研究发展计划(973)(2015CB352503);国家重点研发计划(2016QY02D0304)


Visual Analysis for Microblog Topic Modeling
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61672055); National Basic Research Program of China (973) (2015CB352503); National Key Research and Development Program of China (2016QY02D0304)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    随着微博的发展,其影响力日益增大,对微博主题内容进行分析具有重要的价值.主题模型技术能够从文本数据中提取主题,但是,由于微博文本短、随意性大、信息量小等特点,微博主题的分析具有一定的难度.提出了一个微博主题可视分析系统,利用多种互相关联的视图与丰富的交互手段,支持用户对主题模型结果进行分析与探索.系统结合了微博数据的特点,引入微博用户与时间因素,支持分析者从多角度对微博主题进行全面分析.系统支持用户在主题可视分析的基础上,通过交互操作对主题进行编辑,从而改进主题模型,提高模型的准确性和可靠性.案例分析结果表明,提出的系统可以有效地帮助用户分析微博主题和修正主题.

    Abstract:

    With the development and increasing impact of social media (e.g. microblog), it is critical to analyze the topic of the microblog. Topic modeling can extract topics from text data. However, it is a challenging task on the microblog data, due to the short content, heavy noises and limited amount of information in each microblog message. This article proposes a visual analytics system for microblog topic modeling. The proposed system enables the visual exploration and analysis process of the topic modeling results of microblogs with multiple linked views and interactions. It considers user behaviors and time effects in the topic modeling process. Users can analyze topics of microblog from multiple perspectives. The system also supports interactive topic editing to improve the topic modeling results in accuracy and reliability. The case study confirms that the described system can effectively help users analyze the Sina Weibo contents interactively.

    参考文献
    相似文献
    引证文献
引用本文

王臻皇,陈思明,袁晓如.面向微博主题的可视分析研究.软件学报,2018,29(4):1115-1130

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2016-10-11
  • 最后修改日期:2016-11-25
  • 录用日期:
  • 在线发布日期: 2017-07-20
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号