多载体数据流中的特定信息识别研究
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

Supported by the National High-Tech Research and Development Plan of China under Grant No.2001 AA 114101 (国家高技术研究发展计划(863))


Research of Specific Information Recognition in Multi-Carrier Data Streams
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    提出了一种识别多载体数据流中包含的特定信息的新方法.该方法按照特征词及其拼音匹配规则,基于统计自然语言理论,通过自动的归纳学习,将从语料库中获得的词性间的转移值作为系统知识,利用有效的知识逼近策略判断真实数据流中的特征词与其上下文的关系,并得到特征词在真实文本中的评测值,以此来考查真实数据流中出现的全部特征词与在语料中所学到的特征词上下文搭配规则上的相似程度.如果整个数据流的评测值超过阈值,该数据流将被屏蔽.实验结果表明,根据该方法开发的识别及监控多载体数据注中不良信息的实验系统取得很好的效果.

    Abstract:

    A method is presented to identify some pieces of specific information in multi-carrier data streams byfeature words and based on PinYin matching. An effective knowledge approximation method is used to judge therelation between feature words and context by statistics theory. The part of speech transfer-value as systemknowledge can be obtained by inductive learning of training corpus. When data streams are evaluated, theevaluation value can be gained according to the system knowledge by matching all feature words and based on theirPin Yin, which examines the comparability with context regular of part of speech between all feature words in datastreams and themselves in training corpus. Further more, if the evaluation value exceeds the threshold, the datastreams will be shielded. Experimental results show that the effect of the experiment system based on this method isefficient for identifying ill information and monitoring & controlling their spreading by multi-carrier data streams.

    参考文献
    相似文献
    引证文献
引用本文

郑德权,胡熠,于浩,赵铁军,王青松.多载体数据流中的特定信息识别研究.软件学报,2003,14(9):1538-1543

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2002-06-24
  • 最后修改日期:2003-03-25
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号