主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第7期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
郑德权,胡熠,于浩,赵铁军,王青松.多载体数据流中的特定信息识别研究.软件学报,2003,14(9):1538-1543
多载体数据流中的特定信息识别研究
Research of Specific Information Recognition in Multi-Carrier Data Streams
投稿时间:2002-06-24  修订日期:2003-03-25
DOI:
中文关键词:  信息识别  知识逼近  词性转称  归纳学习
英文关键词:information identification  knowledge approximation  part of speech transition  inductive learning
基金项目:Supported by the National High-Tech Research and Development Plan of China under Grant No.2001 AA 114101 (国家高技术研究发展计划(863))
作者单位
郑德权 哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001 
胡熠 哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001 
于浩 哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001 
赵铁军 哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001 
王青松 哈尔滨工业大学,计算机科学与技术学院,黑龙江,哈尔滨,150001 
摘要点击次数: 2652
全文下载次数: 2845
中文摘要:
      提出了一种识别多载体数据流中包含的特定信息的新方法.该方法按照特征词及其拼音匹配规则,基于统计自然语言理论,通过自动的归纳学习,将从语料库中获得的词性间的转移值作为系统知识,利用有效的知识逼近策略判断真实数据流中的特征词与其上下文的关系,并得到特征词在真实文本中的评测值,以此来考查真实数据流中出现的全部特征词与在语料中所学到的特征词上下文搭配规则上的相似程度.如果整个数据流的评测值超过阈值,该数据流将被屏蔽.实验结果表明,根据该方法开发的识别及监控多载体数据注中不良信息的实验系统取得很好的效果.
英文摘要:
      A method is presented to identify some pieces of specific information in multi-carrier data streams byfeature words and based on PinYin matching. An effective knowledge approximation method is used to judge therelation between feature words and context by statistics theory. The part of speech transfer-value as systemknowledge can be obtained by inductive learning of training corpus. When data streams are evaluated, theevaluation value can be gained according to the system knowledge by matching all feature words and based on theirPin Yin, which examines the comparability with context regular of part of speech between all feature words in datastreams and themselves in training corpus. Further more, if the evaluation value exceeds the threshold, the datastreams will be shielded. Experimental results show that the effect of the experiment system based on this method isefficient for identifying ill information and monitoring & controlling their spreading by multi-carrier data streams.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利