主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
高鹏,张德运,孙钦东,翟亚辉,卢伍春.网络信息审计系统中的多模式相似匹配算法.软件学报,2004,15(7):1074-1080
网络信息审计系统中的多模式相似匹配算法
A Multiple Approximate String Matching Algorithm of Network Information Audit System
投稿时间:2003-05-21  修订日期:2003-09-26
DOI:
中文关键词:  信息审计  允许错误的匹配  多模式相似匹配  有限自动机
英文关键词:information audit  matching allowing errors  multiple approximate string match  finite state machine
基金项目:Supported bythe National Security Fundfromthe Ministry of Information Industry of China under Grant No.2001-1-010(国家信息产业部计算机网络与信息安全基金)
作者单位
高鹏 西安交通大学,电子与信息工程学院,陕西,西安,710049 
张德运 西安交通大学,电子与信息工程学院,陕西,西安,710049 
孙钦东 西安交通大学,电子与信息工程学院,陕西,西安,710049 
翟亚辉 西安交通大学,电子与信息工程学院,陕西,西安,710049 
卢伍春 西安交通大学,电子与信息工程学院,陕西,西安,710049 
摘要点击次数: 3101
全文下载次数: 2890
中文摘要:
      针对网络信息审计系统的需要,提出一种新颖的基于Episode距离的快速多模式相似串匹配算法.该算法把模式串集合转换为多个有限自动机,然后利用模式串集合建立一个状态驱动器.依次用待匹配串的字符驱动状态驱动器,由状态驱动器驱动各个有限自动机,实现了中英文混合的允许插入错误的相似多模式匹配.该算法不需要匹配每个字符,能充分利用匹配过程中本次匹配不成功的信息并结合改进的文本窗机制,跳过尽可能多的字符;能够控制每个模式串的允许错误上限;匹配速度与允许插入的错误字符教k无关.该算法在信息审计、数据库、信息检索等领域有
英文摘要:
      This paper shows a simple, efficient, and practical algorithm for locating all occurrences of a finite number of a finite number of keywords in a char/Chinesw character string allowing k chars inserting errors.The algorithm consists of constructing muleiple finite state single-pattern matching machines form keywords and a state-driver appled to drive all finite state finite state single-pattern matching machines,and then using the state-driver to process the text string in a single pass.Speed of the matching is independentof the amount of the inserting errors.Generally,the text string in a not need to inspect every character of the string.They skip as many characters as possible by making full use of the information in matching failure and text window mechanism.This algorithm can be widely applied to network infomation auditing,database,information retrieval,and etc.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利