摘要:从文本中提取主题串是自然语言处理的重要基础之一.传统的提取方法主要是依据" 词典加匹配"的模式.由于词典的更新速度无法同步于网上新闻中新词汇涌现的速度,而且词典的内容也无法完全涵盖网上新闻的范围, 因此这种方法不适用于网上新闻的主题提取. 提出并实现了一种不用词典即可提取新闻主题的新方法.该方法利用网上新闻的特殊结构,在标题和正文间寻找重复的字串.经过简单地处理,这些字串能够较好地反映新闻的主题.实验结果显示该方法能够准确、有效地提取出绝大部分网上新闻的主题,满足新闻自动处理的需要.该方法同样适用于其它亚洲语言和西方语言.
摘要:在信息管理与电子商务应用中,如何安全地将一个合法实体(比如一个公司)的密钥分配给其属下的若干部门具有非常重要的意义.通常在这类应用中各部门都需拥有自己的子密钥,而每个部门的每个人(或科室)都有不同的子密钥授权等级,即一个部门只要其中一部分被授权人根据他们的密钥授权等级适当联合就能获得所在部门的子密钥,而一旦得到每个部门的子密钥就能够恢复出公司完整的密钥.基于此,建立了一个满足这种要求的安全的密钥分享体制.与传统方法不同,利用代数中群与半群的结构理论,通过使个人的密钥授权等级对应于相应群的特定元素的阶从而给出了一种能实现这种多等级密钥分享的方案.该方案可用于需要多等级密钥分享的其它场合.
摘要:给出了在高带宽时延乘积网络中无拥塞丢包的TCP缓冲区的占用量的微分方程,然后针对广域网中窗口大小小于网络带宽时延乘积和无线网络中,由于误码丢包而使窗口尺寸无法达到链路带宽时延乘积(如卫星网)的情况,分析了一种基于令牌的Fast-TCP机制,得出基于令牌的ACK延时机制,不仅能够大大减少缓冲区的占用量结论,而且可获得与TCP在无限缓冲区下的同样的吞吐量.还把这个结论推广到多连接的情况,在以前论文中没有涉及.
摘要:移动计算系统中一个很重要的问题就是管理移动客户机的实时位置.在现有商业的移动计算系统中,采用一种两层的体系结构.这种两层的结构不具有可扩展性,因而不能适应具有大量移动用户的新型移动计算应用.人们提出了一种新的层次结构的位置数据库结构,系统中的位置数据库组成一个树形结构以方便移动用户位置查找.尽管这种结构把位置更新及查询的任务在系统中的所有位置数据库中进行了分摊,它也有其自身的弱点:位置更新的代价较大及位置查询的延迟较长.研究了树形位置数据库结构中的位置更新策略,给出了一个位置变更的阈值计算方法,以使得位置管理的代价最少.
摘要:模型检查是一种用于并发系统的性质验证的算法技术.LTLC(linear temporal logic with clocks)是一种连续时间时序逻辑,它是线性时序逻辑LTL的一种实时扩充.讨论实时系统关于LTLC公式的模型检查问题,将实时系统关于LTLC公式的模型检查化归为有穷状态转换系统关于LTL公式的模型检查,从而可以利用LTL的模型检查工具来对LTLC进行模型检查.由于LTLC既能表示实时系统的性质,又能表示实时系统的实现,这就使得时序逻辑LTLC的模型检查过程既能用于实时系统的性质验证,又能用于实时系统之间的一致性验证.
摘要:针对随机进程代数(stochastic process algebra,简称SPA)的基本模型方法、模型特点和该领域的主要研究成果进行了综述.比较了SPA和随机Petri网(stochastic Petri nets,简称SPN)之间的异同点,并讨论了SPA转化为相应SPN的语义和将SPA的研究成果应用于SPN的方法.最后对SPA进一步研究工作的方向作了展望.
摘要:数据仓库信息量的飞速膨胀对数据仓库提出了巨大挑战.如何提高Web环境下数据仓库的查询效率成为数据仓库研究领域重要的研究问题.对Web数据仓库的体系结构和查询方法进行了研究和探讨.在分析几种Web数据仓库实现方法的基础上,提出了一种Web数据仓库的层次体系结构,并在此基础上提出了Web数据仓库的异步迭代查询方法.该方法充分利用了流水线并行技术,在Web数据仓库的查询处理过程中不同层次的结点以流水线方式运行,并行完成查询的处理,提高了查询效率.理论分析表明,该方法可以有效地提高Web数据仓库的查询效率.
摘要:提出了一种基于分割的三维医学图像表面重建算法,它将图像分割与MC(marching cubes)算法有机地结合,这样可以根据不同医学图像的特点,采用适合的分割方法,实现对不同组织的准确分割,并利用分割结果精确地提取等值面,避免了MC只适合于阈值分割的局限性.同时采用一种基于区域增长的立方体检测方法,提高了表面跟踪的效率.实验证明,运用本算法,重建速度和显示效果均有提高.
摘要:执行环境是主动网络中各种应用、移动代码的编制、管理和运行的基础,提出了一种基于可编程移动软设备的主动网络执行环境,该执行环境中的可编程单元称为可移动软设备,在功能上按协议子树划分,通过执行环境中的多路分解器,网络中的主动包和被动包都能找到相应的处理代码,在执行环境里,主动节点的功能易于扩充,大量的API方便用户编程,协议或应用的调试和部署简单.
摘要:从软件容错的角度出发,在基于网络的分布计算环境下,针对军事指挥系统及银行管理系统的特点,为了满足这些应用对可靠性的要求,以组通信为基础,采用进程复制技术,提出了一个嵌套式动态容错模型;进而提出了一个动态容错算法,该算法保证当主服务进程发生失效时,能够动态地选择一个新的主服务进程,并保证所有后备服务进程的状态保持一致.
摘要:诸如数字图书馆等规模在1012字节以上的大型数据库需要在线存取大容量磁带库中的海量数据.由于这些需求都是对海量数据的随机存取,而磁带库的随机存取性能很差,所以,研究有效的磁带库随机I/O调度策略和算法是改善磁带库系统性能的重要课题.提出并研究了一种基于效益-代价均衡的调度算法,给出一种有效的效益-代价加权比的估算方法.该算法根据系统的工作负载特点,动态调节调度的效益和代价的加权比,从而改善了磁带库系统在各种负载下的系统性能.研究解决了已有磁带库调度算法的对工作负载敏感的问题,极大改善了调度算法在重负载下的有效性.
摘要:提出了一种通过遗传算法(GA)对单个分类器进行优化以及对多个分类器进行组合优化的方法.该方法使用叠加(stacking)的策略.经典的叠加策略分为两步,该方法将遗传算法作为叠加策略的第2步.实验结果表明,遗传算法可以较好地完成优化任务,同单个分类器比较,它可以提高分类的精度.在对分类器进行组合优化方面,它得到比单个分类器更高的精度以及使分类结果具有更好的可理解性.
摘要:多连接表达式的并行查询优化是提高数据库性能的关键问题之一.提出了使用遗传算法来解决多连接表达式的并行查询优化问题.为了提高查询处理器的执行效率,采用启发式规则来搜索最优的多连接表达式并行调度执行计划.文中给出了详细的测试结果和性能分析.实验结果表明,结合启发式知识的遗传算法是解决多连并行查询优化的有效途径,对提高数据库的性能起到重要作用.
摘要:同步处理技术是保持复制的移动数据库系统一致性的一项关键技术,但现有的事务级同步处理算法存在着一定的局限性.为了克服这些缺陷,并增强其实用性,提出了一种新的移动数据库同步处理模型──基于双时间印的事务级同步(DTSTLS)模型.DTSTLS模型采用了一种三级复制体系结构,系统可以直接使用通用的数据库产品作为其数据库服务器,因此具有良好的可扩充性.作为一种异步的多主副本复制方法,DTSTLS模型允许移动计算机在断连的情况下存取本地副本,从而造成系统短暂的不一致,重新连接时进行冲突检测及同步处理,使系统重新收敛于一致性的状态.此外,通过一种独特的时间印处理策略,DTSTLS模型减少了通信代价,并降低了资源消耗.实验结果表明,DTSTLS模型提高了移动数据库系统的资源利用效率,保证了事务调度的可串行性和数据库的一致性.
摘要:从信息网络基础设施、信息网络服务、信息网络应用支撑技术和典型应用技术3个层面,研究了先进网络管理与运行、网络及信息安全、网络互连和路由、网络设计和测试、中文网络应用环境和网络信息发现、典型计算机网络应用这6个重要领域的关键技术.
摘要:对于移动智能体应用环境下的可靠通信问题,已有的支撑系统和相关研究或不能满足要求或存在缺陷.提出了一个面向移动智能体位置管理与可靠通信的新算法,它保证在智能体的移动行为不可预测的情况下,能可靠的完成消息传递,并承诺消息传递的exactly-once语义.
摘要:语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的阈值选取方法;(2) 引入BIC可测度概念来度量其适用范围;(3) BIC信息准则校准非冗余的候选分割点的偏差.实验结果表明,此改进算法优于原算法.
摘要:在许多KDD(knowledge discovery in databases)应用中,如电子商务中的欺诈行为监测,例外情况或离群点的发现比常规知识的发现更有意义.现有的离群点发现大多是针对数值属性的,而且这些方法只能发现离群点,不能对其含义进行解释.提出了一种基于超图模型的离群点(outlier)定义,这一定义既体现了"局部"的概念,又能很好地解释离群点的含义.同时给出了HOT(hypergraph-based outlier test)算法,通过计算每个点的支持度、隶属度和规模偏差来检测离群点.该算法既能够处理数值属性,又能够处理类别属性.分析表明,该算法能有效地发现高维空间数据中的离群点.
摘要:随着因特网用户的急剧增加和因特网不断的商业化,多播技术呈现出极为广阔的应用领域.在国际上,多播是一个崭新的学术研究领域,主要的研究成果集中在多播的路由算法、流量控制、拥塞控制和可靠传输上,多播安全领域的研究成果相对较少(尤其是在组通信密钥管理方面).研究了多播安全机制中的组通信密钥管理和访问控制问题.提出了一种基于子组安全控制器的组通信密钥管理和访问控制方案,该安全方案改进并解决了IOLUS系统和WGL方案中存在的若干问题,简化了访问控制策略,达到了预期的设计目标和要求.
摘要:提出了一种基于直接序列扩频码的图像空间域水印方案.在建立数字图像水印的通信模型的基础上,通过生成原图的视觉掩模以充分保证图像的逼真度,在数字图像相应的空间域嵌入扩频码调制水印,同时利用纠错编码技术来进一步增强水印的抗干扰性能.水印的检测通过计算像差图像和原扩频码的相关性来实现.实验表明,该方案提高了数字水印的稳健性和隐蔽性,具有较好的主观效果.
摘要:通过巧妙构造Liapunov函数,提出一种大范围收敛的求解优化问题的连续神经网络模型.它具有良好的功能和性能,可以求解具有等式和不等式约束的非线性规划问题.该模型是Newton最速下降法对约束问题的推广,能有效地提高解的精度.即使对正定二次规划问题,它也比现有的模型结构简单.
摘要:在基于构件的软件开发范型中,构件模型是构件分类、检索和适应等关键任务的理论基础,然而构件模型中的语义表示方法一直是一个难点.提出一种以语义为核心的构件模型,采用基于领域分析的特征空间语义定义方法,从领域空间、定义空间和语境空间三个方面刻画语义结构,用描述逻辑表达语义内容及实现自动推理,尤其是文中的构件语义体概念和特征空间形式化方法,为构件复用自动化和工程化提供了一种可能的解决途径