摘要:提出基于密度的网格聚类算法GDcA,发现大规模空间数据库中任意形状的聚类.该算法首先将数据空间划分成若干体积相同的单元,然后对单元进行聚类只有密度不小于给定阈值的单元才得到扩展,从而大大降低了时间复杂性在GDcA的基础上,给出增量式聚类算法IGDcA,适用于数据的批量更新.
摘要:目前,大量的数据都是通过数据库管理系统(DBMS)进行存储和管理,关系数据库是解决数据处理问题的最成熟和最有效的工具在地理信息系统(GIs)的应用中,是利用所谓的空间数据库来管理、分析和观察空间数据因为空间数据包含许多不同的数据格式和结构,这些复杂数据导致了对空间数据的操作和处理是非常复杂和困难的一项工作提出了一种利用关系数据库的成熟技术来解决空间数据处理的方法,思路是引入RSDD(regularly spatialdiscrete domains)概念,并定义基于RSDD的基本对象RPO(sDD_Based primary object)和对象RO(RSDD-Basedobject)概念,这些概念能够解决空间对象实数表示的无限精确性和计算机处理的有限精度之间的矛盾.
摘要:提出了一种高效基于物理性质的算法来动态的塑造n边形曲面的外形.这种算法是基于曲面的物理性质.通过极小化一个能量泛函,用户能够直接使用不同形式的外力作为虚拟的塑造工具来改变n边形曲面的外形.用户也能够定义必要的几何约束来进一步控制曲面外形.与通常移动控制点的方法比较,这种基于物理性质的方法更直观和有效.
摘要:事务管理是过程工程环境(PSEE)的一个关键技术.近年来,提出了不少高级事务模型支持长事务.然而,由于软件过程事务处理的特殊性,这些模型只能反映其中一部分需求,而且大多数多层的合作事务模型还不够稳定,无法应用于商业,这对PSEE的事务机制提出了挑战.基于此,提出了一个基于规则的软件过程事务模型E-Process/TM,能够较好地刻画软件过程的特征,即用户交互性、长周期、迭代式过程和数据共享的多用户协作.基于用户可自定义的正确性规则,E-Process/TM提供了良好的灵活性和开放性.目前,该模型已在商业PSEE产品中得以实现,并成功地应用于实践中
摘要:为了描述实时系统的性质和行为,10多年来,各种不同的时序逻辑,如Timed Computation Tree Logic,Metric Interval Temporal Logic和Real-Time Temporal Logic等相继提出来.这些时序逻辑适于表示实时系统的性质和规范,但不适于表示实时系统的实现模型.这样,在基于时序逻辑的实时系统的研究中,系统的性质和实现通常是用两种不同的语言来表示的.定义了一个带有时钟变量的线性时序逻辑(linear temporal logic with clocks,简称LTLC).它是由Manna和Pnueli提出的线性时序逻辑在实时情况下的一个推广.LTLC既能表示实时系统的性质,又能很方便地表示实时系统的实现.它能在统一的语义框架中表示出从高级的需求规范到低级的实现模型之间的不同抽象层次上的系统描述,并且能用逻辑蕴涵来表示不同抽象层次的系统描述之间的语义一致性.LTLC的这个特点将有助于实时系统的性质验证和实时系统的逐步求精.
摘要:随着Internet的迅猛发展,用于主干网络互联的核心路由器的接口速率已经达到了2.5Gbps~10Gbps.这一速率要求核心路由器每秒能够转发几百万乃至上千万个以上的分组.分组转发的重要一步就是查找路由表,因此快速的路由查找算法是实现高速分组转发的关键.路由查找需要实现最长前缀匹配.近年来,研究人员提出了多种路由查找算法,以提高查找性能.分析了路由查找问题及其难点,全面综述了各种查找算法,并对它们进行了详细的分析和比较,最后指出了进一步的研究方向.
摘要:实时多处理器系统的动态调度算法一直是实时系统研究中的重要课题,而评价实时调度算法性能的一个最重要的指标是调度成功率.在近视算法的基础上提出了一种新的实时多处理器系统的动态调度算法--节约算法.在该算法中,提出了一个新的处理器选择策略,从而提高了算法的调度成功率.同时,为了研究节约算法的有效性,对其进行了大量的模拟,分析了一些任务参数的变化对算法调度成功率的影响,并与近视算法的调度成功率进行了比较.模拟结果显示,节约算法的调度成功率要优于近视算法.
摘要:给出了命题逻辑上信念修正的两种可操作的完全方法.首先对R-演算的规则进行了修改,使得对任何一个极大协调的子集都通过这组规则得到.然后,给出了求得所有的极小不协调子集的一组规则.最后,给出一个过程,该过程能求得所有的极大协调子集.因为这两种方法都能求得所有的极大协调子集,所以把它们称为完全的.
摘要:联机分析处理(online analytical processing,简称OLAP)查询是涉及大量数据的即席复杂查询,从SQL(structured query language)角度来看,这些查询通常都包含多表连接和分组聚集操作.从OLAP查询处理角度出发,提出一种新的基于排序的聚集查询算法MuSA(sort-based aggregation with multi-table join).该方法充分考虑到数据仓库星型模式的特点,将聚集操作和新的多表连接算法MJoin相结合,排序时采用
摘要:同步是并发语言的一个重要特征,然而在面向对象的框架下,同步约束的存在可能导致不期望的方法的重定义.基于并发面向对象规约语言VDM++(Vienna development method)的两种同步机制,提出一种适合于并发面向对象广谱规约语言的同步模型-卫式路径结构.它不但可以支持一般代码的复用,而且可以全方位地支持对同步代码的复用.
摘要:Unix Shell生成的命令历史记录是系统审计信息的重要来源,但它未能包含检测入侵所需的足够信息,且容易被用户本人篡改.利用可装入内核模块和系统调用劫持技术实现了对Linux Shell安全审计机制的扩展,并给出了用其进行安全监测的例子.
摘要:字符识别系统的性能在很大程度上依赖于所选取的字符特征.提出了一种基于特征行必要-充分性匹配的OCR(optical character recognition)方法.该方法使用字符模板的特征行集,通过对待识字符位图进行必要性和充分性双向匹配来识别字符.并采用基线对齐归一化方法在特征匹配时准确定位,使识别率和识别速度都较为理想.同时,对字符位图特征行的交互选择、测试和调整等方法做了详细介绍.另外,还提出了字符骨架与位图重叠显示的方案,有效地提高了对识别结果校对的速度.最后,通过测试和比较,对识别效率进行了分析.
摘要:青鸟网上构件库系统通过对可复用构件的管理,支持软件企业进行基于构件的软件开发.系统在提高开放性的同时,往往会带来安全性以及知识产权方面的问题.为了解决这些问题,在青鸟网上构件库系统中采用基于角色的访问控制机制,并将构件描述信息与构件实体区别对待.为构件库系统及其所管理的构件定义了用户、角色、权限和角色继承,满足了安全性、知识产权管理等多种需求,同时也保证了系统的效率和对复用的支持.
摘要:速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(recursive density based clustering algorithm,简称RDBC),此算法可以智能地、动态地修改其密度参数.RDBC是基于DBSCAN的一种改进算法,其运算复杂度和DBSCAN相同.通过在Web文档上的聚类实验,结果表明,RDBC不但保留了DBSCAN高速度的优点,而且聚类效果大大优于DBSCAN.
摘要:针对多样本文语转换系统中的语音合成实时性问题,提出了对合成系统语音库的改进策略和语音单元之间相似度的计算方法,在此基础上设计并实现了查找语音单元的地址映射算法.实验表明,地址映射算法和音库的重新组织有效地提高了合成系统的实时性.
摘要:主动规则及规则处理机制一直是主动数据库研究的薄弱环节,主要表现为:(1) 语义不够丰富;(2) 缺乏基础语义;(3) 缺乏对规则处理的层次化和结构化的描述.为弥补上述不足,对规则处理机制赋予了丰富的规则延伸语义,根据语义的要求,用规则处理树层次化和结构化地描述规则处理过程对系统状态的影响.新的系统执行模型和扩展后的事务使我们能够提出一种支持丰富语义的规则处理算法.与其他规则处理算法相比,该算法实现了新语义,并利用了递归技术,能更好地吻合规则处理过程.
摘要:并行计算技术的发展已有20多年的历史了.时至今日,高性能并行计算仍然缺乏有效的并行程序设计方法和工具,使得编写并行程序、理解并行程序的行为、调试和优化并行程序的性能都很困难.从分析并行程序设计困难的原因入手,指出了当前各种高性能并行机系统支持的并行程序设计方法存在的诸多问题,综述了并行程序设计模型和语言的研究现状,给出了并行程序设计模型的评价标准,并提出了这一研究领域所面临的挑战性问题,指出了一些未来可能的发展方向.
摘要:实际问题中存在着大量连续量以及对它们的各种认知信息(知识).为了较好地描述和利用这些知识,将这些知识分解为连续认知结论以及关于这个结论的一个认知结构,并将它们统一成一个连续认知结构.在此基础上提出了一种基于连续认知结构的连续认知推理网络,并探讨了一套利用连续认知结构进行推理的方法.这种方法在不完全的知识推理网络中的推理是非单调的,其最简推理复杂度关于推理网络节点在最复杂情况下是线性的.同时,还用例子说明了这种方法在实际问题求解中的适用性.
摘要:在分析现有的移动Agent系统的特点以及MASIF(mobile agent system interoperability facility)规范的基础上,给出了一个具有高安全性的移动Agent系统Jamogents及其模板结构,描述了其工作流程,并在重载Java类java.lang.SecurityManager的基础上实现了一种用于加密和数字签名的算法RIM(RSA+IDEA+MD5).
摘要:随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请求进行预测.这种模型会选择性地对用户可预测的请求进行预测,从而大大提高了预测精度.实验证明,在自然语言中普遍适用的N元预测模型同样适用于网页预测.同时,采用了一种有效的简化手段,大大压缩了模型的大小,使得5元模型和传统的2元模型大小基本相同,而预测精度提高了1倍.该结果可以广泛地运用到Web上,包括网页的预发送、预取、推荐以及Web上的caching机制.试验是建立在真实的Web日志上的,该算法无论在预测精度上还是在可适用度上都优于以往的算法.
摘要:数据密集(data-intensive)型Web站点是指那些将大量的异构数据源的数据进行集成以后所生成的Web站点.此类站点的建设可以划分为3项主要任务:数据的访问与集成、站点结构的构造(指定各页面所含内容以及各页之间的链接)和页面的HTML表示.以XML以及来自W3C的相关规范为基础,构建了一种Web页面定义语言WPDL(Web page definition language).给出了WPDL的一个简化的EBNF表示,并举例说明了WPDL的关键特性.并且说明,使用这种说明式的查询语言(declarative query language),可以将数据访问、站点结构生成与页面表示彼此分离开来,使站点的重构(restructuring)、重用(reusability)和完整性约束的实施(integrity constraint enforcement)成为可能.
摘要:提出了一种新的全文索引模型--后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.