摘要:新词的识别和歧义的消解是影响信息检索系统准确度的重要因素.提出了一种基于统计模型的、面向信息检索的自适应中文分词算法.基于此算法,设计和实现了一个全新的分词系统BUAASEISEG.它能够识别任意领域的各类新词,也能进行歧义消解和切分任意合理长度的词.它采用迭代式二元切分方法,对目标文档进行在线词频统计,使用离线词频词典或搜索引擎的倒排索引,筛选候选词并进行歧义消解.在统计模型的基础上,采用姓氏列表、量词表以及停词列表进行后处理,进一步提高了准确度.通过与著名的ICTCLAS分词系统针对新闻和论文进行对比评测,表明BUAASEISEG在新词识别和歧义消解方面有明显的优势.
摘要:多目标最小生成树问题是典型的NP问题,Zhou和Gen提出了一种用于计数多目标最小生成树问题的所有非劣最优最小生成树的算法,但该算法无法保证能够找到所有非劣最优最小生成树.针对此问题,提出一种改进的计数算法,并定性说明改进算法能够找到问题的所有非劣最优最小生成树.改进算法在进行子树剔除时增加了一些条件.模拟实验结果表明,改进后的计数算法能够找到所有的非劣最优解.这也说明该算法具有应用的潜力.
摘要:针对无线环境中基于信息包信道分集技术的多重描述编码进行了研究.在比较了多重描述编码(multiple description coding,简称MDC)和分层编码(1ayer coding,简称LC)的性能特点并总结了它们各自的优点与不足之后,提出一种能有效结合两者长处的新的编码方法--自动恢复的多重描述编码(auto-resilient multiple description coding,简称ARMDC)方案.ARMDC既能够像通常的MDC一样使每个成功到达的数据包都提供有效信息,也能像LC一样优先传送某一重要的描述,保证基本的视频质量,且解码端接收到的ARMDC码流可以进行周期性的自动恢复,无须等待源端接收到反馈信息后再作出反应.在仿真的3G无线信道上分别传送ARMDC,MDR(multiple description with restart)以及不使用LC和MDC的码流,比较其各自的错误恢复性能.实验结果显示,使用ARMDC的视频流在序列解码后有着更好的R-D性能.同时,由于视频序列相邻的帧之间质量较平滑,也获得了更好的主观性能.此研究成果可以应用于无线媒体流业务与无线会话业务中的视频传输系统,对于研究基于易出错时变信道的多媒体传输的同行具有一定的参考价值.
摘要:详细分析了数据流聚类算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等,并针对这些不足之处提出了一种采用空间分割、组合以及按密度聚类的算法ACluStream.实验结果表明,ACluStream在准确度和速度上都比CluStream有较大的提高.
摘要:提高卫星网络的容错性是一项具有挑战性的工作,故障识别是其中一项根本措施.在采用双层节点图对卫星网络建模的基础上,提出一种基于PMC测试无效模型的卫星网络故障识别算法,并证明了算法的正确性.通过大量仿真实验,对算法在不同类型的卫星网络中的性能进行了对比与分析.实验结果表明,算法能够适用于多种网络拓扑,并具有良好的鲁棒性.
摘要:意图是Agent的一个关键的意识属性,在决定理性Agent的行为中起着重要作用.为了克服现有意图逻辑中存在的缺陷,建立了适用于意图的语义表示.讨论了理性Agent性态的形式化中对意图语义的要求以及现有意图逻辑中存在的问题.介绍了在前期工作--真假子集语义基础上开发的双子集语义改进模型及其在Agent意图形式化中的应用,并且证明通过对模型的代数结构施加一定的约束,能获得许多希望得到的性质.在二值逻辑中,真和假是同等重要的.当然,对一个命题,描述了真值也就知道了假值;但对于一类命题却不是这样,对假值的刻画与对真值的刻画具有同等重要的意义.而对意图的描述是对一类命题(Agent意图实现的命题)的刻画.经典的正规模态算子的可能世界语义只重视真,用RI(w)来描述,可看成是单子集语义.而改进的双子集语义真假并重,用RIT(w)来描述真,并用RIF(w)来描述假,从而能更全面地描述二值逻辑中的模态算子.经典的正规模态算子的可能世界语义可以看成是改进的双子集语义当RIF(w)=()时的退化情形.改进的双子集语义不仅避免了基于正规模态逻辑表示的"逻辑全知"问题以及由此带来的副作用等问题,与Konolige和Pollack的意图模型相比,比较简单、自然,且满足K公理和联合一致性原理,而且克服了前期工作真假子集语义和双子集语义表示的缺陷.实际上,改进的双子集语义为非正规模态算子的语义表示提供了一种新的方法,可应用于建立新的合适的Agent逻辑系统.
摘要:手写汉字切分是根据输入笔迹的空间位置关系进行汉字部件的合并切分,形成完整的汉字笔划以便进行识别处理.综合利用了汉字部件的结构位置关系和笔划的空间位置关系,根据笔划的最小生成树(minimal spanningtree,简称MST)对联机连续手写输入汉字进行切分,取得了较好的切分结果.切分的准确率超过91.6%.
摘要:无线传感器网络具有与传统网络不同的特点,且与应用高度相关.传统路由协议不能有效地用于无线传感器网络,因而人们研究了众多的无线传感器网络路由协议.在介绍无线传感器网络的特点后,提出了路由协议的分类方法,然后着重分析了当前一些较为重要的路由协议的核心路由机制,并采用比较方式指出了这些路由协议的类别、特点和主要应用范围.最后总结了好的路由协议应具有的特点以及未来的研究策略与发展趋势.
摘要:覆盖控制作为无线传感器网络中的一个基本问题,反映了网络所能提供的"感知"服务质量,可以使无线传感器网络的空间资源得到优化分配,进而更好地完成环境感知、信息获取和有效传输的任务.立足于无线传感器网络的覆盖控制问题,分类总结了近年来提出的各种覆盖控制问题的思想和有代表性的研究成果,着重讨论了一些典型的无线传感器网络覆盖控制算法与协议.最后进行了各种算法的比较性总结,深入分析了目前无线传感器网络覆盖控制亟待解决的问题,并展望了其未来的发展方向.
摘要:提出由TCP连接的唯一性导出的TCP数量平衡性测度及其经验范围可用于检测TCP连接的大规模异常,如DDoS、扫描等.使用带哈希增强算法的Bloom Filter Reproduction(BFR)方法对TCP连接大规模异常的参数进行快速再现,如IP地址、端口的分布等,使得在检测过程中无须维护TCP五元组的信息.实验结果表明,该方法能够以较少的资源占用和较高的准确性来揭示网络流量中混杂的多种异常现象.
摘要:随着传统体系结构路由器在可靠性和多维可扩展性等方面不能满足下一代Internet发展的需要,集群结构的路由器将成为未来骨干网络的核心.如何保证集群路由器各个路由节点转发表的单映像性,对控制平面及转发平面的性能至关重要,是值得研究的重要问题.在分析现有的各种转发表同步机制特点的基础上,提出一种非对称的路由同步框架--AREF(asymmetrical routes electing fTamework)路由同步框架,更适合于大规模异构的集群路由器系统的特点.在AREF路由同步框架上,进一步提出了AREF路由同步算法.算法针对每个路由前缀使用路由Cache来缓存次优路由,在全局最优路由被删除时,通过预测次优路由来减少同步开销.模拟实验表明,AREF同步框架与算法的性能远远优于其他路由同步机制,与理论最优值比较接近.
摘要:服务注册库作为SOA(service oriented architecture)结构中的重要组成部分,目前主要使用的UDDI(universal description,discovery andintegration)及基于UDDI的UBR(universal business registry)的实际使用情况较差.主要原因在于:UBR的注册信息在各注册节点间完全复制,导致其随着服务数量的增加变得较难管理和维护;另一方面,目前UDDI只能提供被动的目录服务,而统计研究发现,很少有组织或个人在发布服务后主动更新信息,这就造成了其上服务信息的有效性差.提出了一种主动分布式服务注册机制(adUDDI),利用服务主动监测机制提高注册库中服务信息的实时有效性;利用分布式结构减轻统一注册中心的负担.通过实验分析说明,此方法可提高SOA结构的可用性,为基于Web服务构建可靠业务中间件提供了基础.
摘要:网络异常检测技术是入侵检测领域研究的热点内容,但由于存在着误报率较高、检测攻击范围不够全面、检测效率不能满足高速网络实时检测需求等问题,并未在实际环境中得以大规模应用.基于D-S证据理论,提出了一种网络异常检测方法,能够融合多个特征对网络流量进行综合评判,有效地降低了误报率和漏报率,并引入自适应机制,以保证在实时动态变化的网络中的检测准确度.另外,选取计算代价小的特征以及高效的融合规则,保证了算法的性能满足高速检测的要求.该方法已实现为网络入侵检测原型系统中的异常检测模块.通过DARPA 1999年IDS基准评测数据的实验评测表明,该方法在低误报率的前提下,达到了69%的良好检测率,这一结果优于DARPA 1999年入侵检测系统评测优胜者EMERALD的50%检测率和同期的一些相关研究成果.
摘要:如何辨识资源的可靠性是网格应用面临的一个难题,首次将信号博弈理论应用于网格资源可靠性辨识,提出一种基于赔偿的网格资源交易模型,并对模型进行求解.理论分析和仿真实验表明,该模型可以使资源提供方主动摒弃恶意欺骗的动机,资源请求方不必参考其他节点的评价即可作出正确的选择,从而极大地简化计算,降低通信开销,为网格资源可靠性辨识提出了新的解决方案.
摘要:为了延长网络的生存时间,需要设计能量有效的协议,以适应传感器网络的特点.成簇算法是传感器网络中减少能量消耗的一种关键技术,它能够增强网络的扩展性和延长网络的生存时间.研究了异构传感器网络中成簇算法在节省能量方面的性能,提出一种适应异构无线传感器网络的分布式能量有效的成簇方案.此方案基于节点剩余能量与网络节点的平均能量的比例来选举簇头节点.较高初始能量和剩余能量的节点比低能量节点拥有更多的机会成为簇头节点,从而使网络能量均匀消耗,延长网络的生存时间.模拟实验结果显示,与现有的重要成簇方案相比,新的成簇算法在异构网络下提供了更长的网络生存时间和更大的网络有效吞吐量.
摘要:网络的关联性在Internet网络拓扑的研究中具有重要作用.目前的研究分别集中于聚集特性、mixing特性和rich-club现象.深入研究了这3种网络关联特征:在指出刻画网络聚集特性的两个衡量参数--平均聚集系数与聚集系数可能存在不一致性的同时,发现AS(autonomous system)网络的局部聚集系数和节点度高度相关;揭示并验证了PFP(positive-feedback preference)模型中rich-club现象的内在形成机制.在此基础上,对这些网络关联特征之间的关联关系进行了研究.
摘要:动态拓扑是移动自组网区别于其他形式网络的本质特征,对其进行研究具有很大的理论价值和工业应用背景.提出一种方法,利用网络的最长生命期路径来研究其拓扑的动态性.在已有研究的基础上,改进了网络的数学模型,弥补了以往模型无法很好地描述移动自组网动态拓扑的缺陷,并在此基础上提出了最长生命期路贩径算法.利用该算法计算网络中的最长生命期路径,深入研究了其持续时间的分布规律.同时证明了使用最长生命期路径作为路由,可以使网络的重路由次数最少.模拟实验表明,利用对数正态分布可以很好地描述移动自组网的最长生命期路径持续时间.实验结果表明,与以往利用最短路径作为研究对象相比,最长生命期路径和最小重路由更适合用来衡量网络的动态性.
摘要:量子安全直接通信是继量子密钥分配之后提出的又一重要量子密码协议,它要求通信双方在预先不需要建立共享密钥的情况下就可以实现消息的保密传输.给出了一个新的量子安全直接通信方案,该方案利用量子Calderbank-Shor-Steane(CSS)纠错码和未知量子态不可克隆等性质,方案的安全性建立在求解一般的线性码的译码问题是一个NP完全问题、Goppa码有快速的译码算法和量子图灵机不能有效求解NP完全问题的基础上.在协议中,发送方Alice把要发送的秘密消息转化为一一对应的错误向量,把错误向量加到其接收到的、Bob编码过的量子态上,并发给接收方Bob.Bob利用其私钥,通过测量、解码可以得到错误向量,并可以用相应的算法恢复出秘密消息.控制量子信道的攻击者Eve不能恢复出秘密消息,因其不知道Bob的密钥.与已有的量子安全直接通信方案相比,该方案不需要交换任何额外的经典信息和建立量子纠缠信道.
摘要:正则性是参数曲线曲面的重要代数性质,是由参数曲线曲面的参数化决定的.在计算机辅助制造过程中,要求所处理的参数曲线曲面是正则的,前提是计算机辅助设计得到的参数曲线曲面是正则曲线曲面.然而,直接按照正则参数曲线曲面的定义,采用解方程或方程组的方法来判断曲线曲面是否正则,其计算相当复杂,实际上也是行不通的.通过将Bézier曲线曲面的导矢曲线(法矢曲面)的参数表示转换为隐式表示,得到了一个判断Bézier曲线曲面正则性的简单而实用的充分条件.
摘要:待匹配人脸图像与库存原型图像之间姿态和光照的差异是自动人脸识别的两个主要瓶颈问题,已有的解决方法往往只能单独处理二者之-,而不能同时处理光照和姿态问题.提出了一种对人脸图像中的姿态和光照变化同时进行校正处理的方法,即通过光照不变的3D人脸重建过程,将姿态和光照都校正到预先定义的标准条件下.首先,利用先验的统计变形模型,结合人脸图像上的一些关键点来恢复较为精细的人脸3D形状.基于此重建的3D形状,进而通过球面谐波商图像的方法估计输入图像的光照属性并提取输入图像的光照无关的纹理信息,从而将光照无关的3D人脸完全重构出来,生成输入人脸图像在标准姿态和光照条件下的虚拟视图,用于最终的分类识别,实现了对光照和姿态问题的同时处理.在CMU PIE数据库上的实验结果表明,此方法可以在很大程度上提高现有人脸识别方法对于原型集合(gallery)和测试集合中图像在姿态和光照不一致情况下识别结果的正确性
摘要:超大规模地形场景包含大量的几何和纹理数据,无法一次性载入内存,并具有极高的复杂度,因而无法进行实时绘制.提出一种高性能的外存地形场景实时漫游技术.该方法使用离散层次细节技术并结合视点相关的动态连续层次细节选择和过渡.算法为地表的简化提出一种新的基于受限法向锥的误差计算方法,使得模型简化具有轮廓保持和光照保持特性.当生成网格包含三角形数目相当时,该方法比传统的基于几何误差的简化更加符合漫游时视觉的感知规律.场景简化过程中提取出的潜在轮廓特征可以通过巧妙地构建漫游时视线方向上的增量地平线来随时更新场景不同部分的可见性信息,并以此控制无用数据页面的载入和无效场景部分的绘制,提高绘制速度.漫游系统采用多线程技术,使CPU,GPU,I/O三者的效率得到充分发挥,并可实时生成具有光照和阴影效果的漫游图像.
摘要:针对分布式虚拟现实应用系统的构建问题,给出一种分布式虚拟现实应用系统的构造方法.指出分布式虚拟现实系统中存在的3种基本构件;重点讨论构件的"语义"互操作问题,通过建立构件的语义模型,提出一种原语-语义构件的构件构造方法,该方法可以解决不存在通信协议情况下的构件之间"语义"互操作问题;给出一种支持可组装的分布式虚拟现实应用系统的基于构件的体系结构以及其中的核心机制和算法.实验结果表明了该体系结构的可用性.
摘要:利用单变量均匀稳定细分格式Ck连续的充要条件,分析了已有的插值曲线格式各阶连续时参数的取值范围.首次指出了六点二重插值格式可以达到C3连续,并构造了一种新的C3连续的六点三重插值细分格式.
摘要:在GPU(graphics processing unit)上求解了复杂场景中的三维流动问题,充分利用了GPU并行能力以加速计算.与前人的方法不同,该方法对于边界条件的处理更为通用.首先,通过在图像空间生成实心的剖切截面构成整个障碍物信息图,算法使得流体计算与整个几何场景的复杂度无关,通过对各体素进行分类并结合边界条件,根据障碍物形成修正因子来修改对应的值;另外,采用更为紧凑的数据格式,以充分利用硬件的并行性.通过将所有标量的运算压缩到纹元的4个颜色通道并结合平铺三维纹理,减少了三维流场计算所需要的绘制次数.实验结果显示出算法的有效性和高效率.该算法可以实时计算并显示一个采用中等规模离散的复杂场景.
摘要:基于毛发的多层纹理表达方法,提出一种毛发实时绘制方法.该方法充分利用图形处理器的绘制功能,不仅能对毛发进行高精度快速的光照计算,而且能够高效地模拟毛发间的自阴影效果以及物体其他部分在毛发上遮挡形成的软影现象,以增强毛发的真实感效果.实验结果表明,该方法能够实时处理中等规模的模型,这对于毛发物体在电影、游戏和虚拟现实等领域的应用具有重要的价值.
摘要:光线投射是一种高质量的体绘制方法.它以图像空间为序,逐根光线遍历和采样体数据.因此,传统上,它只能在CPU上实现,因而速度慢,交互性不好.提出了一个新的视点相关的层次采样VDLS (view dependent layer sampling)结构,VDLS将光线上的所有采样点重新组织成一系列层,并简化为两个视点相关的几何缓冲器,进而在GPU(graphics processing unit)中用两个动态纹理表示.利用GPU的可编程性,光线投射算法的6个步骤(光线生成、光线遍历、插值、分类、着色和颜色合成)得以完全在GPU中实现.在此基础上,提出两个基于体空间和图像空间连贯性的加速技巧,快速剔除无效的光线.结合其他与渲染和颜色合成有关的技巧,VDLS将面向多边形绘制的图形引擎转化为体光线投射算法引擎,在透视投影方式下,每秒能处理1.5亿个插值、后分类与着色的光线采样点.实验结果表明,提出的方法能用于医学可视化、真实物理现象模拟、材质检测中灰度体数据快速交互的可视化与漫游.
摘要:静态优先级调度在实际应用中经常受到系统支持的优先级个数的影响,当任务个数多于系统优先级个数时,需要将几个任务优先级映射成一个系统优先级.这可能引起优先级映射问题,使映射前可调度的系统(任务集合)在映射后变得不可调度.解决这一问题需要减少时间复杂度的映射算法和判定映射后任务可调度性的充分必要条件主要存在3种映射算法:(1)按照任务优先级递减顺序进行映射的DPA(decreasing priority assignment)算法;(2)按照优先级递增顺序进行映射的IPA(Increasing priority assignment)算法;(3)阈值段间映射法(thresh01d segment mapping,简称TSM).描述了3种算法的实现和判定条件,论述并证明了算法特性,分析并通过仿真实验比较了算法的性能,最后总结了3种算法各自的适用场合.比较结果和结论对实时嵌入式系统的设计和实现具有一定的参考价值.
摘要:在混合实时系统中,调度器必须既保证所有硬实时任务严格按照其时间约束在截止期内完成,又要尽可能地提高软实时任务和非实时任务的服务质量.提出了一种严格按比例派发服务器算法(RPDS),并以此为基础构建了一种层次式调度框架.RPDS将处理器时间流分成连续的小段,并在每一小段中强制为非硬实时任务分配一个时间片.实验结果表明,RPDS可以合理地为各种类型应用分配处理器时间,并且降低了实时任务的截止期错失率.
摘要:面向Aspect软件设计是一种新的软件设计思想和技术.分析了近年来操作系统贯穿特性与Aspect概念,构件重构、系统演化与设计,系统安全、性能检测与容错这3个方面的研究成果,指出面向Aspect操作系统研究已经获得了积极的成果.但是,目前的研究缺乏一定的深度和广度,尚没有在操作系统的设计阶段运用AOP(Aspect-Oriented operating)思想的成果出现.在已有操作系统代码中抽象Aspect的过程中,缺乏完整的工程化和规范化的研究.这些问题的解决有赖于面向Aspect研究的进一步深入.最后,对面向Aspect操作系统研究的前景进行展望,认为有关AOSD(Aspect-Oriented software development)的研究有可能对未来操作系统的发展产生重大影响.
摘要:符号化WCET(worst-case execution time)分析是用符号表达式表示任务的最大执行时间:表达式中包含了参数.通过在运行时刻快速确定表达式值,符号化WCET分析可以更精确地估算WCET.提出了一种针对其分支直接依赖于输入数据的程序的符号化WCET分析方法.首先对Blieberger方法进行扩充,使得WCET符号表达式能够表达依赖输入分支,然后利用程序的控制依赖图对符号表达式进行化简,从而产生带条件的WCET符号表达式,即不同的条件对应不同的符号表达式.与已有方法不同,符号化WCET公式直接依赖于输入参数,使得运行时的WCET估算更加简单直接.
摘要:基于发布/订阅模式的事件通知服务,作为基本的通信与集成基础设施已广泛应用于分布式应用系统.由于日益增长的应用需求,事件通知服务需要应对各种来自不同应用领域的新需求.但在开发基于事件中间件的分布式应用时,开发者面临特殊化与通用化通知服务的两难选择.针对这种现状,提出了一种灵活的解决方法,设计一个动态可扩展和可配置的事件通知服务体系结构,允许针对不同应用领域定制不同的通知服务.该体系结构基于XML的可扩展订阅、事件、协议和配置语言,以配置管理和元服务管理的机制,提供了通知服务功能的动态扩展和定制以及非功能性特征的满足.