三维片上网络以其更短的全局互连、更高的封装密度、更小的体积等诸多优势,已引起国内外学术界和产业界的高度重视.对三维片上网络的研究,将直接影响一个国家未来三维集成电路和三维芯片产业的发展,也关系到国家安全.近年来,三维片上网络逐渐成为片上网络研究领域的一个重要方向,已取得了许多研究进展,但仍然存在许多挑战性的课题.对三维片上网络的基本问题作了简介;分析了三维片上网络在国内外的研究现状;讨论了三维片上网络研究中的关键问题,归纳出网络拓扑结构、路由机制、性能评估、通信容错、功耗、映射、测试、交换技术、服务质量、流量控制、资源网络接口等12类研究课题;分类综述了关键问题的研究进展;分析了三维片上网络存在的问题;指出,在三维片上网络拓扑结构方面:个性化拓扑结构设计、仿真平台研究开发、基于新型拓扑结构的三维芯片样片试制以及无线技术的引入等,在路由算法方面:适合3D Torus的路由算法、结合无关路由与自适应路由算法优点的新路由算法、适合各种新型拓扑结构的高效路由算法等,在性能评估方面:永久故障的容错、改进仿真程序增加对物理链路的建模、充分考虑通信的局部性等,在功耗方面:对拓扑结构/映射算法/路由算法和布局进行综合优化、动态和静态控制相结合、更为精确的3D NoC功耗模型等,在映射方面:发热均匀性、动态路由策略下映射评估模型的优化、低功耗映射算法、基于优化算法的组合映射等,都将是三维片上网络未来的重要研究课题.
3D NoC has attracted a lot of attention from both academia and industry with the advantages such as shorter global connection, higher integration density and smaller size. The research on 3D NoCs not only directly affects the development of 3D IC and 3D chip industries but also influences national security. In recent years, 3D NoC has become an important trend in the research of network-on-chip with considerable progress, but many challenges remain. This paper gives a brief introduction of the major issues and reviews the state of arts. It reviews the key problems for the research of 3D NoC in 12 categories including network topology, routing mechanism, performance evaluation, communication fault tolerance, power consumption, mapping, testing, switching technique, QoS, flow control, and resource network interface. It then discusses in detail the research progress and solutions for each type of problems. The problems for network topology include customized topology design for 3D NoC, development of simulation platforms, prototype of 3D NoC based on new topologies and the introduction of wireless. The problems for routing algorithms include new routing algorithm for 3D Torus, new routing algorithms based on the combination of oblivious routing and adaptive routing. The problems for fault tolerance include fault tolerance for permanent errors, adding simulation of the physical link into the original simulation platform, and taking the locality of the communications into consideration. The problems for power consumption include the comprehensive optimization of topology, routing and floorplanning, combination of static and dynamic controls, and power consumption model for 3D NoC with more accuracy. The problems for mapping include balance of heat precipitation, optimization of mapping evaluation model under the dynamic routing strategy, low power mapping algorithms, and mapping combination based on intelligent optimization algorithms. The problems mentioned above all deserve the attention for future research on 3D NoCs.
1958年,美国物理学家Jack Kilby发明了世界上第一个集成电路,这项技术改变了整个世界,并且一直影响至今,Kilby也因此于2000年获得了诺贝尔物理学奖[
随着SoC规模的扩大和复杂度的增加,片上互连成为系统性能的瓶颈[ 4×4的2D Mesh架构 4×4 2D Mesh architecture
随着芯片集成度的进一步提高,受二维布局条件的限制,2D NoC难以保证关键部件相邻,难以缩短关键路径长度及减少信号延迟;与此同时,基于三维封装(three-dimensional packaging)技术的3D IC技术有了长足发展,为此,3D NoC应运而生.2005年,Liu等人首次提出了3D NoC的概念[ 3×3×3的3D Mesh架构 3×3×3 3D Mesh architecture
3D NoC采用将多个具有二维结构的芯片用三维封装的方式封装成一个芯片,芯片与芯片之间主要依靠硅通孔技术(through-silicon-via,简称TSV)互连.硅通孔技术是通过在芯片和芯片之间、晶圆和晶圆之间蚀刻出垂直通孔,通孔中注满金属以实现芯片之间互连的最新技术[
国内外关于3D NoC的研究方兴未艾,有许多大学和研究机构加入到这项研究之中,公开发表了大量以3D NoC为主题的学术论文,研究开发了3D NoC仿真平台,极大地促进了该领域的发展.
最早有关3D NoC的论文公开发表于2005年[ 每年发表的3D NoC相关论文数 Papers published every year related to 3D NoC
国内许多研究机构和大学都开展了3D NoC方面的研究,国家自然科学基金自2009年开始对3D NoC相关项目进行资助,至今共资助10项相关项目,研究内容涉及拓扑结构、通信技术、容错技术以及热均衡等多个方面,见 国家自然科学基金资助的3D NoC项目 3D NoC project funded by the National Natural Science Foundation
项目批准号/ 申请代码 项目名称 项目 负责人 依托单位 批准 金额(万元) 项目起止年月 60876017/ F040201 三维片上网络(3D NoC) 关键技术研究 李丽 南京大学 36 2009-09至 2011-12 61006024/ F040201 三维片上网络热均衡 关键技术研究 张多利 合肥工业大学 21 2011-01至 2013-12 61176037/ F040205 基于高可靠链路设计的 D NOC系统通信关键技术研究 王琴 上海交通大学 72 2012-01至 2015-12 61176024/ F040201 三维片上网络存储 体系结构研究 李丽 南京大学 60 2012-01至 2015-12 61106018/ F040201 专用三维片上网络体系 结构综合技术研究 葛芬 南京航空航天大学 25 2012-01至 2014-12 61106020/ F040201 面向成品率的三维片上 网络TSV容错技术研究 杜高明 合肥工业大学 25 2012-01至 2014-12 61272006/ F020305 基于柏拉图立体多级裂变模型的 三维片上网络拓扑结构的研究 张大坤 天津工业大学 61 2013-01至 2016-12 61376031/ F040202 面向多核处理器应用的三维电感耦合 互连通道模型及其3D NoC结构研究 邹雪城 华中科技大学 90 2014-01至 2017-12 61474087/ F040201 三维片上网络芯片 关键设计技术研究 周端 西安电子科技大学 91 2015-01至 2018-12
61474036/ F040206 三维片上网络通信 自适应容错方法研究 欧阳一鸣 合肥工业大学 77 2015-01至 2018-12
我国关于3D NoC方面的研究相对发达国家起步较晚,但近年来也取得了许多研究成果,为我国未来的三维集成电路和三维芯片产业发展奠定了重要基础.南京大学李丽等人在3D NoC方面的研究较早,他们在研究过程中提出了一个新的体系结构——hybird hierarchical architecture[
国际上关于3D NoC的研究起步较早,在网络拓扑和路由器结构方面,美国宾夕法尼亚州立大学(Pennsylvania State University)Xie等人的研究较为深入,主要研究的是系统级仿真、动态虚通道、路由器结构、多维映射和布局布线的影响等,他们在3D IC设计以及系统架构方面取得了重要的研究成果[
计算机仿真是继科学实验和理论指导之后,科学探索和工程实践的第三推动力,它在3D NoC的研究中显得尤其重要.目前,国内外在3D NoC的研究中,大部分理论验证和实验都是在计算机仿真平台上进行的,其主要原因是:专门设计一个实际的3D NoC芯片来验证有关设计理论、设计方案以及算法的优劣,其成本极高、难以实施.特别是随着3D IC和3D NoC技术的发展,三维芯片上集成的IP核数不断增加,异构3D NoC的需求也不断增加,使得3D NoC设计工作变得越来越复杂,完成3D NoC设计所花的时间和成本急剧增加.3D NoC的研究始于2005年[
VNOC3是由美国北达科他州立大学de Paulo等人研发的、用于研究2层和3层3D NoC的仿真框架,该框架是在一个低版本VNOC(一个周期精确的NoC仿真器)和一个B*树布局规划器的基础上开发的.对于3层架构的NoC,它采用hMetis划分器对任务图进行划分.框架还包括GUI图形功能和可以用来产生新的跟踪文件的隐藏选项.该工具虽然是在Linux系统Fedora 8上开发的,但也可以在Windows系统中编译运行.
Access Noxim是由台湾大学Jheng等人开发的、将网络模型、功率模型和热模型相结合的3D NoC仿真平台,该仿真平台将Noxim和HotSpot相结合,并采用Intel的80-core处理器的功率模型.为了与HotSpot (HotSpot提供架构级热模型)进行结合,3D NoC仿真器需要将其架构级布局和功率跟踪转换为芯片级物理布局和功率追踪.首先添加基础三维路由器模型和垂直开关路由,将Noxim进行扩展来产生基于用户定义维数的3D NoC架构,之后插入一个模型,将架构级布局直接转换成物理布局.
Nigram是由英国南安普顿大学和印度Malaviya国家技术研究院共同研发、周期精确的3D NoC仿真器,能够仿真不同拓扑结构的路由算法和应用程序.Nigram是一个可扩展、模块化、基于System C的仿真器,允许在3D NoC设计的不同阶段(拓扑、交换技术、虚拟通道、缓冲参数、路由机制和应用程序等)尝试不同的可用选项;除了内置功能,对于新的应用程序和路由算法,可以很方便地进行扩展;对于给定的选项设置,仿真器可以输出延迟、吞吐量等性能指标.
gpNoCsim是由美国罗切斯特大学Hossain等人研发的基于Java、支持不同3D NoC架构(Mesh,Torus, Butterfly Fat Tree等)评估的通用仿真器,其模块化的设计使其便于接受新的架构.仿真器源代码和手册可以在www.buet.bd/cse/research/group/noc/上进行下载.
3D NoC的研究涉及许多方面,其中要解决的关键问题可归纳如下:网络拓扑结构、路由机制、性能评估、容错、功耗、映射、测试、交换技术、服务质量、流量控制以及资源网络接口等.
(1) 网络拓扑结构.3D NoC网络传输消息的能力主要依赖于拓扑结构,它对网络延迟、吞吐量、面积、容错以及功耗等都有很大影响,同时对设计策略和内核到网络节点的映射起着重要的作用.选择合适的3D NoC拓扑结构,是3D NoC设计中非常关键的问题之一;
(2) 路由机制.路由是确定一个消息从源节点到目的节点的路径机制.区别于总线结构,3D NoC的一个重要特征是采用包交换路由.包交换既可以在源节点上实现路由,也可以在每一跳节点上实现路由,相应地称为源路由和分布式路由.无论是哪类路由算法,都应该有效地解决死锁、活锁和饥饿等问题;
(3) 性能评估.性能评估是3D NoC设计的一个重要方面.为了比较不同的3D NoC结构,必须使用一套标准的性能评价指标.评估一个3D NoC的性能主要包括以下4个方面[
(4) 容错.3D NoC容错对象主要包括硬错和软错两方面:硬错,即芯片内部物理缺陷,包括路由器本身和路由器之间连线等缺陷;软错,即芯片内部数据传输过程中,由于各种原因(如串扰、噪声、宇宙射线等)导致的信号翻转.容错性问题是一个系统问题,常见的容错方法主要是从物理层、数据链路层和网络层3个方面着手;
(5) 低功耗.3D NoC的功耗与拓扑结构、路由器结构、路由算法等密切相关.拓扑结构直接影响到IP核间的通信,对整个芯片的功耗和吞吐率优化起到非常重要的作用.路由算法的目标是正确、有效地传输数据包.良好的路由算法可以提高网络的性能、降低功耗和延时、保证3D NoC系统的容错性[
(6) 映射算法.映射是在给定任务图、设计约束(延迟和功耗等)和IP核库的基础上,将每个任务分配到合适的IP核上,安排每个IP核上的任务执行顺序,然后再决定每个IP核在3D NoC拓扑结构中的位置;
(7) 测试.芯片的复杂度和集成度越来越高,测试成本比设计和制造成本更高、耗费时间更长.因此,如何更高效地完成3D NoC测试已成为研究热点[
(8) 交换技术.交换技术决定交换节点何时、如何连接其输入与输出端口,交换技术包括包交换和电路交换两种主要类型;
(9) 服务质量.服务质量(quality of service,简称QoS)被定义为网络提供给IP核需要的服务数量,包含两方面内容:① 定义了某一数量的服务;② 服务协商.服务应该具有高吞吐量、低延迟以及低功耗等特点,协商是指在IP核需求的服务与网络提供的现有服务之间实现平衡;
(10) 流量控制.在3D NoC领域,流量控制被特定用于控制交换节点间、端到端之间的传输协议的业务量.通过避免缓冲区溢出及丢包,这些协议提供了平滑通信量策略;
(11) 资源网络接口.资源网络接口(resource network interface,简称RNI)是资源(IP核)与网络间的接口,通过RNI,IP核可以用最小的代价使用网络.同时,IP核和网络资源都可以重用.RNI在功能上可以分为两个部分:其一,连接网络的部分,与IP核无关;其二,连接到IP核,与资源相关;
(12) 其他.3D NoC还涉及节点布局、性能仿真以及定时等方面的研究.
自2005年3D NoC首次被提出,可查到的有关3D NoC关键问题研究公开发表的各方向的学术论文所占比例如 3D NoC各关键问题研究领域发表论文所占比例 Proportion of related papers of each key problem in 3D NoC
自2005年第一篇关于3D NoC的学术论文发表以来,国内外有许多科技工作者对这一领域的关键问题进行了大量的研究,并取得了许多研究成果.
综合国内外目前的研究成果,3D NoC拓扑结构可归纳为63种,可以从不同角度进行分类.由于3D NoC主要解决通信瓶颈问题,可以从通信角度将3D NoC拓扑结构分为9大类,如 3D NoC拓扑结构分类 3D NoC topology classification
基于Mesh的3D NoC拓扑结构包括:直接扩展的3D Mesh[
基于Torus的3D NoC拓扑结构包括:对称3D Torus[
Cluster Mesh拓扑结构包括:Cluster Mesh[
构[
传统的移位交换网如 基于移位交换网的3D NoC拓扑结构 3D NoC based on shuffle-exchange topology
相邻节点的地址满足循环移位或者交换(地址的最低位取反)关系基于移位交换网络的3D NoC拓扑结构,包括:基于移位交换网的3D NoC拓扑[
● 基于移位交换网的3D NoC拓扑如
● 基于桥接De Bruijn图的3D NoC芯片内网络采用直径小、节点度固定、路由灵活的De Bruijn图[
● 基于环接De Bruijn图的3D NoC芯片内网络采用De Bruijn图,芯片之间采用双环将三维结构上的各个节点连接起来以实现容错.
基于超立体结构的3D NoC拓扑结构包括:三维超立方体结构[ 四维超立方体拓扑结构 Four-Dimensional hypercube topology
基于正多边形阵列的3D NoC拓扑结构包括:蜂窝状3D NoC拓扑[ 三维蜂窝Mesh架构 Architecture of 3D honeycomb Mesh network
面向应用的组合拓扑结构包括:XNoTs[ CMP感知的特定应用的3D NoC CMP-Aware application-specific 3D NoC
容错3D NoC拓扑结构包括:局部虚拟信道共享架构[
还有一些3D NoC拓扑结构,如:基于树图的3D NoC[ 蝶形胖树及其三维架构 BFT and its 3D architectures
拓扑结构性能比较一览表 Performance comparison of different topologies
类别 序号 拓扑结构 特点 基于 Mesh的 3D NoC 拓扑 结构 1 直接扩展的3D Mesh 结构简单、可扩展性好、容易实现,但网络直径和平均延迟较大 2 堆叠3D Mesh 比3D Mesh结构的网络延迟小, 但垂直方向上延续了总线结构的缺点 3 纤毛3D Mesh 网络利用率高、延迟小, 但路由节点的通信负载较重、容易产生拥塞 4 真正3D Crossbar 支持灵活快速路由,但复杂度和能耗急剧增加 5 低功率异构3D NoC 功率低、结合了3D Mesh中2D路由 和3D NoC总线混合路由架构的优势 6 三维直接访问 多端口缓冲架构 设计灵活、使得全局布线延迟降低、 互连架构性能提高、缓和了深亚微米技术的负面影响 7 层复用3D NoC 最坏情况下可实现与传统3D Mesh中 最好的无关路由算法相同的吞吐量 8 MIRA 减小了整体面积需求、降低了能耗, 但难以复用高度优化的2D IP核设计 9 基于3D Mesh的 双链路互连架构 通信带宽加倍、降低了消息传输的路由跳数、 网络平均延迟降低和最大吞吐量提高,但增加了控制逻辑电路 10 3D互连网络拓扑 低基数、低直径 11 基于双向双同步垂直 通道的3D NoC架构 减少垂直互连的面积区域 12 垂直部分连接的3D NoC 每层的拓扑结构和规模都可以不同、路由算法也可以不同 13 基于异构布局的3D NoC 减少芯片的面积区域、物理链路也随之减少、提高了网络性能 14 Tiny NoC 可扩展的、高效的3D Mesh架构、 实现延迟和芯片面积的最小化 基于 Torus的 3D NoC 拓扑 结构 15 3D对称Torus 全对称网络、其中的每个节点均可以作为网络的中心节点 16 3D堆叠Torus 将多层2D Torus结构堆叠、每层顺次连接、 去掉了垂直方向的长线 17 3D X-Torus 层间通信需要通过纵向路由器实现且均可用2跳完成 18 压缩的3D Torus架构 提高了可扩展性,低了平均跳步数、路由节点和链路的需求 Cluster Mesh 拓扑 结构 19 Cluster Mesh 共享垂直链路,降低了TSV数量、面积和能耗 20 基于网格和基于环的拓扑 每个IP核通过路由器连接网络、每个路由器依次 与相邻路由器连接、每4个点组成一个聚类 21 基于Cmesh和TSV的3D NoC 克服了Cmesh拓扑的局限性, 通过降低路由器密度比率提高吞吐量 22 三维多聚类片上网络的 混合分层架构 由聚类、路由器和路由器之间的互连构成 23 采用先进层间总线架构的 基于分簇拓扑的3D NoC 层间通信通过聚类节点实现、聚类节点 有一个聚类核心来建立接口到垂直总线的垂直通信 24 基于分簇拓扑的 三维堆叠架构 每层垂直通道的数量减少、有更好的空间和功率, 但当层间信息交换增加时性能可能下降 25 三维递归网络拓扑 局部垂直互连,具有哈密顿性 26 基于部分重叠集群的 3D NoC拓扑 通过灵活地共享部分垂直链接减少了路由器 和TSV的数量,从而减少开销、提高了性能 基于 移位 交换 网络的 3D NoC 拓扑 结构 27 基于移位交换网的3D NoC 路由时数据包先在各行之间传递, 达到目的行后再在行上传递到目的节点 28 基于桥接De Bruijn图的 3D NoC 网络直径小、平均延时小、吞吐率高且功耗低,避免数据包 在桥接结构中的额外路由开销、减轻了交换节点的通信负荷 29 基于环接De Bruijn图的 3D NoC 同层节点之间的数据传递高速、有效, 跨层节点之间的数据传递路由机制简单 30 基于双De Bruijn图的 3D NoC 网络直径较小、节点度固定、路由灵活,但同时在水平方向和 垂直方向采用De Bruijn图会使得芯片内的布局、布线有一定难度 31 基于增强桥接De Bruijn图的 3D NoC 低延迟、路由简单、低功耗、容错、可扩展性好 32 Kautz Mesh 通过快速垂直互连连接垂直节点、性能明显优于2D架构 基于 超立体 结构的 3D NoC 拓扑结构 33 3D超立方体结构 对称性好、网络直径短、可扩展性好 34 3D超Mesh 提高了超立方体的可扩展性、降低了节点度 和成本、增加了Mesh的直径和对剖宽度 35 3D超Torus 节点和边均为对称结构且具有可扩展性 36 3D超立方体双环拓扑 在保持节点度不变的情况下可进行网络扩展, 可分组性与超立方体的可分组性相同 37 3D Torus连接的Petersen图拓扑 正规、对称、可扩展的互连网络, 网络扩展和路由算法较易实现 38 3D长方形纽花环网络拓扑 减小了平均距离和直径、增强了系统的本地特性、 提高了网络性能、且使节点编码和路由消息更加简单 39 环嵌入超立方体结构 随着网络规模的扩大,节点度增加,但直径仍然较小 40 分层Torus 更低的传输时间、更高的吞吐量和更低的延迟 41 对称圆环Torus 节点度固定、网络直径小、成本低、 平均距离小、更好的容错性能 基于 正多边形 阵列的 3D NoC 拓扑结构 42 蜂窝状3D NoC 四度蜂窝可以减少垂直链路的数量,从而节约成本 43 基于Spidergon的通用三维拓扑 结构顶点对称,提供了设计的 方便性、规则性、低节点度 44 3D Octagon双环NoC拓扑结构 网络距离短、灵活、布线复杂度 明显低于交叉开关结构 面向 应用的 组合 拓扑结构 45 XNoTs 减少了芯片间的路由跳数、提高了吞吐率, 但加重了交换节点通信负荷 46 SunFloor 3D 显著地降低了功耗和延迟 47 3D处理器-存储器架构 访问片外存储器及存储访问的时间相对较短、能耗较低 48 3D光学NoC拓扑 在光层集成了一个光数据传输网络, 用于连接所有使用光互连Cygnus路由交换结构 49 3D存储器网络架构 使用嵌入到L2高速缓存中的网络结构的 路由体系结构和拓扑结构 50 应用于特定程序的3D NoC 功耗低、跳数少 51 CMP感知的特定应用的3D NoC 高度变化小、跳数少、总线长度短 52 基于聚类的功率感知拓扑结构 功耗低、网络资源得到改善 53 最小重构三维堆叠 纳米光子片上网络架构 高能效、可重构 容错 3D NoC 拓扑结构 54 局部虚拟信道共享NoC架构 降低故障对系统性能的影响、可以容忍 路由逻辑故障,实现了自主的虚拟信道缓冲共享 55 同构并行集中Mesh 极大地降低了功耗和延迟,但增加了制造成本和热影响 56 特定应用程序容错NoC拓扑合成 改善容错性、降低功耗 57 基于Mesh的容错3D NoC 提高芯片的可靠性和合格率、提供了容错机制 与有效替代路径的搜索时间之间的折中分析 其他类型 3D NoC 拓扑结构 58 基于树图的3D NoC 网络直径小、能耗低、布线面积减小、但交换网络结构复杂 59 三维合成CLOS NoC 减少路由区和线的长度、掩模重用、缩短设计周期 60 序列化垂直通道3D NoC 更小的性能退化和更低的功耗、 面积区域降低、且能避免互连的路由阻塞 61 一种新型3D NoC拓扑模型Shuttle 节省了跳数 62 基于蝴蝶胖树拓扑的 低延迟扩展3D NoC 减少以跳数衡量的网络延迟
63 小功耗分层3D NoC 在面积、功耗方面均有很大优势
综合分析可查到的有关3D NoC路由算法的学术论文,将目前的3D NoC路由算法进行归类总结,并将其分成无关路由算法、自适应路由算法和其他路由算法这3类[
无关路由算法是一种常见的路由算法,它的路由路径只与源节点地址和目的节点地址有关,在给定源节点和目的节点地址的前提下,路由的下一跳节点随机决定,而与当前的网络状态无关.无关路由的优点是路由算法简单,在网络低拥塞环境下能够获得较低的延迟.但是,由于其不能响应动态的网络状态变化,所以当网络拥塞增加时,性能迅速降低.
确定性维序XYZ路由算法[ XYZ和VDR之间的对比 Comparison between XYZ and VDR
自适应路由算法是指数据包的路由路径不仅与源节点和目的节点的地址有关,还要考虑网络的即时流量和拥塞状况,即:源节点与目的节点地址相同的数据包在不同的网络状态下,它们的路由路径也可能不同.自适应路由算法的优点是避免了网络拥塞,可以获得更高的网络带宽和吞吐量;但是路由逻辑复杂、需要的资源较多、实现起来较困难,并且在低拥塞的情况下开销较大,而且还存在死锁问题.
目前,主要的自适应路由算法有:LFDRA路由算法[ LFDRA路由算法示意 Example of LFDRA routing algorithm
电子科技大学张宇阳等人提出了DFTR(dual flit transmission rate)路由架构[
性能评估是3D NoC设计中需要考虑的一个重要因素,为了比较不同的3D NoC结构,必须使用一套标准的性能评价指标.评估一个3D NoC的性能主要包括以下几个方面:吞吐量、延迟[167-169]、面积[
性能评估主要是在特定条件下针对特定拓扑结构的评估.例如:在均衡负载模式和对称随机负载模式下3D Torus网络延迟和吞吐率的评估[
性能评估的方法有很多,如:基于网络演算对片上网络进行系统建模和性能分析[
NoC的互连网络功耗有如下定义:NoC内节点之间由数据交换所产生的功耗[
巴西UFRGS信息学研究所Matos等人提出了一种小功耗分层3D NoC拓扑[
日本会津大学Ahmed等人提出的LA(look-ahead)-XYZ算法可以被分为两步:分配下一个地址和定义新的Next-port[
武汉理工大学郑飞等人提出了基于传递规约无环图的三维布图规划技术3D-TRG,可以根据特定应用优化三维片上网络中模块的布局,从而使功耗更低[ 三维布图规划技术3D-TRG示意图 Three-Dimensional layout planning technology called 3D-TRG
航空电子系统综合技术重点实验室葛芬等人提出一种功率和热感知3D NoC映射方法[
日本庆应义塾大学张浩等人提出了低功耗技术,只有当晶体管的利用率高于阈值时,才通过切断无线垂直链接的发射机中的偏置电压来停止晶体管工作[
综合分析所查到的有关3D NoC映射的研究论文可以看出:大部分3D NoC映射算法是启发式算法,也有一部分非启发式映射算法.3D NoC映射算法的分类如 3D NoC映射算法分类 3D NoC mapping algorithm classification
启发式映射算法中,基于遗传算法的映射算法包括:基于遗传算法的热感知映射算法[
法[
算法 1 . 基于遗传算法的热感知映射算法.
① 指定层数和层的维数;
② 生成
③ 生成芯片平面布局;
④ 初始化算法,包括功率和通信数据;
⑤ while 未到达最大迭代次数 do
⑥ for 每个解决方案
⑦ 生成布局;
⑧ 计算跳步的通信成本;
⑨ 估计每个PE的温度值;
⑩ 记录峰值温度;
⑪ 评估成本函数;
⑫ end for
⑬ 交叉;
⑭ 变异;
⑮ end while
⑯ 输出最佳解决方案
算法 2 . 层间映射优化算法.
① 随机产生一个层间映射结果
② while 初始温度
③ 随机选择两个IP核;
④ while 所选IP核位于
⑤ 改变两个IP核的位置,获得新的层间映射结果
⑥ end while
⑦ if
then
⑧ 将
⑨ end if
⑩ 降低温度;
⑪ end while
⑫ 输出层间映射结果
非启发式映射算法包括:快速低能耗映射算法SYMMAP[ 映射算法性能比较一览表 Performance comparison of different mapping algorithms
分类 序号 3D NoC映射算法 特点 基于遗传 算法的 3D NoC 映射算法 1 基于遗传算法的热感知映射算法 热感知、通信感知、显著地降低系统温度 2 基于逻辑斯蒂函数的 自适应遗传算法 算法收敛速度得到提高、尽可能保证 算法中解的丰富性及变异操作的有效性 3 基于等级制度的多目标 优化遗传映射算法 有效地寻找出近似Pareto最优而非单个解、 在两个维度上提升系统性能 4 基于遗传算法的系统优化方法 能找到性能更好、通信成本更低的系统设计步骤 5 热和竞争感知的映射算法 实现多目标映射、确保较低的复杂度、 达到峰值温度和网络竞争之间的适当平衡 6 3D Mesh热感知映射算法 节点之间的温度偏差减小、峰值温度有所降低 7 功率与热感知映射算法 功耗和节点间温度偏差减小 8 采用虚拟IP的3D NoC映射方法 有效地平衡系统链路负载、降低整体通信能耗 基于蚁群 算法的 3D NoC 映射算法 9 动态蚁群算法 缩短了执行时间、提高了算法 单位时间内的优化能力 10 面向通信能耗的 3D NoC映射算法 通信能耗降低 基于粒子 群算法的 3D NoC 映射算法 11 基于3D-Mesh的CMP 片上网络映射算法 在单个评估模型且同等计算规模下 性能有显著的提升、同时能降低运算规模 12 基于离散粒子群算法的应用程序映射 得到较优的整体通信度量 13 使用八面体遍历的集中式3D映射 极大地降低了通信能耗和延迟 14 基于ARPSO的映射算法 克服了过早收敛的问题、不易陷入局部最优 15 采用仿生优化的拓扑和映射方法 得到更好地选择3D NoC拓扑结构的方法、 并且得到更好的IP映射 基于模拟 退火算法的 3D NoC 映射算法 16 针对最小信号TSV的3D NoC映射算法 信号TSV减少、峰值温度降低 17 基于 3D Mesh的多播映射方案 芯片峰值温度和网络通信开销降低 18 电力输送感知、热感知映射框架 归纳了一种全面解决方案的评估方法、 最小化系统的能耗与延迟 非启发式 3D NoC 映射算法 19 快速低能耗映射方法SYMMAP 在映射速度、通信能耗等方面均具有较大优势 20 常规3D NoC热感知方法 显著地降低功率、同时保证运行的应用程序性能 21 应用程序到多电压3D NoC的映射方法 在满足定时约束的同时实现合理的能源节约 22 功率感知运行时增量映射算法 功率感知、降低通信能耗 23 3种基于ILP的静态热感知映射算法 热感知、优化芯片温度 24 约束带宽的映射算法 在3D NoC中有带宽约束的情况下提高服务质量 25 多目标免疫算法 降低功耗和延迟 26 异构3D NoC映射算法 实现能量和可靠性感知、功耗和延迟大为降低 27 异构处理机映射 在合理的时间内产生令人满意的运算效果
28 3D NoC-总线Mesh架构流量均衡映射算法 降低能耗、能够调节流量和能量最小化之间的平衡
在3D NoC的研究中,还有通信容错、测试、交换技术、服务质量、流量控制、资源网络接口、布局、仿真、定时等研究方向.
在通信容错方面,Nostrum工程[
3D IC具有比传统的平面IC更高的性能,在3D IC上进行有效的测试架构设计和优化技术可以减少IC的测试代价.3D NoC测试时间优化是一个重要的研究方向,目前已提出了多种不同的测试时间优化方法:合肥工业大学欧阳一鸣等人采用了一种在3D NoC中优化测试时间的技术,在均衡各层IP核测试时间的基础上对IP核进行布局,为各层芯片选择合适的IP核,并利用整数线性规划ILP和随机舍入方法,在总的数据位宽限制下,再次为每层芯片分配相应的TAM数据线宽度,进一步减小各层芯片的测试时间,使得总的测试时间最小[
路由协议的设计及属性(死锁和活锁)在很大程度上由交换层提供的服务决定,因此,信息交换技术是反映互连网络性能的一个重要因素[
随着芯片网络中数据量的大幅增加,面对用户越来越高的服务要求,必将出现网络中各种业务服务质量难以保证的问题.3D NoC中服务质量管理已成为一个重要的研究方向[
基于信约的路由器到路由器流量控制机制是3D NoC主要采用的链路级流量控制机制:文献[
资源网络接口(RNI)是资源(IP核)与网络间的接口,通过RNI接口IP核可以用最小的代价使用网络.同时, IP核和网络资源均可重用.文献[
多处理器片上系统对通信带宽的要求与日俱增,结合3D IC和NoC的优点,3D NoC应满足高性能、多功能、缩小芯片面积等设计要求.文献[
(1) 面向需求的芯片设计是未来一个重要的研究方向,主要研究适合于各种特殊需求的3D NoC拓扑结构,即,实现3D NoC拓扑结构的个性化设计;
(2) 国内外对3D NoC拓扑结构的研究方法主要是计算机模拟仿真,目前尚没有成熟的公开商用的3D NoC仿真平台,关于3D NoC仿真平台的研究是未来的一个研究方向;
(3) 国内外对3D NoC拓扑结构的研究大部分停留在计算机模拟仿真阶段,未来基于各种拓扑结构的3D NoC芯片样片试制是一个重要的研究课题;
(4) 在3D NoC拓扑结构中引入无线技术是一个值得尝试的方向.
(1) 目前很少有人研究关于3D Torus的路由算法,而3D Torus比3D Mesh在吞吐量和延迟方面更具优越性,因此,研究适合3D Torus的路由算法是未来的一个研究方向;
(2) 将无关路由与自适应路由算法的优点相结合,研究出具有更好服务质量的路由算法,是今后的一个研究方向;
(3) 随着各种新型3D NoC拓扑结构的提出,研究适合新型拓扑结构的高效路由算法,也将是未来的一个重要研究方向.
(1) 目前,大部分性能优化算法和容错算法都是针对规则3D NoC拓扑结构提出来的,对于不规则3D NoC架构,对其中可能出现的永久故障问题进行容错以提高片上网络性能,是未来的一个研究方向;
(2) 三维芯片层内的互连线和层间的穿透硅连接的长度、带宽以及信号延时都有很大不同,考虑不同架构层间链路与层内链路的异构性以及信号在线传输延时,通过改进实验仿真程序增加对物理链路的建模,是一个值得尝试的研究方向;
(3) 考虑通信的局部性(即,将通信频繁的簇内节点布置在不同层的相同位置上),然后利用短距离、高带宽的穿透硅连接簇内节点,从而增强通信的局部性,减少消息传输延时、提高系统性能,也是一个需要探索的问题.
(1) 目前,大部分关于功耗的研究都是针对某个方面的功耗优化,对拓扑结构、映射算法、路由算法和布局进行联合优化,是未来的一个研究方向;
(2) 现有的功率控制机制只能动态地运行,当考虑到应用程序的属性时,静态开关机制是非常有利的,静态地关闭目标应用程序的一些链接可以显著地降低功耗,而且没有额外开销.将动态控制和静态控制相结合,是未来的研究方向;
(3) 穿透硅的尺寸、密度、跳变数等因素对功耗会产生很大影响,将3D NoC穿透硅层电路功耗模型与现有的3D NoC功耗模型相结合,提出更为精确的3D NoC功耗模型,是一个值得尝试的研究方向.
(1) 3D NoC在增加芯片封装密度和单芯片可集成IP核数的同时,也增加了芯片的能耗密度.因此,低能耗映射在3D NoC的设计过程中显得尤为重要,发热均匀性是未来映射算法设计需要考虑的一个重要因素;
(2) 为了计算在最大延迟模型和流量均衡模型下的参数,现有的映射算法往往设定唯一的路由策略,如XYZ路由算法,这个设定使得算法只适应于各CPU之间通信任务量确定的应用场合,面对突发通信任务较多的应用,一般采用基于动态调整的路由策略.然而,当路由策略采用动态调整时,片上网络路由节点之间的路由路径将由当时的网络拥塞情况决定,此时无法再准确地计算出每个任务的实际延迟时间.因此,如何解决动态路由策略下映射评估模型的优化,是一个需要着重研究的课题;
(3) 目前,大部分3D NoC映射算法都是针对三维规则拓扑结构而提出的,但在实际需求中,面向应用的三维芯片往往具有异构的拓扑结构.因此,个性化3D NoC拓扑结构下低功耗映射算法的研究,是未来3D NoC映射问题的一个研究重点;
(4) 在现阶段研究成果中,3D NoC映射问题的求解大量采用启发式算法,如文中提到的遗传算法、模拟退火算法等都属于这一类.在今后的研究中,可以将不同的优化算法进行组合,例如将模拟退火算法的思想与粒子群算法相结合,以更好地解决3D NoC低功耗映射问题.
3D NoC能够有效地解决2D NoC布局受限、难以缩短关键路径长度及减少信号延迟等问题,具有很好的发展前景.本文分析总结了3D NoC的研究现状,对3D NoC解决的关键技术问题进行了分类综述,指出了3D NoC各研究方向存在的问题和发展趋势,对深入开展3D NoC的理论和应用研究都具有重要的意义和参考价值.
国家自然科学基金(61272006)