主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2020年专刊出版计划 微信服务介绍 最新一期:2019年第12期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
黄梦成,刘芳,刘学慧,吴恩华.基于CUDA 渲染器的顺序独立透明现象的单遍高效绘制.软件学报,2011,22(8):1927-1933
基于CUDA 渲染器的顺序独立透明现象的单遍高效绘制
Efficient Rendering of Single-Pass Order-Independent Transparency via CUDA Renderer
投稿时间:2010-01-05  修订日期:2010-08-13
DOI:10.3724/SP.J.1001.2011.03932
中文关键词:  图形处理器  计算统一设备架构  顺序独立的透明现象  深度剥离  原子操作
英文关键词:graphics processing unit  compute unified device architecture  order-independent transparency  depth peeling  atomic operation
基金项目:国家自然科学基金(60833007, 60773030); 国家重点基础研究发展计划(973)(2009CB320802); 国家高技术研究发展计划(863)(2008AA01Z301); 中国科学院知识创新工程重大项目(KGCX1-YW-13); 中国科学院信息化专项(INFO-115-B01); 澳门大学研究基金
作者单位E-mail
黄梦成 中国科学院 软件研究所 计算机科学国家重点实验室,北京 100190
中国科学院 研究生院,北京 100049 
 
刘芳 中国科学院 软件研究所 计算机科学国家重点实验室,北京 100190
中国科学院 计算机网络信息中心 超级计算中心,北京 100190 
liufang@sccas.cn 
刘学慧 中国科学院 软件研究所 计算机科学国家重点实验室,北京 100190  
吴恩华 中国科学院 软件研究所 计算机科学国家重点实验室,北京 100190
澳门大学 科学技术学院 电脑与资讯科学系,澳门 
 
摘要点击次数: 3516
全文下载次数: 3456
中文摘要:
      提出一种顺序独立透明现象的单遍高效绘制算法.首先设计了一个基于计算统一设备架构(compute unified device architecture,简称CUDA)的可编程渲染器.该系统采用扫描线算法光栅化场景,为每个像素生成多个对应的片元,同时,在GPU(graphics processing unit)的全局内存上为每个像素分配一个数组,以存储其相应的片元.基于这个框架,提出了两种并发的片元收集及排序策略,以单遍高效地绘制顺序独立的透明现象.第1 种策略利用CUDA 的原子操作符atomicMin 收集各个像素上对应的所有片元并按深度动态排序,在后处理中片元即可按序逐一融合;第2 种策略采用CUDA 的原子操作符atomicInc 按光栅化顺序收集所有片元,然后在后处理中按深度排序后再逐一融合.实验结果表明,与基于传统图形管线的经典深度剥离方法相比,该方法可以更高效地绘制顺序独立的透明现象,同时生成正确的绘制效果.
英文摘要:
      This paper presents a highly efficient algorithm for efficient order-independent transparency via compute unified device architecture (CUDA) in a single geometry pass. The study designs a CUDA renderer system to rasterize the scene by the scan-line algorithm, generating multiple fragments for each pixel. Meanwhile, a fixed size array is allocated per pixel in a GPU (graphics processing unit) global memory for storage. Next, this paper describes two schemes to capture and sorts the fragments per pixel via the atomic operations in CUDA. The first scheme stores the depth values of the fragments into an array of the corresponding pixel and sorts them on the fly using the atomicMin operation in CUDA. A following CUDA kernel will blend the fragments per pixel in depth order. The second scheme captures the fragments in rasterization order using the atomicInc operation in CUDA. During post-processing, the fragments per pixel array will be sorted in depth order before blending. Experimental result shows that this algorithm shows a significant improvement in classical depth peeling, producing faithful results.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利