主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2021年第1期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
罗法蕾,王苫社,马俊铖,马思伟,高文.面向CPU-GPU平台的HEVC编码器优化.软件学报,2015,26(S2):239-246
面向CPU-GPU平台的HEVC编码器优化
HEVC Encoder Optimization for CPU-GPU Platform
投稿时间:2015-05-15  修订日期:2015-10-12
DOI:
中文关键词:  高效视频编码  图形处理单元  帧内编码  帧间编码  环路滤波
英文关键词:high efficiency video coding  graphic processing unit  intra coding  inter coding  loop filtering
基金项目:国家高技术研究发展计划(863)(2015AA015903);国家自然科学基金(61322106, 61272255);深圳市孔雀计划;北京市优秀博士学位论文导师奖资助项目(20128000103)
作者单位E-mail
罗法蕾 中国科学院计算技术研究所, 北京 100190
中国科学院大学, 北京 100049 
 
王苫社 北京大学数字媒体所 & 协同创新中心, 北京 100871  
马俊铖 北京大学数字媒体所 & 协同创新中心, 北京 100871  
马思伟 北京大学数字媒体所 & 协同创新中心, 北京 100871
北京大学深圳研究生院, 广东深圳 518055 
swma@pku.edu.cn 
高文 中国科学院计算技术研究所, 北京 100190
北京大学数字媒体所 & 协同创新中心, 北京 100871
北京大学深圳研究生院, 广东深圳 518055 
 
摘要点击次数: 2217
全文下载次数: 1598
中文摘要:
      针对CPU-GPU平台提供了一种能显著降低高效视频编码(high efficiency video coding,简称HEVC)复杂度的优化方案.根据编码器的复杂度分布及不同模块的特点,针对帧内预测、帧间预测以及环路滤波分别进行了优化.在帧内预测中,基于相邻编码单元(coding unit,简称CU)之间的相关性,提出了一种CU的深度决策方法以及一种减少率失真优化(RDO)的模式数量的方法,降低了帧内编码的复杂度.在帧间预测中,提出将耗时最大的运动估计模块完善在图形处理单元(GPU)上,通过中央处理单元(CPU)和GPU的流水线工作获得了明显的加速,并基于预测残差的能量提出了一种编码单元提前终止划分的方法,有效降低了帧间编码复杂度.在环路滤波中,提出了一种GPU端的自适应样本点补偿(sample adaptive offset,简称SAO)参数决策方法及去块滤波方法,有效分担了CPU端的复杂度.上述优化实现在HM16.2上,实验结果表明,提出的优化方案可以获得高达68%的编码复杂度节省,而平均性能损失仅为0.5%.
英文摘要:
      This paper provides a comprehensive optimization strategy aiming at reducing the complexity of high efficiency video coding (HEVC) encoder with CPU-GPU cooperation. Based on the computational complexity distribution of HEVC encoder and characteristics of different modules and coding tools, intra coding, inter coding and in-loop filtering are collaboratively optimized. For intra coding, based on the correlation between neighboring coding units (CUs), depth range of CU is predicted and the number of candidates in intra mode candidate set for RDO (rate distortion optimization) is cut down, to avoid unnecessary computations. For inter coding, the most time consuming module, motion estimation (ME), is implemented with the collaboration of CPU and GPU in pipeline. Based on the energy of prediction residuals, an early termination scheme of CU splitting is proposed in this paper. For in-loop filtering, GPU based sample adaptive offset (SAO) parameter decision scheme and GPU based deblocking scheme are proposed to further reduce the coding complexity on CPU. The overall optimization scheme is implemented on the HM 16.2 platform, and experiments demonstrate that the proposed optimization scheme can reduce over 68% of the coding complexity of HEVC encoder, with only 0.5% performance loss in average.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利