高清视频编码在可重构处理器中的映射实现(二)
出处:电子爱好者博客 发布于:2013-04-24 10:04:32
相关资料:
3.3 环内算法
环内算法主要包括残差、DCT、量化、哈达玛变换、反DCT、反量化、反残差等。本文主要介绍DCT和量化在可重构处理器中的映射,反DCT和反量化映射过程与两者类似,在此不再赘述。
3.3.1 DCT算法映射
整数变换编码主要是将运动补偿后的残差数据从时域变换到频域。H.264标准中采用的是基于4×4块的整数DCT变换。二维DCT的计算公式如下:
二维DCT 进行了两次相同的矩阵运算,将待处理的像素子块进行转置后和矩阵Cf相乘,运算的结果再与Cf进行运算,即完成DCT 的运算。算法中矩阵运算的映射如图5所示。矩阵C 的每一行与X 的运算用4路运算并行实现,同时,矩阵C 的运算也是用4路并行运算实现的。
图5 DCT算法在ReMAP中的映射
Fig.5 DCT algorithm mapping on ReMAP
以一个宏块为单位,如图5所示,先将16个子块连续送入计算阵列,完成一维DCT运算,再将一维结果送入阵列,完成二维DCT 运算。每周期可完成一个子块的一维DCT运算。完成一个宏块色度和亮度的二维DCT变换一共需要52个周期,阵列资源利用率是66.7%.与TMS320C64x相比,其性能有24.61 倍加速。相比MorphoSys,Remarc等可重构处理器由于实现了更密集的计算资源,且在映射DCT时达到了较好的计算资源利用率,因此,在DCT 算法映射时,其性能也有92%~392%的提升,如表2所示。
表2 DCT算法映射性能对比
Table 2 Performance analysis for DCT algorithm
3.3.2 量化算法映射
量化指在不降低视觉效果的前提下减少图像编码长度,减少图像恢复中不必要或影响很小的信息。
具体量化过程的运算为:
其中,W (i,j)为残差经过整数变换后的结果,floor()为取整函数(舍弃小数部分)。》为右移运算,右移完成整数除以2;sign()为符号函数,表示该数是正还是负;f 为偏移量,它的作用是改善恢复图像的视觉效果,例如,对帧内预测图像块f 取2qbits/3,对帧间预测图像块f 取2qbits/6.
本文映射了Z(i,j)的运算。qbits和MF 由RISC计算获得,f 值通过可重构处理器的第9行MAC单元计算获得,并暂存为计算参数。
如图6所示,第7行计算单元完成取的操作,第9行运算单元完成乘加移位操作,即|Z(i,j)|=(|W (i,j)|×MF+f)》qbits;将结果返回第8行运算单元,运行符号同化计算,即sign(Z(i,j))=sign(W (i,j))。由于可重构处理器中只有第9行运算单元可进行乘法和乘累加运算,所以量化算法仅能执行8路并行,每个周期完成8个数据运算。
图6 量化算法在可重构处理器中的映射
Fig.6 QuantifICation mapping on reconfigurable processor
量化算法共用到3行运算单元,其映射性能受限于乘法器数目。实际映射时,初始化量化运算参数需要4个周期,8路并行进行量化计算,由于第9行MAC单元采用3级流水线设计,可支持连续2个乘累加运算。完成8×8子块的量化运算需要13个周期,加上数据写回时间一共是18个时钟周期。
表3给出8×8量化算法的性能比较,可重构处理器实现量化算法时已达到接近于ASIC的处理性能,较MorphoSys有16%的性能提升。
表3 量化算法映射性能对比
Table 3 Performance analysis for quantification algorithm
3.4 其他算法映射H.264中残差、哈达玛变换、16×16的垂直、水平、DC和平面预测等算法实现一个宏块处理的性能如表4所示,映射过程较简单,在此不再赘述。特别地,H.264编码算法中的去块滤波和熵编码由于并行计算度不高,且多为控制跳转类程序,这两个算法需在RISC中处理。
表4 H.264各子算法的映射性能列表
Table 4 Performance analysis for other H.264 algorithms
4 结束语
本文提出一种高清视频编码在可重构处理器中映射实现的方法。通过采用动态流水线重构技术,可重构处理器可有效提升处理单元的利用率。仿真验证表明,H.264编码算法在ReMAP中的映射可实现较大的性能加速,适合于高性能视频编码的应用。
版权与免责声明
凡本网注明“出处:维库电子市场网”的所有作品,版权均属于维库电子市场网,转载请必须注明维库电子市场网,https://www.dzsc.com,违反者本网将追究相关法律责任。
本网转载并注明自其它出处的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。
如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
- VCC,VDD,VEE,VSS在电源原理图中有什么区别?2024/4/26 17:36:58
- 低压配电系统设计规范_低压配电系统设计注意事项2024/4/26 17:33:06
- 什么是BMS?电池管理系统(BMS)到底在管理哪些东西?2024/4/25 17:32:18
- 离心机的种类是什么2024/4/24 17:43:40
- 电路仿真软件哪个比较好?2024/4/23 17:50:46
- 英特尔数据存储如何操作和实现
- 什么是微动开关_微动开关有什么用_微动开关使用方法
- VCC,VDD,VEE,VSS在电源原理图中有什么区别?
- 低压配电系统设计规范_低压配电系统设计注意事项
- xEV 主逆变器电源模块中第四代 SiC MOSFET 的短路测试
- 光耦详细应用教程
- 定义绝缘耐久性评估的电压脉冲测试要求
- 采用沟槽MOS结构,使存在权衡关系的VF和IR相比以往产品得到显著改善 ROHM推出实现业界超快trr的100V耐压SBD“YQ系列”
- NOVOSENSE - 纳芯微推出车规级温湿度传感器NSHT30-Q1,助力汽车智能化发展
- Keysight - EV 电池设计创新:扩大续航里程、延长电池寿命