基于视觉质量的无线视频通信系统
出处:sololzd 发布于:2010-12-14 13:54:34
摘 要:在窄带高噪声的无线信道环境下,保证客户端视频的视觉质量是无线视频通信的难点。这里,系统融合数字水印、视觉中心滤波与视觉质量优先的视频差错控制技术,设计了一套针对无线信道环境的实时视频通信系统,并对系统的部分在算法与实现上进行了优化处理。系统运行表明,该系统能在移动终端上获得稳定、流畅的视频播放效果。
0 引言
随着低速率视频编码技术与通信技术的迅速发展,以及移动智能终端设备处理能力的不断提高,使得为用户提供"无处不在"的无线视频通信业务成为可能。尽管无线网络技术迅速的发展以及移动设备的处理能力不断地增强,但在视频信号处理和视频压缩码流传输方面,移动设备处理能力不强、存储容量不足与无线网络窄带高噪声等问题,在很大程度上阻碍了无线视频通信业务的快速发展。对此,我们设计了一个在移动环境下的实时视频通信系统,该系统结合人体视觉特性与差错控制等技术,提高了系统在窄带高噪声的信道环境下重建视频的视觉质量。同时,系统嵌入了水印模块,有力地保障了通信内容的安全性。
1 系统的基本结构
系统的整体结构如图1所示,整个系统主要由服务子系统和移动终端播放子系统两大部分组成。在系统设计与实现时,充分考虑到易错的无线环境和处理能力较弱的嵌入式环境的特点,以及系统今后可扩展的需求,对两大子系统进行了相应的改进处理。
在服务子系统方面:在原MPEG-4编码基本框架的基础上,主要作了如下改进:
图1 无线视频通信系统结构图
(1)利用人体视觉特性,增加了视觉中心滤波方法与视频帧率与速率分析与控制功能,以在窄带高噪声的环境下,并将节省的码流用于差错控制,达到尽可能提高视频视觉质量的目的。
(2)在输出比特流中插入重同步标识、头部扩展标识,并结合FEC技术,系统提供了有效的差错控制方法。
(3)增加了数字水印嵌入模块,用户可将特定的信息以数字水印的方式添加到压缩视频码流达到对视频视觉质量影响较小的情况下,实现对通信内容的保护。
在移动终端子系统方面,主要作了如下改进:
(1)与编码相对应,对发生误码的宏块进行误码隐藏。
(2)修改了RTCP的反馈机制,以适应视觉中心、差错控制等要求及时反馈的需要。
(3)增加了视频数字水印提取模块,可实时地从视频流中检测水印。
1.1 编码服务子系统
1.1.1 采集模块
用于采集和预处理摄像头所捕捉到的视频图像序列。
本模块使用VFW(Video for Windows)相关API函数来实现视频数据的采集,VFW能使应用程序通过数字化设备从传统的模拟视频源得到数字化的视频序列,并为视频叠加提供Overlay命令集,它能直接访问视频缓冲区,不需要生成中间文件,实时性很强,效率较高。不过,通过摄像头采集到的视频图像中难免会出现一些噪声,我们采用中值滤波对输入图像进行预处理,这不仅有效地保护了图像的细节,又能较好地消除图像中的噪声,达到提高视频压缩率的目的。
1.1.2 视觉中心模块
生理学研究发现,人体视觉在观察物体时,对关注点附近的图像质量要求,然后对图像质量的要求向四周快速、平滑地降低。因此,我们在系统实现过程中,充分利用视觉这一特性,尽可能保障视觉关注点附件的图像质量,以在窄带环境下,让有限的视频比特流根据人体视觉特性来分配,从而提高重建视频的视觉质量。
1.1.3 视觉质量优先的视频抗差错方法(ERMV)
为使系统在窄带高噪声的无线信道环境下,提高重建视频的视觉质量。根据分析,我们认为视频图像中的方块效应与视频的帧率是影响重建视频视觉质量的重要因素。其中,方块效应一般是由"粗量化"或信道噪声引起的,由于我们所生活的自然界中,很少遇到自然场景是由一些方块图像所组成的,因此,我们会对视频图像中出现方块效应,感觉到非常不习惯;另外,视频的帧率越高,则其中运动物体所呈现的连续感就越强,视频视觉质量也就越好,然而,如果仅强调提高视频的帧率,那么在传输速率一定的情况下,势必会降低每帧视频图像的质量,产生有害的方块效应。在这里,我们合理地权衡影响重建视频视觉质量的重要因素之间的关系,结合反馈、信道编码与误码隐藏技术,设计了一种视觉质量优先的视频抗差错方法,并将此方法运用到本系统中。经实验检验表明:此方法能在窄带高噪声的无线信道环境下,明显提高重建视频的视觉质量。
1.1.4 编码模块
此模块负责对经过滤波后的视频图像序列进行编码,并输出相应的压缩码流。视频编码融合了数字水印和抗差错特征的视频编码技术。对于编码模块所生成的视频比特流,既可以立即按RTP协议[5]封装为RTP包(见图2)后发送给客户端,也可以将其封装为MP4文件格式,并存放到DSS(Darwin Streaming Server)服务器所指定的目录下,供以后点播需要。
图2 压缩视频数据分组的封装图
1.1.5 水印模块
为了保证系统的安全性,用户可通过版权管理接口在编码过程中将数字水印隐藏到视频内容中,以保障通信内容的安全。
1.2 移动终端播放子系统
我们设计了一种适合流式传输的移动终端播放子系统,此子系统由接收端差错控制、视觉中心定位、解码播放与水印检测等模块组成。此子系统采用多线程机制实现,即其可以根据应用的实际需要,产生相应的服务线程。这样,既保证了播放子系统实现的简易性与播放的高效性,又能使其适应今后视音频扩展解码的需要。
对于视频压缩码流,通常会将其分解为许多大小不同的数据分组后再传输。而目前以分组传输为基础的"尽力而为"型网络难免会出现分组差错、乱序与抖动等现象,这就需要系统采用有效的缓存管理机制来消除网络延迟与抖动对移动终端视频播放的影响,以确保分组数据及时、正确地到达移动终端。这里,考虑到系统实现的灵活性与运行开销方面的因素,我们采用双向循环链表这种灵活的数据结构来实现缓存管理,其结构定义如下:
typedef struct RTP_Packet {
struct RTPPacket *pNext, *pPrev; //双向指针
char *pData; //指向存放有效载荷缓存首地址
int mBufferLen; //表示pData指针指向的缓存中存放的有效载荷长度
unsigned int mSequenceNumber;//在客户端用它来探测分组丢失或位置错乱等现象
……
} RTPPacket;
通过采用这种缓存结构,一方面能弥补无线信道的不确定性所造成的分组数据的延迟和抖动等问题,另一方面,有利于各线程的并发运行,提高系统运行效率和使系统具有很好的可扩展性。
2 系统实现结果
我们在VS 2005集成开发环境下完成了服务器端与客户端的设计与实现。在系统开发过程中,客户端部分程序首先在VS 2005提供的模拟器上调试与测试后,通过ActiveSync4..0同步软件传输到Pocket PC等移动设备上运行。
本系统的视频编解码采用压缩率高,对信道误码有一定鲁棒性的MPEG-4标准,为了保证系统编解码的实时性与流畅性,系统采用多线程机制实现系统,且对编解码的部分对于编解中非常耗时的运算,如运动估计(ME)、运动补偿(MC)以及IDCT/DCT运算等,除了在算法上进行优化外,还采用MMX(Multi-Media extension)、SSE(Streaming SIMD Extensions)、SSE2指令集以及由Intel提供的IPP(Integrated Performance Primitives)性能提升库来实现,以提高系统的性能。经过实验测试表明,在平均速率约为120kb/s的无线信道环境下,主频为400MHz的PXA270上,能够平均解码20.2帧QCIF大小的"news" 压缩视频图像。图3为系统实现界面与运行效果。
图3 系统实现界面与运行效果。
3 结语
我们设计并实现了一套基于视觉质量的无线视频通信系统。系统融合数字水印、视觉中心滤波与视觉质量优先的视频差错控制技术,此系统能在智能手机、PocketPC等移动设备上获得稳定、流畅的视频播放效果。
参考文献:
[1]. PXA270 datasheet https://www.dzsc.com/datasheet/PXA270_559867.html.
版权与免责声明
凡本网注明“出处:维库电子市场网”的所有作品,版权均属于维库电子市场网,转载请必须注明维库电子市场网,https://www.dzsc.com,违反者本网将追究相关法律责任。
本网转载并注明自其它出处的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品出处,并自负版权等法律责任。
如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
- 光纤线和网线有啥区别2025/8/7 17:21:57
- 网线怎么排2025/8/1 11:42:44
- 全面对比:光纤线与网线的差异大揭秘2025/7/30 17:00:38
- SPI 通信协议的基本概念和工作模式2025/7/30 16:53:59
- 循环神经网络算法原理及特点2025/7/28 16:59:15