高清晰度电视测试图像序列制作及应用研究修订
朱 军 张 乾 王惠明
(中央电视台)
摘要:本文主要介绍高清晰度电视主观评价用测试图像的特点、要求和拍摄制作的技术要点,以及使用选取测试图像的原则和测试图像的实验效果。关键词:高清晰度电视、测试图像、图像制作0 引言
对高清晰度电视系统的评价一般通过客观测试和主观评价两部分进行。客观测试往往无法全面地描述系统的特性,因此应当把主观评价作为客观测试的必要补充[1]。为了获得有效、可靠的主观评价结果,参考文献[1]对主观评价的各个环节都有详细的规定。其中,测试图像的质量对评价结果有着至关重要的影响。本文主要讨论高清晰度电视主观评价用测试图像的特点、要求和拍摄制作要点,以及选用测试图像的原则和测试图像的实验效果。1 高清晰度电视主观评价用测试图像的特点
在进行主观评价时需要考察的质量要素如下:1.图像的清晰度,素材需包含精细结构的黑白和彩色景物。2.亮度层次,素材需包含亮度动态范围大并且层次丰富的场景。3.肤色和色彩还原,素材需包含日常生活中常见色彩的场景。4.物体质感再现真实性,素材需包含日常生活中常见的各种质地的景物。5.色键、字幕和计算机图形的处理性能,素材需包含蓝色背景前的静物和活动景物。6.视频压缩编解码综合性能,视频压缩编解码性能的评价项目除了前述各种要素外,还要评价视频压缩造成的其它损伤表现(如损伤的可见程度、噪声、块效应、闪烁等)。图像素材场景中除了有前述的各种场景外,还应有一些快速无规则的运动场景,如体育比赛现场、戏曲歌舞表演、水波纹中的景物、随机运动的图案或景物等等。2 高清晰度电视主观评价用测试图像的要求
完成的标准测试图像素材时间长度一般在20s~30s,其中有明显测试效果的图像内容不少于10s。具体要求如下[2]:1.测试图像素材应具有最佳的图像质量(除某些特殊测试需加噪波外)。2.对于不同的评价目的,通常需要不同苛刻度的测试素材。例如:1) 对于基本质量评价,建议一般严格的素材;2) 对于高要求的应用(如演播室或后期处理等)的评价,建议比较严格的素材;3) 对自适应处理系统性能的评价,建议非常严格的素材。测试图像素材的苛刻度要有合理的分布范围,基本涵盖从低到高的不同要求。1.测试图像素材包含常规节目素材和专门制作的图像素材。前者可以在日常播出节目中选取;后者要根据需要专门设计制作。2.测试图像素材应具有明确的针对性,即对某个图像质量要素比较敏感。图像场景应包含评价一个或多个图像质量参数的内容。3.测试图像素材的数量应足够多。4.测试图像素材应采用适当的载体和格式存储,便于长期保存和复制时质量不劣化。3 高清晰度电视主观评价用测试图像制作技术要点
主观评价用高清数字测试图像,应具有日常电视节目图像能够体现的质量要素和特征测试图像的拍摄制作应当尽可能获得最佳图像质量。数字电视图像质量集中表现在清晰度、色彩还原度、亮度反差、曝光宽容度、杂波干扰度等几方面。在选择拍摄器材时,需要满足目前最高的技术性能,并兼顾操作方便性以及摄影机对常规拍摄流程的适应性。高清晰度电视测试图像摄制系统主要包括摄像机、记录设备、编辑制作设备三部分,其中数字拍摄、数据处理和记录是三个关键环节,其主要因素有:成像器件、镜头、记录格式、信号处理方式等。这些都与图像质量之间有着密切的联系。4 成像器件
目前高清摄像机以及数字摄影机所采用的成像器件有CCD和CMOS两种,广播级高清电视摄像机成像器件均采用2/3英寸三片CCD,数字摄影机则多采用大像场单片CMOS。表1为CCD和CMOS成像器件主要性能比较。表1.CCD和CMOS成像器件主要性能特点比较
CCD成像 | CMOS成像 | CCD性能特点 | CMOS性能特点 | |
感光度 | 高 | 低 | 只需要一个放大器放在芯片边缘 | 每个像素包含了放大器和模数转换电路,感光区域的表面积变小 |
噪波 | 小 | 大 | 只需要一个放大器 | 每个感光二极管都需搭配一个模拟放大器,百万个以上的放大器会增加CMOS传感器的噪波 |
分辨力 | 优 | 次优 | 片上透镜技术,增大感光区开口率 | 像素的结构复杂,感光区开口率小 |
制造成本 | 高 | 低 | 采用一般半导体电路常用的CMOS工艺,容易实现大尺寸制造 |
5 分辨率和像素数量
数字电视摄像机和数字电影摄影机的成像器件可以由三片或单片组成。3CCD采用棱镜分色系统,单片CCD采用条栅滤色片分色系统,单片CMOS采用拜尔滤色片分色系统。3CCD棱镜分色系统地成像分辨率与单片CCD成像器件的像素数量相同,因此RGB三基色的分辨率都是1920×1080像素。理论上来说,实现相同分辨率时,条栅滤色片CCD需要的像素数量是单色成像器件的3倍,拜尔滤色片CMOS需要的像素数量是单色成像器件的4倍。6 镜头技术
摄像机拍摄的图像质量与镜头的技术性能有直接的关系。镜头最主要的技术性能就是分辨率,镜头的分辨率由调制传递函数MTF来描述,它表示在光学带宽内黑白相间线条细度增加的情况下对比度发生的变化。高清电视的视频带宽为30MHz,要求镜头的光学带宽需要达到82LP/mm(每毫米线对)以上。图1.镜头调制传递函数曲线示意图
使用电影镜头可以得到更加鲜明的成像和更加清晰的细节,其分辨率比电视镜头高,各种像差、色差较小,定焦镜头成像质量更优于变焦镜头。7 记录格式
我国高清数字电视制作设备多为1920×1080/50/I、1920×1080/25/P格式,随着技术标准的提高,越来越多的摄制设备、演播室和后期制作系统也逐渐支持1920×1080/50/P格式。从高清技术发展来看,传输技术的飞跃终将会带来50p格式的普及。选用1920×1080/50/P格式的图像可以方便地进行下变换,应对测试图像的多种应用需求。8 记录码率
图像拍摄和记录方式是图像质量的基础。在SMPTE 274M数字电视标准中,采用10比特量化时1080/50i 信号格式的高清数字信号的视频有效码率为:(1920×1080×10×25)+(2×960×1080×10×25)=1.03Gbps若采用4:2:2全带宽记录,1080/50p信号格式的高清数字信号的视频有效码率为:(1920×1080×10×50)+(1920×1080×10×50)=2.07Gbps高清摄录系统有压缩和非压缩两种方式记录数字图像。为了得到高质量的图像,应采用非压缩视频记录方式将拍摄图像的原始数据全部记录。9 采样频率与量化bit
在数字电视技术中经常用4:4:4、4:2:2等方式表达数字分量电视信号的采样结构,即亮度与色度信号的采样频率之比。例如高清数字分量信号的4:2:2表示每行亮度信号的采样点数量是1920个,带宽30MHz,色度信号在水平方向上的采样点数量是亮度信号的一半960个,带宽15MHz。采样比4:4:4则表示每行R/G/B三基色信号一样,采样点数量是1920个,带宽30MHz。摄像机A/D转换的量化bit表示从黑到最高亮度变化的精度,如表2示。表2.量化bit精度
量化比 | 灰阶变化数量 |
8比特bit | 256 |
10bit | 1024 |
12bit | 4096 |
14bit | 16384 |
10 色域
CIE(1931)色度图把光谱特性的波长坐标变成弧线放入二维x、y坐标图中,x和y分别代表R和G的值,任何彩色都可以用一组(x,y)坐标值定义。在CIE色度图上用彩色标出的马蹄形色度三角形就是人眼能够看到的色域。图2示出了F35的S-Gamut、彩色负片、数字影院发行母版(DCDM)和高清电视的色域比较。图2. 色域比较
11 信号处理方式
电视系统显示正常图像,需要进行包括伽玛校正在内的一系列信号处理。电视伽玛校正处理对亮度动态范围进行了非线性压缩,因此在高亮度区域不能够提供更高的曝光宽容度和更多的灰度层次,因此,数字电影摄影机对图像信号不作任何处理,或者仅进行对数伽玛校正,直接输出原始图像数据( RAW Data)。图3. 对数伽玛与电视伽玛特性的比较
12 测试图像素材的统计特性计算和分析
在图像质量的主观评价中,根据不同的评价目的、不同的应用类别选用测试图像应具备一定的代表性,可涵盖与被评价系统和设备性能相关的图像特性。经数字系统处理后的图像质量通常与图像内容的复杂程度有密切关系。而图像素材的统计特性可以在一定程度上反映图像内容的复杂程度。因此,在选择合适的测试图像素材时,其统计特性具有很重要的意义。13 PCM数据熵
PCM数据熵(E)代表一幅图像的信息量。反映图像层次的丰富程度。它由式(1)给出:其中:Imin代表视频信号的最小电平;Imax代表视频信号的最大电平;P(i) 代表视频信号电平i发生的概率。PCM数据熵值的大小可以反映图像信号的层次分布,对于亮度信号是灰度层次,对于色差信号是色度层次。图像的层次越丰富,PCM数据熵的值越大。14 AC能量
AC能量为除DC系数之外的DCT系数的平方和,反映了单色图像细节的丰富程度和精细程度。AC能量定义如下所示:其中,C(m,n)表示DCT系数,N表示在一场(或一帧)中的DCT变换块的数目。ACmax为归一化因子,它是理论上的AC能量最大值,当变换块中一半区域为黑,另一半区域为白时可得到AC能量最大值。图像细节越丰富,图像内容越复杂,AC能量值越大。15 频谱熵
频谱熵代表了DCT系数的随机程度,该参数反映了图像在频域上DCT系数的随机程度。频谱熵用于估计基于DCT的视频压缩系统所需的比特率。频谱熵由式(3)定义:其中:图像的频谱熵值越大,代表了图像在频域上DCT系数越随机,对于压缩编码系统处理图像时,编码系统的压力越大。16 运动矢量
运动矢量用一个二维参数来逐块表示对象的运动情况。该参数反映图像的运动程度。块匹配是一种常用的运动估计方法。为了表示图像的运动程度,需要使用两种统计特性,即一帧或一场的平均矢量幅度,以及帧内或场内的标准偏差。可分别计算水平和垂直方向的两种统计特性,如下式所示:(4)
(5)
其中,Xk、Yk:块矢量的水平和垂直分量;μX、μY:Xk、Yk在一场中的平均幅度;σX、σY:Xk、Yk的标准偏差。平均幅度代表了整体运动程度,而标准偏差代表了非均匀运动程度。17 运动补偿预测误差功率
运动补偿预测误差功率反映了对视频压缩系统运动补偿压力的程度。运动补偿后的帧/场差分信号(即预测误差)由式(6)表示:(6)
其中,ek(*)、f0 (*)和f1 (*)分别表示第k个块中的运动补偿帧/场差分信号、当前帧/场信号以及前一个帧/场信号,uk和vk表示块运动矢量的水平和垂直分量。预测误差能量EP定义为差分信号的均方值,如下式所示:其中,X 和Y 表示块的水平和垂直大小。该统计特性值可被用来评估所选的素材是否能够严格检查采用运动补偿技术的视频压缩系统。18 经过压缩编解码系统后图像质量评价
通过高清电视压缩编解码系统的图像质量是随着数据率、图像的复杂度以及所采用的编码算法等的变化而动态地改变的,静态测试不能提供压缩视频系统中图像质量的真实特性。通过人眼观察具有自然内容和运动的测试场景或者利用模仿人眼的主观评价要素的仪器测试,可以较准确的反映压缩编解码系统的质量。19 双刺激连续图像质量主观评价
采用GY/T 134-1998《数字电视图像质量主观评价方法》中的“双刺激连续图像质量主观评价方法”,主观评价经高清转码系统处理后的图像序列质量。评价方法中各环节符合行业标准GY/T 134-1998《数字电视图像质量主观评价方法》中的规定。20 测试图像花坛经不同转码系统处理后的图像质量下降值
图4 图像特征画面—花坛
测试图像花坛经不同转码系统处理后的图像质量下降值如表3所示。表3测试图像花坛经不同转码系统处理后的图像质量下降值
序号 | 系统 | 图像质量下降值 |
1 | A厂家MPEG2_25Mbps转H264_11Mbps | 12.5% |
2 | B厂家MPEG2_25Mbps转H264_11Mbps | 12.8% |
3 | C厂家MPEG2_25Mbps转H264_11Mbps | 17.9% |
4 | D厂家MPEG2_25Mbps转H264_11Mbps | 16.9% |
评论 点击评论