一种适用于模拟调频广播节目的数字水印技术
邸娜 吴智勇 万戈
(广播科学研究院)
摘要:本文针对现阶段我国模拟调频广播系统音频节目的播出现状,提出一种数字音频水印技术用于对音频节目来源和内容的监管,摆脱传统广播电台对监测值班人员的依赖,以减少重大播出事故。该数字水印应用了伪随机扩频技术[1],可以实现在有限水印嵌入量的同时获得较好的水印鲁棒性。
关键词:模拟调频广播 音频 节目监管 数字水印 伪随机
1.前言
数字水印技术作为一种信息隐藏的成熟的技术手段,已被广泛应用于互联网和流媒体传播体系中。依据其应用范围,可将数字水印划分为图像水印和音频水印两大类。随着网络传媒量的急剧增大,数字水印技术也被应用到网络视频传输领域中。无论是图像水印还是音频水印,水印技术的关键是以图像或音频为载体,在不影响载体质量的前提下,如何将数字水印嵌入到载体中。相对于将水印嵌入静态图像或者视频图像中,数字水印在音频中的应用受限于音频信号本身的特性和人耳听觉系统(HAS)对声音的敏感程度。 我国模拟调频广播信号由于具有良好的音质和丰富的内容而受到广大听众的喜爱。因此随着广播领域技术的不断改进,在88MHz-108MHz的调频频段里,调频广播的播出频点在不断增加,播出内容也在不断丰富,对于广播信号来源和内容的监管提出了更高的要求,即必须摆脱对传统广播电台依靠监测值班人员的依赖,以减少重大播出事故。本文依据上述音频水印的技术特点及我国调频广播节目的播出现状,提出了一种适用于模拟调频广播音频节目流的数字水印技术,该技术能以小容量的水印嵌入量获得高的水印鲁棒性,有效地解决了上述实际问题。
2.我国模拟调频广播系统概述
传统的模拟调频广播系统在电台端首先由制作室制作播出音频节目,经过SDH环网(Synchronous Digital Hierarchy,同步数字体系),传输至发射台调制器端,调制并发射模拟音频广播信号。具体过程是,由总控室制作的节目如实时性的新闻类节目、访谈类节目及非实时性的广告类播放节目和音乐类节目,首先这些音频节目输出给音频处理器进行音频预处理,然后进行编码、复用输出复用流,将该复用流经过SDH环网传输至发射台,在发射台中经过解码、解复用输出原始音频信号并调制发射模拟广播信号,如图1所示。
3.基于扩频技术的数字音频水印
数字音频水印是利用音频信号中的冗余信息,在不影响音频信号质量的前提下,将水印嵌入到音频信号的冗余信息中。相对于图像水印技术,音频水印技术的难点是有限的嵌入量和人耳对声音的敏感度远高于对视觉的敏感程度。
3.1 心理声学模型[2] 心理声学模型是一种模拟人耳听觉掩蔽特性的数学算法,他表示了人耳对声音的各个频率分量的敏感程度。该模型认为:人耳能否听见声音取决于声音的频率、幅度是否高于这种频率的听觉阈值,这种现象称为声音的频域掩蔽特性。如图2所示,在声音样本中存在较强的低频信号成份,因此低频的掩蔽阈值被大大提高,但是由于低频的掩蔽范围对高频的作用很弱,使得高频处的掩蔽阈值曲线重合于安静状态阈值曲线。 在MPGE音频标准[4]提供的心理声学模型中将人耳的听觉效应分为32个临界频带,每个临界频带相当于一个带通滤波器,其中心频率对该频带内的其他频率分量或相邻频带内的频率分量都具有掩蔽效应。当人耳的听觉系统接收具有多个频率分量的激励时,由于某些频率分量的能量高于其他频率分量,会导致这些较弱的频率分量被掩蔽,人耳就无法察觉这些被掩蔽的频率分量。 音频水印技术的关键就是利用心理声学模型中的掩蔽特性,将水印信号作为不易被人耳察觉的被掩蔽信号,嵌入到音频数据流中进行传输。
3.1 对音频广播信号中数字水印信号的要求 (1) 根据图1模拟调频广播系统中音频信号的传输链路,音频节目流从制播室的输出到发射台发射,需经过音频处理器和编码复器用等诸多信号处理过程,这不但会改变音频源的频率信息[3],而且会对嵌入音频流中的水印造成攻击和畸变,因此所选的水印嵌入技术必须有抵抗攻击和畸变的能力。 (2) 与图像和视频相比,音频信号在每个时间间隔内采样的点数要少得多,意味着在音频信号中可嵌入的信息量也要少得多。因此需要找到一种标识方法,既可以标识节目的来源信息也可以表示节目的内容信息。 (3) 在音频广播信号中应用的数字水印技术,必须保证音频源中嵌入水印信号的唯一性,即各音频广播信号的来源和内容标识对应唯一的数字水印,在水印接收端当解调出的水印不匹配时说明可能发生错播或者误播的情况。 (4) 在音频广播中嵌入的数字水印必须要保证能快速并准确地对水印信号进行同步识别。由于有些音频广播信号的播出时长只持续几十秒,因此在、水印信号的检测需要在很短的时间内完成。 基于上述模拟音频广播系统的4个基本要求,我们选用了基于扩频序列的数字水印技术,经过对广播电台播出系统的大量调研和对各数字水印算法的跟踪研究,使用该算法能很好地解决调频广播中数字水印应用的各问题。
3.2 扩频技术在音频广播中的适用性 扩频水印技术[5]在鲁棒性、安全性和适用性方面都有良好的性能。扩频技术就是用伪随机PN序列对基带信号进行扩频调制,将窄带信号扩展为低功率谱密度的宽带信号,使调制信息淹没在噪声下。 经过研究,扩频技术的诸多特点都可以解决音频广播中的数字水印技术,首先扩频技术具有良好的抗干扰特性,由于扩频信号本身就是不可预测的伪随机宽带信号,类似于高斯白噪声,当由于某种原因使得一小部分频谱衰落时不会影响整个信号的畸变,因此扩频技术具有很强的抗频率选择性衰落的特性,这正好可以解决在模拟广播系统中音频处理器、编码复用器等数字信号处理过程对水印信号造成的攻击和畸变。 其次,扩频信号具有码分多址的通信能力,各用户根据分配不同的扩频码只能解调出自己的信号,无法窃听他人的通信。这正好可以解决各音频广播来源和内容标识的唯一性。 最后,由于扩频信号采用的是伪随机序列,具有很强的自相关性。在匹配接收时,可以快速地获得较高的相关峰。因此在水印接收端通过对伪随机序列的自相关运算可以快速地对水印进行同步,从而在很短的时间内解出水印信号。
4 .适用于调频广播音频节目流的数字水印嵌入器及提取器
针对上述模拟调频广播系统的总体结构和音频节目的播出特点,本文基于扩频技术提出了一种适用于调频广播中音频节目传输的数字水印嵌入器及提取器。数字水印嵌入器和提取器均由一台台式电脑和嵌入台式电脑的专业声卡VX222构成。专业声卡负责对输入的音频信号进行输入采样及输出,数字水印嵌入算法和提取算法在台式电脑上实现,其结构如图3所示。
4.1 数字水印嵌入器 如图3所示,数字水印的嵌入器设置在图1中制作室的输出位置,由专业声卡负责对制作室输出的音频信号进行采样,该声卡支持AES/EBU格式的数字音频信号和左右声道的模拟立体声音频信号。声卡将输入的音频信号采样成PCM样值信号,输出给水印嵌入算法软件。水印嵌入算法软件分为三个部分,水印产生、密钥和水印嵌入软件。 首先,由水印产生软件将播出的节目信息进行编码,产生6位二进制比特序列,不同的节目内容映射成特定的比特序列,如将访谈类型的节目可定义为100100,新闻类型的节目可定义为111111,一共有64种节目类型表示方式。这样根据节目类型的增多和细化可对比特映射序列进行扩充。 在密钥软件中,对应于不同的广播电台生成不同的PN序列,PN序列长度为2^13。例如地方广播电台可以根据密钥种子key=1产生PN序列,转发的中央广播电台可根据key=2产生PN序列,这样在发射台中用不同种子生成的PN序列对播出信号的来源进行甄别。 在生成PN序列后,用该PN序列对水印信号进行扩频调制,产生数字水印嵌入序列,利用水印嵌入算法软件将水印信号嵌入到音频序列中,嵌入过程如下: (1) 根据ISO11172-3[4]标准的心理声学模型I对输入的音频流进行计算,得到32个临界频带的最小嵌入电平。 (2) 将经过加扰的数字水印序列变换成频域信号,并对应32个临界频段划分为32个频率段,根据(1)中计算得到的每个临界频段的最小嵌入电平进行增益调整,使得每个临界频段嵌入的水印信号的功率不超过临界频段内音频信号的功率,并将数字水印和音频节目流在频域中进行叠加,输出叠有数字水印的音频频域信号。 (3) 将叠加有数字水印的音频节目流变换成时域信号,输出音频时域信号,完成水印的嵌入。 (4) 将载有水印的音频信号流从专业声卡VX222输出到SDH传输网进行传输。
4.2 数字水印提取器 如图3所示,数字水印的提取器设置在图1中发射台前端解码解复用器之后,对音频信号在的播出来源及内容进行监测和识别。与水印发端一样,首先由专业声卡对输入的模拟或者数字音频信号进行采样输出音频PCM样值,再由水印提取软件对PCM样点进行水印提取运算。 水印提取软件分为三部分,水印信号检测软件、水印信号提取软件和监测实时上报软件,具体步骤如下: (1) 对声卡采集的音频PCM样值进行分段处理,对于每段进行DCT变换将音频变化到频域。 (2) 识别音频节目流的来源,首先在本地产生和发端一致的扩频序列,和经过DCT变换的音频信号进行相关,由于PN序列尖锐的自相关性和处处为零的互相关性,当来源一致时会产生很高的相关峰,因此可以根据相关峰确定播出信号来源是否正确,并可以确定水印信号起始位置,完成水印信号的同步检测。 (3) 待同步状态稳定后,由水印提取软件对扩频信号进行解扩,相关峰为正最大译为0负最大译为1,从而解出水印信号。 (4) 将译出的数字水印信号和本地的节目表信息进行比较,如果不一致则表示所播出的音频节目可能误播,将译出的错误信息写入log文件并上报。 图4图5分别为水印嵌入和提取算法软件界面,软件基于matlab平台实现。
嵌入软件界面1
嵌入软件界面2
图4 水印嵌入软件界面
嵌入软件界面演示的是在播放的音频文件中实时嵌入水印的过程,根据心理声学模型实时计算出音频的掩蔽门限,如功率谱密度图中的蓝线,将数字水印嵌入到蓝线下面,如其中的红线所示。可以在嵌入软件界面1中输入要嵌入的数字水印的内容,在界面2中key的值根据所选音频节目流的来源确定,生成不同的PN序列。 水印提取软件界面演示了水印的检测与提取的过程,首先选择节目的来源,得到唯一的key值,在与发端的key值匹配的条件下获得较高的相关峰完成水印信号的检测,并得到水印的起始位置。然后水印软件对数字水印进行提取,并恢复发端的水印信息,如提取软件界面2所示。
提取软件界面1
提取软件界面2
图5 水印提取软件界面
5 结论 本文所提出的数字水印技术方案已经于广西人民广播电台进行了播出试验并得到了良好的测试效果。在测试过程中,我们选用的是信道条件最为恶劣的调频广播信道进行实地测试,设置发射频信号为93MHz的FM调频信号,发射功率为10kw,实际的音频采样率设为48KHz,则水印的嵌入容量可达到5.4bps,在FM发射信号传输距离4KM地点对收音机解调出的音频信号进行水印提取处理,测试中发现当数字水印的功率设为-3dB时不会影响节目播出质量,音频节目流的音质也可达到CD音质的收听效果,数字水印的鲁棒性在6%-7%之间,基本满足本系统对数字水印信号的性能要求。在发射台前端的解码解复用器输出设置水印检测器,数字水印的鲁棒性能达到1%。 综上所述,本文针对我国模拟调频广播系统的音频节目流提出的数字水印技术,能针对音频节目流的特点解决实际问题,很好地解决了传统广播电台中节目的监测对人为因素的依赖,实现节目来源和节目内容的自动识别,对我国模拟音频广播系统有很大的价值,也开创了水印技术对今后在模拟音频广播系统中的进一步应用。
参考文献 [1] 魏巍 扩频技术在数字水印中的应用研究 大连理工大学 [2] 汪石农 MPEG心理声学模型研究及其Matlab 实现.安徽工程科技学院学报,2009,12;24(4) [3] 刘大庆,韩海霞.音频处理器在调频广播发射机的应用 内蒙古科技与经济 [4] ISO/IEC JTC1/SC29/WG11 MPEG,IS11172-3 ANNEX C, 1992. [5] 许希斌,周世东等.CDMA系统工程手册-第六章 伪随机序列的理论和应用 人民邮电出版社
评论 点击评论