利用音频基带调制技术实现跨网络音频文件传输

  • 优秀论文奖
  • 文章作者:中国新闻技术工作者联合会 2021/12/30-04:43 阅读: loading...

    肖国栋

    (中央人民广播电台播出传送中心)

    摘要:AES/EBU现已成为电台数字化的专业数字音频标准,传统媒体和新媒体的融合发展又带来更多的互联网和制播业务网数据传递的要求,安全可靠的网络间音频文件的传输是电台数字化、网络化后面临的重要课题。本文提出了在保障制播系统安全前提下利用现有的标准体系结构,采用新的应用方式实现跨网络文件传输方式。该技术在保障安全的前提下安全高效的将音频文件由外部网络传输到电台的制播网络系统中,支持了电台节目制播业务生产的时效性、多样性。关键词: AES/EBU、网络、传输、音频文件、安全

    1 引言

    广播作为传统的媒体行业经过多年的发展,已经成为数字化、网络化媒体,各电台基本上都实现了播出、制作、媒体资料存储的数字化改造。在互联网技术迅猛发展的大环境下,新兴媒体的传播以前所未有的速度发展。传统广播和新兴媒体融合推动了媒体多样化、立体化、集团化发展。互联网资源极大丰富,传统广播领域利用互联网的资源,尤其是声音素材需要确保制播网络安全。近几年在全球范围内信息安全事件频发,在我国媒体行业内也出现了重大的信息安全事件产生了恶劣的影响。这就给我们的融合发展提出了更高的技术要求。传统的网络隔离技术虽然经过了多年的发展,技术上日趋成熟、功能上也比较完善,但对于广播电台来说并不完全适用。例如:网闸、防火墙等并不对于所有的病毒文件都具备实时防控能力尤其是音频、视频流中携带的病毒或恶意代码并不能有效防范,并且有被攻破、渗透的可能。如何建立一个安全的跨网络文件网络传输平台是我们面临的一个迫切解决的问题,本文提出了利用电台特有的AES数字音频基带传输文件建立传输平台,保障了网间的安全隔离。该传输平台经过数年实际应用完成了百万条文件的传输,证明了该系统的安全性和可靠性。

    2 数字音频基带信号分析

    2.1 AES/EBU的标准AES/EBU(Audio Engineering Society/European Broadcast Union),现已成为电台数字化的专业数字音频标准。大量民用产品和专业音频数字设备如CD机、DAT、MD机、数字调音台、数字音频工作站等都支持AES/EBU。2.2 AES/EBU帧格式

    帧格式

    一帧由两个子帧组成,如图所示。帧的传输速率与源取样频率严格对应。 第一个子帧通常以前置码“X”开始,但每192帧转变为前置码“Z”一次。第二个子帧总是以前置码“Y”开始。 传输模式由通道状态字节1的比特0到比特3设定。在立体声模式中,接口用于传输立体声音频,其两个通道被设定为同时取样。左或 “A”通道在子帧1 ,右或“B” 通道在子帧2。

    子帧格式图

    每个子帧分成32个时隙,编号是从0到31。 时隙0到3(前置码)传输三种前置码中的一个。 时隙4到27(音频样值字)传输由线性2的补码表示的音频样值字。最高有效位由时隙27传送。 当采用24比特音频编码时,最低有效位处于时隙4。 当采用20比特音频编码时,时隙8到27传输音频样值字,最低有效位处于时隙8。时隙4到7被指定为辅助数据比特。2.3 采样率分析在电台实际应用中通常采用48K采样精度,AES标准中最高支持192K采样精度以获取优质的音频。2.4 数字音频基带传输文件的原理分析数字音频基带进行的是数字音频信号传输,广泛应用于各种专业音频领域,电台的数字化音频接口标准是基于AES/EBU标准制定。在电台节目的制播过程中通常的应用场景是音频文件通过音频工作站进行播放,音频文件如果在没有网络连接的情况下进入制播内网,是使用两台工作站通过调音台进行转录,时长是1:1的方式。通过对AES信号进行分析,其最高支持192K采样精度。而电台的节目标准为48K,通过调整控制工作站播放和录制的采样频率对正常的音频播放进行传输变频,可以获得192/48=4倍的传输速度。同时采用多通道声卡传输多路音频。以8通道为例则理论传输速度可以达到8*4=32倍的传输速度,即一小时的音频可以在2分钟内完成,这样既保证了制播网络的安全又完成了文件的传输。数字音频基带传输文件具备实用性和理论基础。

    3 利用音频基带技术的实现多倍速音频文件传输

    3.1 多倍速音频基带传输系统多倍速音频基带传输系统通过数字音频线将音频文件多倍速从外网传输到内网,可以跨越传统的1:1传输方式,采用多通道同时传输,极大提高传输的速率。该技术采用AES3标准,使用DirectSound技术播放音频文件。采用文件切片技术,将同一个文件分多路传输并以目前最大可采用的192KHz的时钟传输达到32倍的传输速度。3.2 系统结构系统基于传统的音频传输技术通过音频输出服务器以声卡播出AES音频流,经由数字音频线连接至内网录制服务器,相当于音频转录。以四倍速快录方式及文件分切多路传输提高文件的传输效率。3.3 文件传输流程系统通过对音频文件的转码和切分、经由服务器声卡进行播放,通过标准的AES数字音频流由内网服务器通过声卡进行录制,完成后对文件进行合并转码处理,得到最终传输到内网的音频文件。3.4 系统关键技术设计3.4.1 单文件的多通路传输软件获取到待传输的音频文件立即转换为WAV 48K采样非压缩格式,同时根据当前可以同时传输的最大路数,切分成对应的分片文件。并以AES3所支持的96k或192k播放以达到提高帧速率目的。音频文件通过系统的解码器插件转换并切分成“.WAV”格式文件。假设源文件名为A.S48,当前共有4个通道,则切分后的文件为:A_4.Start、A_4.1、A_4.2、A_4.3共4个音频文件。切分完成后,同时形成索引文件A.Context,索引文件存放当前分割的所有文件名。播放程序将读取索引“.Context”文件,获取其中的文件名。在各个通道播放,4个文件被播放到接受端后,通过合并软件将4个文件按照A_4.Start、A_4.1、A_4.2、A_4.3的顺序组合成一个新的WAV文件A.WAV,并将WAV转换为统一的标准格式。3.4.2 元数据传输多倍速音频基带传输系统作为系统性的应用,在完成音频数据的传输的同时必须附带元数据,才能达到实际应用的要求。音频文件具备两个关键要素,一是音频文件名称、二是实体文件。系统将元数据设计在文件名中进行传输。文件名是一个字符串,通常有汉字存在,因此多倍速音频基带传输系统使用Unicode作为文件名的基本编码方式。Unicode编码完成后,一个汉字或者英文字符占用一个双字。通过传输这些双字完成一个字符的传输。最后一个字符为0x0000,接收端收到0x0000后,一条完整的字符串传输完成。整体传输时序:
    1. 传输开始录音同步字:0xFFFFFFF
    2. 传输采样率 2个字节
    3. 传输文件名 ,多字节,以2个字节的0 表示结束
    4. 传输音频内容
    5. 音频内容传输完成后,传输结束标记0xAAAA
    6. 传输结束编辑后,空闲10秒中,再传输下一个文件;
    7. 接收端只有在接收到正确的字节长度。并且最后16位为0xAAAA。才表示接收完全正确。
    以上数据全部存放到待播放的音频样本中,通过声卡播放到另一端(制播内网)的录制声卡上。例如传输48K采样率的文件A.s48,则需要传输的样本块如下表所示:
    0xFFFFFFFF 32个音频样本 开始录音
    0xXXXX文件长度的高16位
    0xXXXX文件长度的底16位
    0xBB80 16个音频样本 采样率
    0x0030 16个音频样本 文件名(A)
    0x0000 16个音频样本 文件名结束符
    ……传输音频内容
    0xAAAA 16个音频样本 结束标记
    3.4.3 编码原则及取值范围物理文件的文件名为非音频数据,通过0,1二进制数据存储。通过定义音频样本值的范围来定义0和1,实现0,1 在音频线上的传输。音频样本值的范围是-32768~32767。假设当前的样本值为Vpcm,则‘0’和‘1’的定义如下:32000≤Vpcm≤32767 或 -32768≤Vpcm≤-32000,定义为‘1’-4096≤Vpcm≤4096,定义为‘0’例如:二进制数据0xFFFF可以采用下面16个音频样本值来表示:0x7FFF|0x8000|0x7FFF|0x8000|0x7FFF|0x8000|0x7FFF|0x80000x7FFF|0x8000|0x7FFF|0x8000|0x7FFF|0x8000|0x7FFF|0x8000 二进制数据0采用下面16个音频样本值来表示:0x1000|0xF000|0x1000|0xF000|0x1000|0xF000|0x1000|0xF0000x1000|0xF000|0x1000|0xF000|0x1000|0xF000|0x1000|0xF000播放基准时钟频率 :48K 96K 192k 用户可选3.4.4 文件重组根据当前输入输出通道的数量进行录制声卡的配置,接收完成后对文件通过软件组合获得传输到内网的音频文件。与内网后台系统进行交互,将获得的元数据和实体文件进行入库的操作,入库完成够供编辑人员进行检索调用。3.4.5 传输质量控制在传输规范中定义文件校验码,根据校验码的正确性判断接受文件的完整性,如因稳定性或处理器等技术原因出现完整性遭到破坏的情况,则接收程序对已接受的文件进行删除处理。并通过RS232端口单向发出接受失败信息,由播放端进行重播尝试,三次失败后进入异常程序处理。3.4.6 安全隔离系统采用数字音频基带传输,无网络协议连接,等同于原音频系统的录制,不降低原有的安全级别。网络攻击及系统攻击均不能在音频接口实现,网络安全性得到保障。根据音频文件的特性系统在进行录制过程中通过加扰模块对传输的文件每个特定字节加入扰码,并且利用音频特性进行变码,使得录制下来的文件与原文件的编码变化率达到99.999%,彻底杜绝带毒文件的病毒还原。

    4 多倍速音频文件传输技术的应用

    多倍速音频文件传输达到了网络安全隔离同时又传输音频文件的目的,满足广播电台外网音频数据传输到内网的要求,使得编播人员的节目制作提高了效率。在实际制播环境的应用中,使用网间音频传输技术还有许多技术细节需要根据不同的电台要求进行完善。下面以采编平台与制作平台为例说明整体系统的部署应用方案。4.1 多倍速音频传输应用方案4.1.1 外网采编平台与制作平台的音频传输电台中大多数均使用采编平台进行稿件撰写、审批和音频素材上传功能,并且具有全面的用户管理功能,利用此平台可进行音频素材文件的收集,后台与多倍速音频传输配合,根据定义的接口规范,将音频素材传输到内网。4.1.2 系统结构图4.1.3 采编平台具备的功能?用户统一管理功能外网采编平台的用户管理要和制作网的用户管理统一,并按格式要求由外网采编平台提交用户信息到需传输音频文件名之中。?上载文件的归一化功能根据用户提交的信息按规则生成音频文件,其文件名应具备加密算法代码命名规则,由多倍速音频传输系统对文件命名进行校验。?上传文件的控制对于上传文件的类型,上传文件的限制大小,后台可以设置,并支持多文件上传和文件上传进度条显示。4.1.4 多倍速音频传输系统
    1. 对上载数据接收区的数据按规则进行校验确认,保障只传输外网采编平台系统生成的文件,对于不符合要求的其他文件移除。
    2. 对于上载数据接收区的音频文件进行格式辨别,并自动转码为.s48格式。保证采样率、码流符合制作系统的要求。
    3. 系统中具备优先级识别,保障需优先传输的文件立即进行传送。
    4. 音频传输按音频多倍速传输规范的相关要求。
    4.1.5 制作网数据接收及入库音频文件经过多倍速音频传输系统到内网的临时存储区内,由制作系统进行入库的处理。制作系统入库软件应具备以下功能:

    对进入到制作网内的文件,按协议进行入库,提供给制作系统检索调用。

    对已完成入库的文件进行清理。

    对入库记录具有完备的日志查询功能。

    4.1.6 多倍速音频传输系统服务器的安全防护及应急机制音频多倍速传输系统的播放服务器部署在外部局域网内与外网采编平台做接口应用,因此其本身的安全防护及对所需播放的文件的病毒检测是保证系统正常运行的必要条件。系统服务器的安全防护措施

    系统采用windows操作系统,系统层设置ip策略,对访问严格控制,只能够访问采编平台的FTP服务器,其他均进行屏蔽。

    系统关闭不相关的服务,减少被攻击的风险。

    安装网络防火墙,屏蔽探测及攻击。

    安装病毒防护程序,对传输的文件进行检测。

    安装注册表防护程序,禁止对注册表更改。

    定义系统用户的密码要求复杂化,减少穷举出的可能。

    开启安全策略的审计功能,对关键位置进行监控和记录。

    5 多倍速音频传输技术发展前景

    广播电台制播流程的数字化、网络化、智能化不仅提高了节目采集、制作和传播的能力,同时也对节目的共享、质量和安全性提出了更高的要求,建立网间多倍速音频传输系统,在保证网络安全、系统安全的前提下,解决电台台内用户及电台台外用户的音频文件传输到制播内网的通路问题,提高播出节目制作效率。基于该项技术可扩展其应用场景,目前手机银行的音频U盾,支付宝手机客户端的用户匹配接入,拉卡拉的手机客户端的刷卡器均利用了数字信号的音频转换,实现了不同信号的音频传输。在多倍速音频传输中结合编码技术可以传输文字信息、图像信息、用户认证信息等多项应用,利用音频基带变频技术的音频网间传输的潜在用户数具备规模条件,该项技术的出现不仅解决长期以来困扰电台技术部门的难题同时带来经济效益和社会效益,因此该项技术的发展有着广阔的前景。 参考文献:[1]. 《演播室数字音频信号接口》 GY/T158-2000[2]. 《广播音频数据文件格式规范》GY/T168-2001[3]. 《广播电台数字化网络化建设白皮书》国家新闻出版广电总局[4]. 《广播电视安全播出管理规定》国家新闻出版广电总局 编辑:中国新闻技术工作者联合会

    评论 点击评论