网络视听新媒体内容元数据研究

  • 优秀论文奖
  • 文章作者:中国新闻技术工作者联合会 2021/12/30-04:43 阅读: loading...

    张伟 尹亚光

    (国家新闻出版广电总局广播科学研究院)

    【摘要】 网络广播电视、IPTV、互联网电视系统的建设极大的提升了广播电视台在互联网上进行内容播出的能力,随着网络播出内容时长的增加,大量为适应网络播出而制作的节目与从台内媒资系统获得的节目一起成为广电网络播出的主要内容资源。本文分析了网络视听新媒体元数据的应用现状,结合广电传统元数据结构,针对网络视听媒体内容的组织和管理,提出了适用于网络视听新媒体播出的元数据元素属性和组织架构。

    【关键字】 网络视听新媒体 内容元数据 网络媒资

    1 引言

    我们一般把IPTV、互联网电视、网络广播电视等由广播电视播出机构依托互联网或者专属IPTV网络提供的音视频播出业务叫做网络视听新媒体业务。目前,视听新媒体行业发展迅速,内容存储、检索、交换都要依靠元数据。 当前,互联网上的在线音视频服务商大多采用自建系统进行内容管理,没有统一标准,同时,广播电视行业对互联网阵地愈发的重视,网络广播电视台陆续成立,互联网电视等新业务相继开展,广电播出机构开始大量涉足以互联网为主导的网络化内容播出业务。广电网络视听新媒体业务播出的内容很大程度上依赖于电视台的原有内容,但是原有广播电视元数据编目体系不适用于网络应用,获取的内容资源必须进行重新编目和整理才能适用于网络化播出,这为广电网络视听新媒体业务的开展设置了不小的障碍。随着广电网络视听新媒体业务的发展,节目采编、制作、播出、交换及传输等环节对适合网络播出的视听节目资料再利用的需求越来越高,网络广播电视台媒体资产管理系统的建设和应用也在全国各电视台广泛展开。为了规范视听新媒体内容管理系统的建设,保证系统中编目数据能够有效适应内容检索、节目交换的需要,迫切需要行业内有相对统一的,适合网络视听新媒体播出的元数据定义和规范。

    2 网络视听新媒体内容元数据

    目前关于元数据的定义很多,通常认为元数据是关于数据的数据(data about data)。元数据可以为内容的管理、传输、交换、安全等各环节服务,本文所讨论的视听新媒体内容元数据主要为视听新媒体内容交换和检索服务,可以定义为是描述某种类型资源(或对象,object)的属性、并对这种资源进行定位和管理、同时有助于数据检索的数据。

    3 视听新媒体内容元数据的现状

    为了适应网络视听新媒体业务播出的需要,越来越多专门为适应网络播出而拍摄的内容与大量从台内媒资系统获得的资源一起成为广电网络播出的主要内容。播出平台建设了相应的媒资和管理系统,对进行了编码转换后的媒体内容进行编目处理为播出所用。受限于资金的投入,视听新媒体播出平台在内容编目管理方面所仍旧以临时性管理为主,很多地市甚至于省级的网络广播电视台都无专门应对网络视听新媒体的媒资系统。在播出时长有限,数据量不大的情况下,数据可以仅仅经过简单的编目整理然后直接存储在硬盘之上,但是这种状况随着播出平台影响力的不断扩大,播出时长的不断增加,必须进行改变,建设专用的媒资管理系统。同时,因为大量的播出内容来自于电视台台内,台内媒资系统和网络播出平台的媒资系统之间元数据不通用,无法对接,节目转移到网络播出平台除了需要进行转码之外,还要耗费大量人工进行重新编目整理,各播出平台依据当前业务播出和存储的需要对元数据进行自行定义,毫无通用性可言,从而造成广电系统各地方网络视听新媒体播出平台间内容交换困难,检索标准各异的局面。

    3.1 视听新媒体内容元数据定义原则

    为保证元数据定义真正符合实际使用需求,兼顾对电视台原有节目进行媒资数据转换和进行网络化播出的需要,在元数据的定义过程中主要遵循了以下指导原则:

    1. 实用性原则,以用户需求应作为最终的权衡标准,特别是在结构与格式的设计、元素的增加与取舍、语义规则的制定等方面,要尽可能地从用户的角度出发,增加系统与用户间的交互渠道。
    2. 简单性原则,考虑元数据在著录实践时应较为简单,易于掌握,要考虑到内容录入的人员水准参差不齐,熟练程度各异,必须要方便一线人员的理解和使用。同时注意避免一味的追求简单性而导致标引不精确,从而降低检索结果的准确度和精度。
    3. 灵活性和必选集合原则,由于不同类型节目的特性不尽相同,著录深度和广度也不尽相同,只使用一个元数据标准集合来描述众多类型的节目和素材往往不可能,需要根据具体的节目类型来确定不同的标引深度以及不同的元数据集合。为了保证标引的有效性,还需要规定一个最小必选集,最小必选集保证了依据编目标准标引的节目,其必要的描述信息已经被识别和录入系统。
    4. 元数据易交换性原则,在设计元数据标准时,要非常慎重地考虑元数据标准解释的元素的语义解释和元数据结构两个重要的方面,其中与目前较为通行的被广泛支持的元数据标准如Dublin Core 等的语义解释一致尤为重要。为方便不同信息系统之间的数据交换,编目规范一般选用XML作为数据交换的标准。
    5. 可扩展性原则,由于视听新媒体业务发展迅速,元数据标准只能提供最广泛意义上的描述,一些特殊应用背景的性质内容,并不纳入,但一些具体应用可能会要求更为细致精确的描述,应允许使用者在不破坏已规定的标准内容,如元素的语义解释的条件下,扩充一些元素、子元素或属性值。视听新媒体内容元数据架构

    3.2 视听新媒体内容资源

    本文所指的视听新媒体资源分为视频资源和音频资源两类。视频资源是用于存储活动或者静止图像的媒体,所记录的视频采用特定的编码和封装格式(如H.264编码FLV封装),适用于网络流媒体播出,存储于磁介质之上(如存储于硬盘、磁带)。仅包括以数字方式存储的视频资源。音频资源是用于存储有声音的媒体,所记录的音频采用特定的编码和封装格式(如mp3音乐),适用于网络流媒体播出,存储于磁介质之上(如存储于硬盘、磁带)。仅包括以数字方式存储的视频资源[1][2]。本文所讨论内容对象着重于其数字化的网络资源属性,就起生产来源而言,可分为原生数字资源与来自物理载体的数字化资源。原生数字资源在其最初产生时即以数字形式存在,如数字摄像机拍摄、图形工作站设备制作的数字媒体内容,主要通过网络传输的内容资源;来自物理载体的数字化资源是将物理载体上的视频资源数字化后在网络上传播的资源。

    无论是视频资源还是音频资源,通常是以一个具有独立标志(例如:一个唯一名称)的视频或者音频资源为单位。可以是成系列的内容资源、单个内容资源、也可以是从单个内容资源中析出的内容信息。

    3.3 视听新媒体内容元数据的元素结构

    我们对国内网络视听媒体市场进行了长期的跟踪和分析,根据分析结果,对视听新媒体内容元数据元素集进行了,该定义同时对应音频、视频,在对应不同属性资源时,部分对应项目可以选择有效或者无效,基础定义如下表所示:

    表1:视听新媒体内容元数据元素列表

    元素

    元素修饰词(标签)

    描述标准

    复用标准

    题名

    dc:title

    交替题名

    并列题名

    其他题名信息

    系列题名

    分集总数

    分集次

    创建者

    dc:creator

    导演

    制片人

    编剧

    投资人

    演职人员

    解说人员

    主题

    dc:subject

    汉语主题词表

    中国分类主题词表

    描述

    dc:description

    摘要

    目次

    片长

    唱法

    声部

    演奏形式

    演唱形式

    获奖

    出版者

    dc:publisher

    出品人

    发行地

    上映地

    发行

    代理

    合作单位

    其它责任者

    dc:contributor

    灯光

    舞台

    音响

    艺术设计

    摄影摄像

    化妆造型

    服装

    后期

    技术支持

    日期

    dc:date

    摄录时间

    上映时间

    发行时间

    类型

    dc:type

    基础类型

    拓展类型

    定义类型表

    题材类型

    视觉类型

    定义类型表

    完整性

    定义类型表

    格式

    dc:format

    画面宽高比

    声音特征

    色彩

    分辨率

    声道格式

    视频编码格式

    视频取样格式

    视频数据码率

    音频编码格式

    音频采样频率

    音频数据码率

    音频位深度

    资源封装格式

    标识符

    dc:identifier

    URI、URL

    来源

    dc:source

    实体文件

    URI、URL

    语种

    dc:language

    声道编号

    声道语种

    字幕编号

    字幕语种

    ISO 639-2

    RFC 4646

    相关资源

    dc:relation

    片头曲

    片尾曲

    URI、URL

    插曲

    海报

    URI、URL

    宣传预告片

    URI、URL

    时空范围

    dc:coverage

    空间范围

    时间范围

    权限

    dc:rights

    版权拥有者

    版权性质

    版权开始时间

    版权结束时间

    版权有效区域

    运营

    收藏

    点播

    推荐

    评论

    URI、URL

    收益

    记录

    URI、URL

    分级

    以上元素列表所列属性基本对都柏林核心元素集进行复用[3],并充分考虑对广播电视音像资料编目规范的继承[4]

    根据主流视听媒体网站和网络电视台等播出机构的调研结果,为了方便和引导用户快速定位需要的节目,在进行内容页面呈现时会按照地域、题材、时间等进行组织,其组织方式和分类方式各不相同,通过数理统计,大致可以分为基础类型、拓展类型、题材类型、视觉类型、完整性五类,每一类给出详细的定义类型表(因文章幅度所限不在此一一列出),说明如下:

    1. 基础分类,分为新闻类、娱乐类和专题类。
    2. 拓展分类, 对应基础分类,该类别主要描述节目主题内容,如新闻对应的消息、深度报道、直播,娱乐对应的电视剧、电影、动画、体育赛事、大众文艺、经典艺术、游戏精彩、主题大赛、晚会,专题对应的科教节目、文化节目、法制节目、生活节目、财经节目、对象节目、信息推介。
    3. 主要描述节目题材分类,主要对应基础分类中的娱乐类,如喜剧、爱情、动作、恐怖、犯罪、纪录、文艺、战争、歌舞、伦理、励志、教育等。
      1. 节目内容技术效果分类,如2D影片、3D影片、4D影片等。
      2. 节目内容完整性分类,如预告片、剪辑片、幕后花絮、原片、删减片。

    一般而言,内容元数据元素列表中的每个元素均为可选,且可重复,但是,题名是必备的。标签只是元素名的一个语义属性,在具体的应用领域,为突出资源的个性和元数据的专指性,更好的体现该元素在具体应用中的语义,允许赋予其适合的标签,但语义上与原始定义不冲突。这里定义的所有元素及元素修饰词与排列顺序无关,管理和存储单位可根据自身的实际需要决定元素和元素修饰词的排列次序。

    在进行内容元数据定义的时候加入了部分运营属性,运营元数据是视听新媒体元数据的重要组成部分,但是在进行内容管理和录入的时候为了方便检索的需要,需要部分运营属性进行支撑。

    4 视听新媒体内容元数据的应用

    视听新媒体内容元数据在广电网络播出化进程中有重要意义,首先可以推动网络视听新媒体媒资平台建设的标准化。目前,国内广播电视机构网络化播出的进程快慢不一,网络媒资平台建设缓慢且各自为战,一方面是资金投入的不足,另一方面是对内容的组织和管理方式没有明确定义,统一的视听新媒体内容元数据规范可以有效改变这种现状,规范行业内网络视听新媒体播出平台的建设。其次,统一的视听新媒体内容元数据可以有效加强台内内容网络化播出的进程。经过长期的努力,广播电视台台内已经形成完善的元数据定义标准和编目规范,尽快推出广电网络视听新媒体内容元数据规范可以加快台内媒资与网络播出平台媒资的对接建设,从而大大提高台内内容网络化迁移的效率。CNTV,北京网络广播电视台等机构已经率先开始进行台内媒资和网络播出平台媒资系统的对接研究工作,其中,定义适用于网络播出平台的新媒体内容元数据是其首要工作。最后,网络视听新媒体内容元数据强调了内容检索的便利性,更为符合网络播出的要求,可以方便用户和管理者准确定位内容,提升用户体验。

    5 结束语

    广电网络视听新媒体内容元数据定义是广电网络视听新媒体播出平台建设急需解决的问题,因为网络播出的特殊性,原有电视台台内媒资系统的内容编目组织方式已经不能适用于网络播出的需要,无论是为了提升内容检索的便利性准确性,还是方便播出机构对交换的内容进行入库整理,都需要更贴合网络播出实际需要的内容元数据标准。有了统一的网络视听新媒体内容元数据定义,网络视听新媒体播出平台的建设将会更加规范化,作为行业的一个普遍行为,统一的内容元数据规范将会极大的提高内容交换后播出机构对内容进行入库整理的效率,另一方面,因为电视台台内媒资系统有统一的元数据标准,完善的网络视听新媒体内容元数据标准的将会支持建立二者之间统一的转换接口,从而改变当前广电网络播出平台媒资平台建设缓慢,标准不一的局面。

    参考文献[1] 国家图书馆视频资源元数据规范第二版,北京,中国国家图书馆,2012.9[2] 国家图书馆视频资源元数据规范第二版,北京,中国国家图书馆,2012.9[3] GB/T 25100-2010,都柏林核心元数据元素集,北京,中国标准出版社,2010[4] GY/T 202.1-2004,广播电视音像资料编目规范第1部分:电视资料,北京,国家广播电影电视总局广播电视规划院,2004 编辑:中国新闻技术工作者联合会

    评论 点击评论