《智慧云媒资系统》(一期) (贵州广播电视台)
一、单位基本情况
贵州广播电视台是贵州省最大的省级综合传媒机构,拥有电视、广播、网站、客户端、微信、微博、平台号“七位一体”融合传播平台,多次荣获中国新闻奖、中国广播影视大奖、韬奋奖、全国五一劳动奖状、全国青年文明号等国家级荣誉。贵州卫视全国覆盖人口超过11亿,位居全国前十,是我省对外宣传重要窗口、重要平台。
多年来,坚持以“主流媒体责任、传播中国价值”为理念,积极承担新闻宣传、导向管理、节目制作、融合传播、安全播出等任务,推出《贵州新闻联播》《最爱是中华》《我在贵州等你》《百姓关注》《“952”找到啦》等栏目节目,多次得到中宣部、国家广电总局点评肯定和《人民日报》《光明日报》点赞,尤其是党的十九大期间,习近平总书记在贵州代表团时所讲“贵州卫视我看了,办得很好”的肯定性评价,成为大会期间贵州新闻宣传突出成效的珍贵缩影。
近年来,在媒体融合上大胆探索,自主建成“动静云”融媒体平台,形成以“动静”客户端为核心、聚合“动静贵州”“百姓关注”“微兔gogo”“找到啦”“非常完美”“詹姆士的厨房”等一批微博、微信、抖音号、客户端的融合传播矩阵,2021年底已实现下载、粉丝双过亿,多次跻身全国、全省同类公众号前列,形成广播电视、大屏小屏、网上网下传播格局,积极唱响贵州好声音、传递发展正能量,有力引导了社会舆论。
在技术创新运用方面,加快全台数字化、融合化、高清化改造步伐,全面实现贵州卫视及所有地面频道高清化播出;《超高清(4K)全媒体新闻演播中心》等项目投入使用,有力增强了网络直播和全媒生产能力。《超高清4K全媒体转播平台》项目获中国电影电视技术学会科技进步奖一等奖,创造了我台参加国家级科技奖项评比历史最好成绩。携手三大运营商和产业链上的合作伙伴,大力发展IPTV业务,用户已经突破640万,覆盖人口超过了全省半数以上家庭,在业务收入、技术研发及行业影响等方面都取得了不错的成绩,公司正准备上市,目前正在进行股份制改造。随着用户体量的增长和智能技术的不断突破,IPTV既担负着传播主渠道的职责,也正在从单纯的视听载体向更加智能、融合、开放的智慧服务平台演进升级。
二、案例概述
2018年以来,贵州广播电视台充分领会媒体融合发展的战略意义,全面推进媒体深度融合,着力打造电视、广播、网站、客户端、微信、微博、平台号“七位一体”的融合传播平台。在融合转型过程中,我台坚持科技创新引领、技术驱动转型、数据助推经济,将高新技术与工作实际相结合,充分运用新技术新应用创新媒体传播方式,注重数据生产要素积累,在创新、协调、绿色、开放、共享的新发展理念指引下,引导数字经济和实体经济深度融合。
为有效利用及保护珍贵历史资料,我台于2006年开始建设第一代基于四层编目的媒资系统,将媒体资产从库藏式存储转变为数字化存储。第一代媒资系统存储了近1PB的视音频资料,其中视频资料约4.3万小时、音频资料约4.6万条。其虽然大大提高了媒体资产存储安全性,但采用传统架构进行构建的系统难以与其他系统实现互联互通,形成的数据孤岛使得资源共享困难,更难谈及高效支撑大量库存媒体资产的再利用以及有效支持各类新媒体业务的开展和实现数字版权交易。随着移动互联时代的到来,新诞生了海量新媒体素材,仅我台“动静”新闻客户端一年的新媒体素材量,就已经和建台以来所有历史视音频数量持平,新的需求也加速推动媒资技术的迭代更新。
数据作为新型生产要素,是数字化、网络化、智能化的基础。为了更好地管理与日剧增的媒体数据,促进数据安全、高效流通,积极推进数据要素市场化,我台开始立项建设推动内容生产向“智媒”转变的新一代《智慧云媒资系统》项目。该项目分多期进行建设,一期把传统媒资管理从信息孤岛转变成数据中心,形成媒资大数据,同时具备成为全省媒体数据仓库的基础能力;后期依托平台的数据支撑和底层能力,探索构建数据治理体系,提升媒体数据价值,建立覆盖内容生产“策、采、编、发、审”全流程安全管控的“智媒”平台,促进媒体数据市场化,为支撑宣传思想文化机构数字化转型、服务文化保护传承利用、建设文化大数据体系奠定坚实的基础。
为了更好地支持媒体融合背景下的内容生产,为“智媒”平台提供有力的数据支撑和服务支持,充分发挥数据这一新型要素对其他生产要素的倍增作用,加快培育媒体数据要素市场,一期项目制定以下建设目标:
一是建设全省统一的媒资服务门户,通过面向互联网的统一门户,做“活”媒体大数据,促进媒体数据安全、高效流通,在流通过程中产生更多的数据,形成数据回流,赋能全省文化产业、实体经济。
二是引入人工智能技术,实现媒体资产从内容汇聚到生产、审核、管理等全流程全环节的智能化处理,实现数据的自动分类。同时建成智慧中台,将AI能力赋能全台业务系统。
三是利用AI技术对建台以来的历史媒资数据进行深度挖掘,进行智能分类、关联,完善历史数据信息。将媒资系统打造成全台的数据枢纽中心,形成媒体大数据。
四是实现版权信息著录,提供版权信息的检索、分类等功能,避免版权风险,为后期实现媒体数据要素交易提供支撑。
项目设计之初,项目组在全台内容生产部门广泛开展需求调研和业务分析,根据实际应用场景和十多年的媒资使用经验,结合技术发展方向,面向智能化互联网应用,提出以中台为核心的新一代媒资系统建设思路,与北京中科大洋公司共同进行项目研究设计。
为了应对大规模数据的线性可扩展问题和复杂业务系统的解耦问题,我台采用中台结构,能够高效地对全台媒资、业务数据进行管理、分析、二次赋能,避免内容生产共性功能的重复开发、建设,提升业务标准化。业务结构从紧耦合模式变为松耦合模式,可更方便地对所有业务模块进行统一能力提升,大大减少出现问题时的排查成本。要对全台内容生产系统提供标准化共性服务,中台的普适性和拓展性以及服务质量的监控就显得尤为重要。面对我台现有PB级别的历史媒资数据和不断增加的海量新媒体素材,频道、频率各自为阵的内容生产模式,以及融媒体矩阵下载和粉丝数量破亿带来的复杂前端业务需求,经过台内技术专家、业务骨干经过多次论证、评估,把《智慧云媒资系统》定位为全台的智慧中台,与台新媒体生产平台、非编制作网、播控平台共同构建媒体数据体系,汇聚我台核心数据生产要素。
系统中台服务主要包括视音频转码处理、AI内容识别。视音频转码服务选用了基于开放可扩展的融合转码框架的LeoVideo视频处理平台,内置多种视频转码、打包、技审、抽帧、响度控制等视音频处理需求。基于计算资源的智能化调度,指挥中心不仅可以按负载均衡策略对所有节点进行任务分配,还可以按照分片策略将任务分解为多个子任务,使任务达到负载均衡和快速处理的目的。
AI内容识别包含人脸识别、语音识别、OCR识别、文字校对以及NLP语义分析等。人脸识别选用8通道商汤服务器引擎,可实现人脸标签自动提取、敏感人物快速查找。语音识别选用5通道科大讯飞引擎,可实现普通话连续语音的实时转写,并提供对转写文字的字音同步对齐能力。OCR选用厚建OCR识别引擎,可把视频、图片中的文字或字幕内容识别文字,有效避免错别字、敏感词等内容。NLP语义分析通过调用百度云API实现。随着中台服务的开发推进,VM节点和物理机会逐渐减少,系统还配备Docker服务器可部署AI、转码等服务,方便后期能力拓展。
媒资系统最重要的就是系统存储能力,为保证媒体数据安全,我台选用了在线+近线同时存储的架构。我台原有媒资系统选用了数据流磁带作为近线存储,经过十多年的使用,已经有少量磁带开始出现损坏。而且数据流磁带不能向下兼容,升级维护成本较高。光存储经过30余年的不断发展,现已成为可以在低成本的条件下满足对爆发式数据增长进行归档需求的介质。系统采用松下蓝光盘库作为近线存储,有效克服传统数据流磁带库对存储环境要求高、维护成本高昂、且驱动器兼容性差等问题。光盘匣容量6TB/匣(单张光盘容量500G/张,12张光盘/匣),配备304个光盘槽位,有效容量1.5PB。在线存储的选型上,由于传统NAS存储对于大量文件管理调用时,会随着文件数量增多而出现明显性能下降。且访问认证基于操作系统级别进行认证,只要具有访问权限的工作站带有病毒或者误操作,会影响到整个存储系统。对象存储采用的是扁平化数据管理模型,可以轻松应对亿级文件数量,基于“应用软件”授权的,访问对象存储系统时,必须获取访问授权秘钥。存储桶之间互不影响,不会因为单个应用影响所有存储系统。并且具有高并发访问、扩展性强、本地化存储成本低等特点。基于上述原因,系统采用了对象存储作为在线存储,一共6个节点,可用容量1.7PB。
媒资系统的更新换代,如何继承现存媒资数据,是项目建设的痛点和难点。现有媒资系统存储了17万余条近1PB的视音频资料,其中视频资料时长约5万小时。为了尽可能避免继承过程中数据的丢失,我台与中科大洋公司共同开发出继承工具软件。如果仅仅继承视音频资料和原有编目信息,难以对历史视音频资料进行有效的二次利用。项目组经与节目部门多次沟通,按节目分类的重要性先后对历史资料进行继承和AI翻库,并且可手动选择AI内容识别方式,历史数据的继承和AI翻库历经一年半全部完成,因数据流磁带损坏丢失的数据约占千分之二左右。
随着媒体融合工作的不断推进,我台两微一端以及各类平台号产生了大量新媒体稿件。系统增加了对视频、音频、图、文混排的新媒体稿件资源的支持。可以通过入库API接口实现资源入库,调用资源多模态处理接口,对富文本资源进行AI内容识别。新媒体稿件下载之后,以 HTML 的形式进行“原形呈现”,具有良好的可读性及浏览体验。
系统的互联共享支持基于系统间的资源交换流程的资源调用。在流程运行过程中可以调用对方系统的入库服务接口直接推送到外部系统,也可以将资源下载到指定路径由外部系统自行导入。采用通用服务接口,保证了与其他业务系统的无缝对接,根据具体的新媒体系统进行适配,支持与微博、微信、IPTV、网络电视台等新媒体系统对接。支持面向新媒体渠道的分发或推送业务,实现了资源分发申请、审核、发布的全流程管理监控。系统的分发既可以手动发起分发任务,还可以通过制定分发策略根据相应规则自动分发。由于各个新媒体平台对资源包含文件的要求不同,系统提供了多种形式的附件和发布模板,可以依据目标系统的要求提供肖像、各种码率的视音频文件以及元数据信息。
系统提供统一运营管控平台,实现智慧云媒资开通、管理租户的功能,支撑外单位开展云端媒资服务以及节目交换业务。租户管理支持按租户为单位对媒资进行管理,还可以实现按租户为单位对人员、资源策略、业务规则进行规划统筹。既可以满足资源独享和租户内的快捷协作,还可以实现租户间资源的共享和交换需求。每个租户逻辑上完全隔离,租户内的人员角色可由租户管理员进行授予或调整,每单位的租户资源享有独立分配的空间、遵循适合本租户业务特点的在线周期、删除策略等管理标准。对于不同租户涉及的入出库、生产流程,同样支持租户管理员对流程环节进行自主调配和调整。
项目一期工程实现了智慧云媒资系统的基本功能,建成全省统一的媒资服务门户,通过引入人工智能技术对全媒体资源的智能化处理,支持传统四层编目体系和互联网标签体系,实现版权信息著录,完成了我台前期拟定的建设目标,有效弥补了传统媒资管理中的智能化短板。项目基于私云架构设计,采用万兆核心、千兆接入的网络结构,建设了一个面向媒体融合、支持多租户的新一代媒资系统,开启了媒资2.0时代。项目共获12项计算机软件著作权,1项专利已通过实质审查。
系统的建成使我台媒体数据的治理水平得到大幅提升,特别在对于富文本新媒体资源的支持上,填补了媒资系统在新媒体内容存管用领域的空白。我台依靠省级主流媒体积累多年的安全播出、安全生产以及网络安全管理经验,以《网络安全法》《数据安全法》为依据,以《个人信息保护法》为准绳,结合台工作实际,逐步建立适应媒体深度融合发展的媒体数据分级管理制度,保障数据依法有序流动,促进以数据为关键要素的数字经济发展,释放媒体数据价值。
人工智能辅助编目的全新流程以及AI自动化处理极大地节省了人力,提高了工作效率。系统采用的智能中台架构,能够快速迭代、灵活扩展。通过AI资源复用,多业务赋能,使我台珍贵的历史资料得到更为安全的保存和在再利用,为我台全媒体业务发展提供有力支撑。
自投入使用以来,系统运行稳定可靠,对原媒资系统存储的4万小时历史素材进行了继承以及提取标签的翻库处理。运用人脸识别、语音识别、OCR识别等人工智能技术,完成了13万余条素材的智能化标签提取,形成媒资大数据。系统智能编目处理量可达3万小时/年,能够有效推动内容生产提质增效;依托智能中台,可提供敏感人物识别、语音转写唱词、以图搜视频等衍生服务,有效提升了我台媒体数据治理能力。
《智慧云媒资系统》的创新性和先进性引起全台内容生产部门、省内主流媒体、行业用户的广泛关注。系统尚在技术测试阶段,就有多个栏目提出试用申请,建成仅半年,已有行业用户签约入驻。省内多个地州电视台和县级融媒体中心也表达出合作意愿,但受各机构自身互联网接入带宽限制,目前传输速度还不理想。为解决这一瓶颈,我们也在寻求与电信运行商合作,力争早日打通媒资共享的高速链路,面向省、市、县三级媒体及政事企等机构提供媒体资产统一智慧化存管用服务,不断丰富媒资2.0+应用。
目前AI还处于弱人工智能阶段,我台《智慧云媒资系统》的AI能力也还存在不尽如人意的地方。例如,样本照片清晰度和数量与人脸识别准确度成正比,难以成规模的样本照片会成为人脸识别的瓶颈;在语音识别方面,节目素材中参杂的各地方言、背景音会导致识别准确率降低,尤其是音乐类节目,很难准确识别出歌词;在复杂场景下,智能拆条的精度以及有效条目数还有待提升。尽管AI识别还不能完全取代人工,但通过其获取数据信息的效率远高于人工,有效利用好AI进行辅助,将会大幅提升编目效率,让内容生产者从复杂、繁琐的工作中解放出来,有更多的时间投身于更具有创造力和价值性的工作中。
人工智能、大数据进入传媒产业领域,不仅对节目生产有重大影响,对于媒体技术工作者也是一次重大考验。作为智慧媒资系统的运维人员,不仅需要了解传统视音频技术,更需要面向新媒体内容生产。我台在传统媒资技术团队基础上创新引进了新媒体研发人员,在全面输出高质量服务的同时,通过取长补短、相互融合,孵化出适应媒体深度融合需要的全能型全媒体人才。在媒体深度融合发展过程中,我台积极推进技术人才评价改革,通过创新评价方式、评价指标,完善人才评价和流动机制,逐步形成可操作、复制的有效方案,向地州电视台、县级融媒体中心推广,发挥省级媒体标杆作用。
《智慧云媒资系统》一期项目经中国电影电视技术学会专家鉴定,认为其取得了明显的社会效益和经济效益,在技术架构、业务能力等方面具有创新性,达到国内领先水平。在未来项目规划中,我台计划增加对AR/VR、3D视频等沉浸式视频以及虚拟展馆、历史文物3D模型的全面支持;利用数字水印、区块链等新技术实现数字资产的确权和版权交易;引入智能推荐算法为内容生产进行个性化服务;探索打造全省文化数字资产汇聚、生产、交易的“智媒”平台,面向政府、企事业单位及社会各行业提供智能化媒资服务。通过进一步规范数据共享协调机制,积极推动媒体数据要素在全省范围内实现高效配置,加速融入国家文化大数据体系。
新闻技联动态
- 成功举办中国新闻技术工作者联合会市县融媒体分会年会暨换届大会 2022-12-23
- 中国新闻技联新闻信息标准化分会 2022年年会成功召开 2022-12-01
- 《机器生产内容自动化分级》团体标准 正式发布实施 2022-12-01
- 延期通知:中国新闻技术工作者联合会 县市融媒体分会 2022 年学术年会暨技术交流会 2022-12-01
- 2022年中国新闻技术工作者联合会学术年会在贵阳成功举办 2022-11-17
- 喜报│53个案例入选首批“技术赋能‘新闻+’推荐案例” 2022-11-17
- 重磅│19位新闻技术工作者获此殊荣 2022年度“王选新闻科学技术奖”人才奖在贵阳颁奖 2022-11-17
- 新品│速看哪三项传媒技术创新产品发布 2022-11-17
- 2022年中国新闻技术工作者联合会学术年会胜利开幕! 2022-11-17
- 启动│“中国新闻技联”2.0版官网上线啦! 2022-11-17