报刊图书数字资源公共服务平台项目规划设计
刘亚军 刘延军 胡阳
(沈阳日报报业集团)
[摘 要] 发展数字出版是我国信息化的重要内容,也是我国出版业的既定方向。本文创意规划和设计了报刊图书数字资源公共服务平台,即采用先进技术,以资源整合数字化运营为目的,提供报刊的历史资料数字化回溯加工、数据库建设和全文检索服务,满足报刊的网上订阅、图书的网上售卖、数字报刊和电子图书的在线终端(移动、网络、户外电子阅读屏等)有偿或开放阅读等需求,同时可扩展提供诸如版权交易、数字剪报等社会服务功能。[关键词] 数字化 数据库 公共服务 全文检索 移动客户端 电子商务 1 引言近年来,国家把信息化建设纳入到了重要的议程,而发展数字出版是我国信息化的重要内容,也是我国出版业的既定方向。用数字技术构建高科技支撑的出版系统,由数字技术改造和提升我国传统出版业的整体水平,是加快实现我国出版业现代化的两个关键问题。随着数字技术在传媒业的广泛应用,传统媒体与新媒体在竞争与融合的基础上,正在实现多元化的共同发展。报业已经从营销报纸逐渐转变为营销内容,从报纸运营逐渐转变为内容运营,从传统报业单一的报纸经营转变为全媒体的整合运营。随着数字报刊技术和相关产品市场的发展,国内绝大多数新闻出版单位开展电子报刊图书出版业务。而随着数据库等技术的发展,机构用户和专业人员对出版产品的需求发生了明显变化。数字报刊图书产品的表现形式更加丰富,不仅能以整版的形式出现,还可以按照条目等进行重新的标引和加工,进而形成新的产品形式。数字报刊图书的出版和发行已成为我国发展迅猛的一个产业。 2 立项依据国家“十二五” 新闻出版规划提出:新闻出版公共服务体系是公共文化服务体系的重要组成部分。加快建设和完善覆盖城乡、惠及全民的新闻出版公共服务体系,是发展新闻出版事业的根本任务,是维护好、实现好、发展好人民群众基本文化权益的重要途径。“公共服务”已成为国家出版业改革发展的重点支持方向,传统报媒数字化和移动客户端媒体化是目前数字出版行业的趋势。对报纸而言,加快启动数字化转型战略,无疑是赢得媒体竞争主动权的一个有效途径。国家对新闻出版公共服务体系建设陆续出台了一系列政策和措施,表明了国家对数字出版的重视,给本项目的建设提供了政策上的保障。沈阳日报报业集团在坚持正确舆论引导的前提下,不断提高舆论引导能力、不断增强新闻传播能力,通过新技术的应用和新媒体建设,加速报网融合,在全媒体新闻业务、新媒体传播与运营等方面积极探索实践,逐渐实现传统媒体和数字媒体的优势对接。集团自有报刊及网站数字内容的提供,为本项目数字内容资源整合奠定了良好的基础;集团有着一支技术精湛、业务熟练、敢打硬仗的技术团队,为本项目的实施提供了技术保障。沈阳日报报业集团在开发国内首家全媒体数字报的基础上,将应用数字技术,开发建设覆盖辽沈地区的报刊图书数字资源公共服务平台,为大众提供更全面、更便捷的公共服务,以数字产品的生产和传播不断推进新闻出版产业现代化的进程,推进文化惠民实践的深入开展。报刊图书数字资源公共服务平台将在满足人民群众基本文化权益工作中发挥重大作用,符合新闻出版产业发展方向,对项目所在地新闻出版产业发展将会产生较大的推动作用,对促进新闻出版业技术进步、产业升级、加速新闻出版产业转型,具有基础性与示范性作用。3 项目设计方案3.1 整体架构报刊图书数字资源公共服务平台是采用先进技术,以资源整合数字化运营为目的,提供纸刊的历史资料数字化回溯加工、数据库建设和全文检索服务,满足报刊的网上订阅、图书的网上售卖、数字报刊和电子图书的在线终端(移动、网络、户外电子阅读屏等)有偿或开放阅读等需求,同时可扩展提供诸如版权交易、数字剪报等社会服务功能(如图1所示)。据此实时监控报刊的动态信息,进行热点分析,为行业改革提供依据,为公众提供地图、位置服务、生活信息点评等便民服务。 3.2 资源平台建设内容3.2.1 报刊历史资料数字化实现历史报刊数据的完善、升级、改造等再加工,历史资料数字化回溯加工等功能,据此透过多媒体数字报刊制作及发布平台创建报纸全文数据库,为广大网民提供全文检索、在线阅读及订阅等增值服务。3.2.2 网上图书电子交易利用地缘优势,在出版社和读者之间搭建一个类似当当网上书店的本地区网上图书销售平台,为出版商再添网上营销的推手,使本地网民缩短订阅周期。3.2.3 电子图书订阅立足本地并与大型电子图书生产商合作,建设专业的优质中文数字内容整合服务平台,以数据库方式收录建国以来相关的图书全文资源、相关报纸及年鉴、工具书、图片等特色资源产品。为图书馆、企业、政府等客户及其读者提供在线阅读、全文检索、离线借阅、移动阅读等数字内容和知识服务。3.2.4 移动终端阅读3.2.4.1 平板电脑阅读开发平板电脑等移动客户端系统,建立新型的用户交互体验,配以专业的版式、流式合一文档技术,既可阅读原版电子书,又可无级放大、版面重排,成为商务阅读的最佳选择。3.2.4.2 手机阅读富媒体时代的独立发行渠道—3G客户端,内容载体包括多媒体数字报刊、音频、视频、图文、互动,根据手机特色将媒体的品牌影响力无缝移植到手机中。3.2.4.3 电子阅读屏阅读通过平台提供的电子屏接口,可随时与各种电子阅读屏连接,即可以网上读报,也可以读电子书,还可以观看视音频、动漫等多媒体信息。在读者交互式阅读过程中,即时插入播出定向信息,如滚动文字、新闻及广告播放。3.2.5 版权交易服务除了报刊、图书的网上订阅,以及电子书的多通道阅读外,在公共服务平台上额外建立版权交易频道,主要为本地出版界提供所属版权在网上的自由规范交易通道。3.2.6 剪报服务随着数字报刊业务的发展,将全年的数字报打包形成年度电子版用于销售、收藏和赠送(如订阅全年纸报的读者)成为一个新的需求,同时利用面向不同读者群体的、有价值的内容重新组织,整理,通过本平台的剪报模块导出后,打造更个性化的电子专题合订本,比如博鳌论坛报道、2011年领导报道、某企业全年广告专题等等,提供有针对性的、纵向的报刊阅读体验,将会创造良好的市场和社会效益。3.2.7 报刊特色资源数据库制作系统报刊特色资源数据库制作系统在成品展现上可以提供原版原式的报刊阅读,同时支持多媒体片头动画、背景音乐等多样化的阅读体验。在功能上支持高级检索、二次检索、专题检索等功能,使报刊内容价值挖掘最大化。3.3 技术解决方案3.3.1 报纸数据加工方案3.3.1.1 数据加工流程数据加工流程如图2所示。 3.3.1.2 纸报回溯加工资料整理à扫描à图像处理à OCR标引à OCR识别à OCR编改校对à OCR版面合成(双层PDF)à反解à热区编辑à输出成品à报社数据发布(可对线上报纸进行模板配置、内容管理、发布管理等相关管理操作;具备用户管理的功能,可实现管理员多点登录协同工作;还可以提供导出稿件数据供第三方系统使用)à数据备份。3.3.1.3 电子数据报纸加工流程数据整理,必要时数据需发排处理à反解à热区编辑à输出成品à数据管理:输出成品数据的存储和备份,应用数据库的管理和备份。3.3.1.4 关键技术1. 多格式反解及版面理解技术为了内容数字化,反解技术需要尽可能多地覆盖报社排版文档格式。项目中会涉及大规模的数据标引工作,引入版面理解的技术可以针对性地提高标引效率和准确度。2. 报刊内容的组织与多渠道发布技术快速有效的内容管理与组织技术可以及时的将数字报刊海量内容以制定的内容组织方式,在无人工干预的情况下以最快的速度将报刊数据组织完成满足报刊发行时效性的要求。多渠道的内容发布技术可以将报刊内容按照需要发布成各种格式的数据,配合特有的内容加工制作技术形成最终运营需要的数据如网页、光盘、多媒体报刊、报刊数据库、手机报等数据格式。3.3.2 数据检索方案检索报刊数据库的三项关键技术是电子报刊的标准化加工制作技术、海量数据的存储和检索技术、内容挖掘技术。本方案采用国内本领域的前沿技术,能够保证数据库建设的先进性。3.3.2.1 分布式报刊数据采集与转换数字报刊库建设的关键技术问题之一就是报刊数据的采集和标准化。首先,提供标准格式的排版文件,可以考虑提供通用的转换工具对排版文件进行格式转换,再将转换的标准格式文本信息进行上传和报送,由系统对于报送数据进行数据校验和数据的加载,从而实现报刊信息的采集入库。3.3.2.2 海量数据的存储和检索技术磁盘阵列与网络存储是海量存储的先锋技术。磁盘阵列(RAID)是一种提供增强冗余、容量和存储性能的存储方法,有着较强的可管理性、可靠性和可用性。网络存储是通过网络存储设备,利用原有网络或构建一个存储专用网络为用户提供统一的信息系统的信息存取和共享服务。非结构化全文资源数据库服务器作为系统全文检索引擎,采用了非结构化数据全文检索以及资源整合、跨库检索技术。该检索技术兼顾了大跨度内容选择检索、检索结果分组与分布统计、权限检索等功能,可以面向不同领域提供专业化的内容检索服务,满足媒体内容质量提升和多维度分类的要求,方便用户使用。3.3.3 网上书刊订阅和版权交易方案3.3.3.1 实现方式搭建国内先进的网上报刊图书订阅电子商务平台(既包括线下图书和报刊的网上售卖和订阅,也涵盖电子图书及数字报刊的网上即时阅读),并收录多家出版机构、大量作者的信息及其作品库、多家数字报刊,以此为基础向报刊出版产业链中的作者、出版单位、发行单位、信息情报单位、读者提供各类信息服务。图3以数字报刊为例展示了从内容制作、发布到网络发行订阅的的全过程。 3.3.3.2 关键技术1.基于国内流行的多维度电子支付交易平台技术,使得系统的可靠性、健壮性得到有力保证。2.使用拥有OEB权威认证的全球领先版式技术,让手机屏读和PC屏读一样舒适,使读者不需要安装阅读软件,即可快速在线翻阅电子书报资源。3.基于全球领先的DRM数字安全保护技术,提供针对数字报刊、版权交易等新产品发行业务的支撑系统,让作者和读者的共同权益得到尊重和保护,保证资源的持续更新。3.3.4 移动终端阅读方案通过安装本平台的iPhone/iPad版等客户端,读者可以通过iPhone/iPad等阅读终端登陆平台进行借阅,基于流式技术的支持,读者可以在iPhone/iPad等移动终端上获得媲美原书的阅读体验。还提供针对Andriod、Windows手机系统的客户端,为各类手机读者提供在线或离线电子阅读服务。3.3.5 户外电子阅读方案平台将建设与户外电子屏无缝连接的接口,可充分利用现有平台作为电子阅报系统数据来源,为广大读者延伸搭建一个用途广泛的数字报刊户外联播网(本平台的未来延伸拓展项目)。系统可支持数据种类包括:组版文件(或其它版式文件)、反解标引文件包、数字报、网站、采编数据库、全媒体资源数据库及第三方数据,同时也可提供方便快捷的手工入库方式,满足报纸、视音频、图文、新闻资讯内容的及时采集。3.3.6 剪报服务方案可以在原版原式数字报的基础上,推出针对历史数据和现报数据的剪报服务。用户可根据需要自定义监测内容及关键词,不限制监测分类数量实现自动剪报,同时也支持人工剪报模式。用户还可根据需要将剪报数据导出为标准PDF文档,便于用户浏览数据信息;所有文章内容相关图片及版面图片符合国家CNML标准的明文XML数据。由于全部数据基于报纸排版文件反解而来,可提供报纸版面原图,文章可精确到具体版面。 2 项目前景分析本项目通过建立报刊图书数字资源公共服务平台,营销数字报刊、图书,符合当今社会需求。通过现有传媒(自行发行的报纸、刊物和网站)聚集的数百万受众(网民),极易形成报刊图书数字资源公共服务平台新的十分广泛的受众群体,从而实现经营的规模效益。该项目填补了辽宁地区数字出版产业的项目空白,为推进辽宁地区新闻出版产业的快速发展,提升公众文化综合素质,创新文化惠民形式,提供了新的更宽广的平台,实现了社会效益的最大化。具体表现在以下几点:1.助力出版行业的创新及向数字出版转型,增强文化创意产业的综合发展实力。2.高效的出版发行流通渠道,实现数字内容的增值,促进节约型社会的形成。3.培养一批数字出版研发人才。4.促进国家文化走出去战略的实施,提升国家文化“软实力”,扩大中国文化的国际影响力。 3 结束语本项目充分利用现代化信息技术有效整合出版单位的内容资源,为大众及专业领域的用户提供不同形式的数字内容服务,可以有效开创出版企业在新媒体领域中的数字化运营模式,打破传统单一的平面出版及发行方式,不拘泥单一形式的发展,这是数字化出版的未来发展方向。报刊图书数字资源公共服务平台项目是国家鼓励的数字出版产业项目,已于2012年入选国家新闻出版总署新闻出版改革发展项目库,并获得中央文化产业发展专项资金支持。本项目的成果可以为我国文化产业的发展提供推动力,将充分展示我国信息技术及数字化的文化服务技术的发展水平。 编辑:中国新闻技术工作者联合会
评论 点击评论