人民日报社卫星稿件接收系统漏稿问题的分析和处理
于波 衡永辉 程丽彦
(人民日报社)
[摘要] 本文简要阐述了人民日报社卫星稿件接收系统,着重分析了该系统在导入本社业务系统时存在的漏稿、丢稿问题,并提出了解决方案,实现了新华社电稿通过卫星稿件接收系统能及时、准确、无误地导入到本社公共稿库系统中,方便编采人员的选取、采用。[关键字] 卫星接收系统 漏稿问题 公共稿库监控 稿件入库1. 引言人民日报作为中国共产党的机关报具有一个鲜明的特点,除报社自采的新闻外,有很多实时性稿件取自新华社电稿,诸如国家领导人出访、国际国内重大新闻等,所以新华社卫星稿件接收与自动入库系统是人民日报编采系统的一个重要组成部分。人民日报社技术部负责卫星稿件接收系统的正常运行,自该系统运行以来,时常会出现卫星接收系统中稿件数量与导入报社公共稿库系统稿件数量不一致的现象,即漏稿问题。为解决这一问题,我们利用现有设备和工具,使用比对、排除、筛查等技术手段,保障了新华社稿件接收系统的正常运行,并及时、准确、自动地将新华社稿件接收后按类导入到人民日报公共稿库中,供社内编采人员查询、取用。2. 卫星接收系统现状人民日报新华社卫星接收系统由两套互为备份的卫星接收系统组成,它们互备互检、双路上传、自动入库,降低了维护工作的强度和故障排查的难度,使新华社稿件能及时、准确、无误地导入到人民日报公共稿库系统中。2.1. 新华社稿件导入人民日报编采系统流程新华社卫星稿件接收系统要保证24小时全时工作,随时接收和转换接收到的新闻稿件与图片。这就要求卫星接收系统、接收计算机(落地机)、入库服务器、核心服务器各个环节都能保证正常可靠地工作。其入库流程为:卫星接收稿件到本地硬盘 → FTP传送到公共稿库服务器→ 通过入库程序入库→ 进入公共稿库数据库→ 在公共稿库平台的“新华电讯”或者“图片库—新华图片”显示,流程如图1所示:图1卫星接收-落地检测-双路上传-互备互检-自动入库
2.2. 新华社稿件的分类新华社稿件分为文字稿和图片稿,新华社文字稿件的格式为可读的XML文件,文件中除相关新闻内容外,也将此条新闻的分类、作者、标题、日期时间等项分别用标识列出,便于分发程序根据这些标识对稿件分类。新华社图片稿除有JPG格式的图片外,还有一条同名的XML说明文件,同样包含此条图片新闻的分类、作者、标题、日期时间、简介等项的标识。图2 XML编辑文件
从稿件类别上,文字稿件又可分为通稿新闻、社会文化新闻、体育新闻、服务新闻、财经新闻等,图片稿件又可分为彩色通稿、图表专线、法新专线、体育专线等,当新华社所发稿件的分类不在上述分类中,文字稿自动分入通稿新闻,图片稿自动分入彩色通稿。图3公共稿库新华电讯稿件分类
3. 漏稿的现象及分析新华社稿件自带信息与人民日报新闻编采系统要求的格式不一致,无法直接被人民日报编采系统所使用,因此接收到的新华社稿件不能直接入库,必须要有入库程序按照时间顺序依次将稿件转换格式后,导入到人民日报编采系统中。新闻的重要特点就是及时性与准确性。及时性要求卫星接收机接收到新华社稿件后,能通过最短的时差导入到人民日报公共稿库系统;准确性要求接收到的稿件要在新闻内容不增不减的情况下,依次按序导入人民日报公共稿库系统,并且在新闻篇数上也不增不减。但人民日报卫星接收系统在日常工作中会出现漏稿现象,即新华社电稿不能及时、准确地被导入到报社的公共稿库内。漏稿的表现形式很单一,但引发的原因却是多种多样的,由于存在多种影响因素,所以具体问题应具体分析。从系统构成的流程来看,每一层与每一层之间的节点为故障易生点,也是分析与查找故障来源的节点。从下图我们可以看到,卫星接收受天气和设备自身两部分影响,天气方面如雨衰和雪衰、及太阳黑子活跃等影响,设备方面受卫星天线、连接线路与新华社配备的卫星接收机、接收计算机与入库计算机的软硬件等各方面影响。图4数据流程图
为解决以上所述的影响因素,最简单有效的方案就是系统构造按照双路接收,各成体系、互备互检来设计规划,从源头减少设备因素干扰,并且增加了系统的整体安全可靠性;其次技术值班人员要利用现有工具进行分析排查,最终实现避免漏稿现象的发生和补救。4. 漏稿问题的解决方案4.1. 漏稿问题处理工具4.1.1. 全局监控软件webmon全局监控软件webmon是对公共稿库的新华稿件、图片入库数量及时地直接与新华社数据库进行比对,监控软件通过WEB方式来访问,在浏览器上输入地址则可以进入监控界面。在界面上列表显示了各项监控的任务,点击每一项任务会下拉式地显示此项任务监控的详细信息。1. 监控内容包括网页链接有效性监控、模拟网站登录监控、关系数据库监控、FTP监控、TRS数据库监控和端口监控。监控内容项可以通过开发来扩展。2. 监控特点多任务监控机制:监控的各个任务互不干扰,不会因为一个任务不响应而堵塞到其它任务的显示。3. 出错声音报警监控界面采用无闪烁的刷新机制定时进行任务刷新,并返回最新的监控结果。监控内容项通过XML配置文件进行配置,用户可以随时增减监控的任务。修改后立即生效,不用重启。图5公共稿库监控主界面
点击“公共稿库监控”打开详细的监控内容页面,监控的任务在界面上一目了然地列出来,刚打开监控页面的时候,页面上各任务的状态显示为“Running”,接着会返回监控的结果,如果运行的任务正常,页面上的任务显示“OK”;如果有异常,则任务上显示“Fail”,并用红色显示详细的异常信息,同时伴有声音报警。监控界面采用无闪烁的刷新机制定时进行任务刷新,返回最新的监控结果。图6公共稿库监控正常界面
图7公共稿库监控报错界面
通过新华社文字稿监控、新华社图片稿监控、新华社线路流水号监控(漏稿监控)来发现问题。新华社文字稿监控、新华社图片稿监控用以获知最新的来稿信息,若30分钟内未有新稿入库则报错。通过新华社线路流水号监控,若入库期间有漏稿问题,则监控系统报错。通过这三项监控,能够保证新华社稿件不会缺失。如果监控报错,需要按照数据入库流程进行故障排除。4.1.2. FTP测试排查工具处理漏稿问题的另一有效工具是FTP,可以用来连接到入库服务器上,与卫星接收落地计算机的数据进行比对,以此来判断新闻数据到底是在哪个环节开始异常。运行启动文件,通过FTP方式上传新华社来稿到公共稿库服务器。执行启动文件,选择任务“xhs”,然后单击“open”。图8 FTP测试排查工具的页面
4.1.3. WEB页面查询新华社还提供一个WEB页面的查询方式,它可对已经落地的新华社稿件进行直接查询,并且每篇稿件有清晰的流水号,如没有进入公共稿库,也可直观的显示出来。图9新华社WEB页面
4.2. 漏稿问题的处理为保证新华社稿件导入人民日报社公共稿库的及时性,在衡量了安全、效率、系统负担后,我们将导入稿件时差设为5分钟,这样即能照顾到系统负担不至于因频繁的扫描目录的动作负担过重,也能及时地将新华社稿件转换到公共稿库。新华社稿件的丢失分为两种情况:第一种情况是指卫星接收系统未接收到新华社稿件,这往往是因为天气原因或卫星接收系统故障造成的,因新华社发稿为循环发稿,遇卫星接收系统未收到稿件时,会自动重发,直到接收到为止。如果是卫星接收系统故障,因为有两套互为备份的接收系统,同时故障的机率很小,我们可以用另一套卫星接收系统所接收的数据来进行入库以克服故障。还有卫星接收系统的故障往往是因为长期处于开机状态,其计算机中的资源得不到有效释放,累积所致,因此简单的重新开机就可能让卫星接收系统恢复正常。第二种情况是指实际接收到了新华社稿件,但因某种原因未能转换进人民日报公共稿库中。此种情况可在公共稿库监控报错提示下,比对卫星接收计算机所接收到的文件数与上传到入库服务器的文件数以及公共稿库中的实际稿件数,并按照稿件序号与接收时间,找到未能转换的稿件。新华社卫星接收系统一般故障排除的步骤:1. 查看卫星接收服务是否有新稿。2. 查看FTP上传稿件日志是否有问题。如果有问题,尝试重启软件;如果报连接问题,需要按照步骤3检查ftp服务器。3. 检查是否可以成功登录ftp服务器。在“开始”→ “运行”框输入服务器地址,即可访问ftp,并尝试上传一个文件是否成功。4. 检查TCM入库程序。5. 访问新华社供稿系统,如果无法访问控制台,应重启动控制台和代理服务器。进入控制台,如果server1为停止状态,则点击“启动” 按钮启动server1,或者启动TCM入库程序,判断server1中的“新华社稿件入库(文字)”和“新华社稿件入库(图片)”两个任务的日志是否正常。可以根据日志信息进行一些诊断。图10日志信息
6. 如果有失败稿件,可以启动“公共稿库-新华社失败稿件重入库(文字)”和“公共稿库-新华社失败稿件重入库(图片)”两个任务,重新把失败稿件重新入库。4.3. 示范案例值班人员发现稿件监控程序在报警缺失稿件,早上8点以后就没再有新的图片入库,进一步检查卫星系统落地接收正常,新华社本地入库和ftp分发到服务器均没问题,但ftp传到服务器后,公共稿库未正常入库。这样就可确认是分发程序TCM错误但监控却没有报错,导致图片没有正常入库。这样在重启了TCM程序后,图片逐步分发进来,数量正常,不再报警。图11公共稿库监控系统缺失稿件界面
5. 总结与设想虽然有上面这些工具可以帮助我们排查到故障点,但对比查找数据非常麻烦,如当出现不能转换的稿件或漏掉的稿件时,如能自动将这些稿件和稿件名单独存放,这样的话,一目了然,有利于技术人员的排查和快速的修复。稿件接收还不能做到完全自动,出现故障后还要人为现场干预。这虽然受制于报社的网络环境,但在技术不断进步的今天,如果能在保证安全的前提下,技术人员直接在家里通过外网访问到新华社卫星接收系统,远程监控和操作本地计算机,从而达到人不在现场,而技术支持却无处不在。现系统基本可以保证正常的自动转换工作,但误报现象比较突出,这增加了值班技术人员的工作强度。比如空稿期设为30分钟,虽然可以及时提醒技术人员来查看系统是否处于不工作的状态,但当新华社不发稿的时间段,就会出现误报警,浪费技术人员的精力。如能根据新华社发稿的规律,将空稿期根据每天的不同时段给出不同的时间设置,将会大大减少误报率。 联系方式:于 波:13911689618衡永辉:18910838255程丽彦:18618287887 chengliyan3203@sina.cn 编辑:中国新闻技术工作者联合会
评论 点击评论