中国冶金报社全媒体新闻出版基础项目_第1页
中国冶金报社全媒体新闻出版基础项目_第2页
中国冶金报社全媒体新闻出版基础项目_第3页
中国冶金报社全媒体新闻出版基础项目_第4页
中国冶金报社全媒体新闻出版基础项目_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中国冶金报社全媒体新闻出版基础项目全媒体资源库建设项目需求文档第1章设计概述1.1 建设目标通过中国冶金报社全媒体项目的建设, 构筑以冶金行业资讯为中心,连接上 下游和辅助行业产业链的、不同用户的、合纵连横的资讯服务平台。在这个平台 上,能够灵活应对报业的发展、创新、变革,以打造中国冶金行业资讯服务的权 威品牌。并在中国冶金报社全媒体项目建设过程中,遵循需求主导,统一标准,模块建设,整合资源,全面应用,安全服务 ”的总体方针,最终形成一系列信息化 建设和管理标准规范,建立一个高效的中国冶金报社全媒体平台,培养一批符合全媒体发展需要的复合型人才,促进中国冶金报社的流程再造和快速发展。1.2 建设

2、原则中国冶金报社全媒体项目建设遵循统一规划、统一标准、统一管理、资源共享、互联互通的原则。1.3 建设内容根据中国冶金报社全媒体项目建设目标,本期中国冶金报社全媒体项目应 用建设主要实现 全媒体资源库”和相应服务的构建。并在项目建设实施过程中, 规范中国冶金报社信息化系统管理流程,加强平台使用、运维培训。1.4 建设周期建设周期要求:根据中国冶金报社全媒体项目建设内容, 项目整体实施周期 为6个月。即2010年5月底进行项目试运行,试运行周期为 1个月,2010年6 月系统正式上线。1.5 设计要求1 .基于中国冶金报社现有的平台要求新的系统要与报社原有采编系统、图片系统保持无缝连接,实现数据

3、交 换等。保护原有投资。2 .严格控制项目建设的周期和进度严格控制项目建设的进度,保证项目按预计的时间完成。3 .标准化系统建设要遵照执行国家颁布的现有标准以及即将推出的各类规范。(1) . 技术标准化:系统的设计应使用通行的、广为接受的技术和方法, 保证系统可扩展、可升级的能力。(2) . 结构标准化:系统的设计应遵循先进的、成熟的、被广为应用和 验证的架构,降低系统的设计风险,提高稳定性和灵活性。(3) . 接口标准化:系统在设计上要满足不同系统之间连接和交互的需 要。(4) . 数据标准化:系统使用的数据,如电子文档、业务数据等,都要 符合国家相关标准的要求。4 .开放性系统在体系结构、

4、硬件产品、软件产品、数据交换协议等方面,充分利用开 放平台,保证系统具有较好的互操作性、可移植性。5 .可扩展性软硬件配置要具备可伸缩及动态平滑扩展能力,可以通过系统框架和相应服 务单元的配置,适应业务量的变化,获得良好的性能价格比。系统架构在开放的 安全应用支撑体系结构之上,系统易于扩展,通过开发相应的系统接口,即可整 合现有的信息资源、扩建新的信息资源,使得系统具有良好的可扩充性。6 .技术的先进性和成熟性本系统应用软件的先进性主要通过软硬件平台、软硬件产品和辅助设计工具 的先进性,以及在设计思想上的先进性和软件功能上的先进性等加以保障。7 .安全性项目中充分考虑系统的安全性,从系统架构、

5、应用部署、数据存储等方面保 证整个全媒体平台的安全性。本系统应用软件的安全性主要通过系统逻辑原型的 合理准确设计、系统权限的严格分配、软件开发过程的质量控制等措施加以保障。 硬件的安全性通过冗余配置加以保障。第2章项目需求2.1范围定义中国冶金报社全媒体项目 全媒体资源库”是基于中国冶金报社现有报纸、清 华紫光新闻采编资源,扩展新闻采集渠道,构建一个统一的资源库。资源库对于 多媒体信息文字、图片、音视频等能进行编辑、存储、检索等处理。其中包括待编稿库、成品库(分对内、对外服务成品库)、素材库、报道指 挥库及行业专业数据库等。待编稿库、成品库(分对内、对外服务成品库)、素材库、报道指挥库是指:1

6、 .待编稿库:主要服务对象是中国冶金报社的编辑、 记者,向他们提供丰富的 待编新闻素材,以利于它们及时、准确地完成编辑任务,做好中国冶金报社 的新闻服务工作。2 .成品库:整合中国冶金报社所有的新闻信息资源和社会上有价值的新闻信息 资源,使全社采编人员能最大限度地实现资源共享和优化配置;为采编人员提供能够打破部门壁垒,开放性的、资源整合、共享的新闻信息管理平台, 使各编辑部门的采编人员能够根据国内外新闻信息市场的需求、用户的需 求,不断研究和开发新产品。3 .素材库:将通过各种通讯渠道采集到的素材进行统一的存储和处理,方便社内编辑、记者查找、使用、关联。4 .报道指挥库:利用全媒体特点,实现新

7、闻线索、报道指挥的汇集和筛选,采 访力量集中分配、采访资源合理分配、各种信息上下互通。使得新闻中心可 迅速通过系统调度,把新闻线索以短信或 WAP推送等方式通知记者,提高 调度效率,以便记者能够在第一时间捕捉到最新的新闻事件。以下我们将详述中国冶金报社全媒体项目 全媒体资源库”建设内容。2.2功能性需求2.2.1 稿件/素材采集中国冶金报社全媒体项目需要实现如下渠道信息的采集,并统一按照规定的 分类存入资源库中。稿件/素材采集需要保证数据的完整性。(1) .互联网信息采集:实现互联网信息的采集,采集到的信息,经过系统自 动过滤、分类等处理后,存储在待编稿库中。(2) .见报历史稿件采集:实现中

8、国冶金报社现有见报历史稿件的采集。 采集 信息经过智能处理后,分类存储在成品稿库中。(3) .图片库稿件采集:实现中国冶金报社现有图片库数据的采集,见报数据存储在成品稿库中,未见报数据存储在素材库中。(4) .邮箱稿件采集:针对特定邮箱,自动采集邮箱数据,所有采集到的数据, 提供审核功能,即经过授权人审核后,才能单条或者批量导入到素材库 中。(5) .自建稿采集:系统提供新建稿件功能,编辑和授权记者可以在中国冶金 报社全媒体平台上创建新稿。自建稿根据稿件类型分别存储在待编稿库 或者素材库中。(6) .稿件批量采集:针对已有大量文档,系统提供稿件批量采集功能,其中 支持批量采集的数据格式包括 W

9、ord、PDF、Excle。批量采集的稿件根 据稿件类型分别存储在待编稿库或者素材库中。1.1.1.1 互联网信息采集网络信息采集的主要功能是实时监控和采集目标网站的内容, 对采集到的信 息进行过滤和自动分类处理,最终将最新内容及时发布出来,实现统一的信息导 航功能,编辑人员可直接提取所需要的素材进行编辑和发布。网络信息采集工具的工作结果形成了新网页的全息信息集合,每个网页的详细信息被完整记录下来,包括网页名称、大小、日期、标题、文字内容等,网页 中的图片和表格信息可同时被采集。具体功能要求如下:单个采集工具能够支持千万数量级的网页采集;采集工具支持windows系统和Linux系统。Linu

10、x系统下,可由Web端 控制采集配置及运行控制等;Web端除发布功能外,增加对采集工具的控制功能,可通过 Web端配置起始点、控制采集的启动和停止、维护采集日志等。Web端具有全功能用户界面;支持单点采集功能,用户可单独启动对某个起始点的采集;支持格式文档文本自动解析功能,并可对解析后的内容进行自动分类、 自动排重、自动摘要/关键词抽取等智能化处理;支持采集数据的个性化输出,采集到的网页元数据可以按照用户配置的 字段输出,并可输出到自定义结构的数据库中;采集的信息可以存储到多种数据库中,包括 TRS Server、SQL Server、 Oracle、MySQL,存储的格式公开,可以方便开发其

11、它应用; SQL Server增加对Unicode存储的支持。自带Oracle数据库的驱动,可省去安装Oracle客户端。若已安装过Oracle客户端,也不会影响原有应用。Windows版本的采集工具的界面支持 Unicode,对于UTF-8等编码的网 页不会显示成乱码。支持自动发布和人工发布两种方式,在自动发布方式下,采集到的网页 将自动发布到网站上,人工发布方式下,采集到的网页需要经过维护人 员的选择才能发布到网站上。各分类和专题所发布的信息可以由管理员 完全控制。每个发布的分类或专题均可以单独设定是采用自动发布还是人工发布。可以显示网页中的图片和表格。支持网页快照。可按分类、来源、专题建

12、立网页信息导航,把从各网站采集的不同风格 的信息统一导航;分类和专题均可以支持多级,分类导航和专题导航的 生成条件可以使用复杂的表达式。1.1.1.2 见报历史稿件采集目前中国冶金报社见报历史稿件主要来源于新闻采编系统, 见报历史稿件采 集需要支持如下来源数据的采集。采集信息经过智能处理后,分类存储在成品稿 库中。新闻采编系统;光盘版见报数据1.1.1.3 图片库稿件采集目前中国冶金报社为B/S结构,数据存储在SQL Server和文件系统中,因 此,需要提供现有图片库数据采集工具。 见报数据存储在成品稿库中,未见报数 据存储在素材库中。1.1.1.4 邮箱稿件采集中国冶金报社将指定几个固定的

13、邮件,并指派专人对邮件采集的稿件进行人 工审核。因此,项目需针对特定邮箱,自动采集邮箱数据,所有采集到的数据, 提供审核功能,即经过授权人审核后,才能单条或者批量导入到素材库中。1.1.1.5 自建稿采集系统提供新建稿件功能,编辑和授权记者可以在中国冶金报社全媒体平台上 创建新稿。自建稿根据稿件类型分别存储在待编稿库或者素材库中。该功能具体要求如下:编辑器为B/S结构,即为Web端工具,支持IE6及以上版本;支持多媒体数据的采集,如图片、视频、音频;用户可以像使用WORD 一样直接使用编辑页面进行稿件的编辑,实现 所见即所得的可视化文档内容编辑效果;支持稿件分类等属性的选择和设置;自建稿时,系

14、统自动提取作者姓名; 自建稿可以选择是否是专供稿;编辑器提供自动保存功能,默认 30秒保存一次;自建稿后,可以直接选择该稿件为待编稿或者可签稿,系统默认为 待 编稿”,自动将稿件导入待编稿库中,如果选择何签稿”,系统自动将数据导入到新闻采编系统,并开启新闻采编界面,进行新闻采编和签发。 该过程,系统自动进行过程跟踪和记录;自建稿保存为待编稿后,不允许再编辑。但是,可以保存为草稿,进行 冉编辑;1.1.1.6 稿件批量采集针对已有大量文档,系统提供稿件批量采集功能,其中支持批量采集的数据 格式包括Word、PDF、Excel。批量采集的稿件根据稿件类型分别存储在待编稿 库或者素材库中。该功能具体

15、要求如下:支持文件夹数据批量导入;支持 Word、PDF、Excel、ZIP等文件类型导入;支持XML、CNML数据导入;支持Word文件在线浏览;批量导入后的数据,标题默认取文件的文件名。批量导入数据,支持稿件类型选择,如素材、待编稿、成品稿。所有批 量数据将都被系统默认设置为导入的稿件类型。2.2.2 稿件处理对于采集到的稿件、素材,需要利用智能处理工具,如自动标引、自动分类、 自动过滤、自动摘要和自动聚类等,对稿件和素材进行细加工,并能够加速信息 采集入库的处理进程,提高工作效率。该功能具体要求如下:提供与全媒体资源库的关联,实现相关 事件”、入物”的关联;并能够 利用稿件、素材关联关系

16、挖掘,结合图形化展现技术,提供稿件关联地 图的展现。利用内容的相似性进行排重,不会因为标题或内容的少许变化而产生漏 判。可以帮助检索与给定文档相似的文档,应用于稿件、素材的查重。自动地对稿件、素材进行分类,赋予稿件、素材一个预先定义的类别主 题词,便于稿件、素材的组织,不需人工干预。实现稿件、素材内容的精简提炼,从长篇稿件、素材中自动提取关键句 和关键段落,构成摘要内容,方便编辑、记者快速浏览稿件、素材内容, 提高工作效率。可以自动对稿件、素材进行归类,把内容相近的稿件、素材归为一类, 并自动为该类生成主题词。有利于稿件、素材的关联,以及热点的发现。2.2.3导航服务将采集到的稿件按照不同维度

17、进行自动分类, 实现稿件的自动分类管理。如 按照时间分类和按照内容属性分类等。实现稿件资源的管理和导航。支持稿件属性管理功能,凡进入全媒体资源库的稿件,应能够自动标引、分 类。一是按内容实现自动分类,如国际、国内(又分钢铁等);二是按照稿件自身的特性分类,将稿件分为文字稿,图片稿,图表稿,音频稿,视频稿,多媒体稿;三是按照稿件语种特性分类;四是按照稿件来源分类,如特约稿、社内记者、社外记者、素材稿、需求线 索、互联网资源等;五是按稿件重要程度分类,如,加急稿、特急稿、突发事件稿等。2.2.4 建稿、签稿中国冶金报社全媒体项目是依托统一的数据平台,实现一个时效性好、待编稿件按需分级共享、能方便完

18、成在编辑系统建稿、签稿功能的高可靠性全媒体资 源库。通过实现编辑之间待编稿件按需分级共享,并且能实现待编稿库和新闻采 编系统之间无缝集成,使用者能在权限范围内通过待编稿库浏览与检索到相应待 编稿件,同时又能轻松便捷地实现在新闻采编系统中完成建稿服务,达到报社资源集中存储、按需分级管理和个性化服务的目的。待编稿库与新闻采编系统之间的接口是实现与编辑系统互动关键软件模块, 是解决在编辑系统中实现建稿的技术手段。 根据本系统的设计原则,结合原有采 编系统的情况,要求采用组件形式进行设计。该功能具体要求如下:编辑记者在待编稿库可以选择单篇、多篇、多类型新闻数据在不同的内 容制作系统建稿;新闻采编系统需

19、和本项目实现统一认证, 使得编辑、记者在建稿时不需 要进行再次登陆认证;新闻采编系统需和本项目进行集成,相互提供项目所需的各种接口,保证稿件、数据在系统间安全、稳定、快速、规范的传输和共享;实现对全媒体资源库内的稿件的引用状态进行监控。 一篇稿件可以被多 个部门、多个编辑同时建稿,但要留有选用标记;即提供稿件存取记录 的全程痕迹显示。2.2.5 报道指挥报道指挥实现对头版头条与重大事件、重要活动、重点选题等专题稿件的策 划,实现新闻线索的汇集和筛选,各种信息的上下互通等。具体功能如下: 1.稿件专题策划实现对头版头条和重要稿件的总体策划与选题管理,实现专题的创建、维护 和更新。通过报道指挥,各

20、部门、各编辑和记者能即时了解总编室的总体要求和 采编工作部署,了解各部门、各编辑和记者的具体策划和安排。2.2.6 务管理实现各部门总体工作部署和策划安排, 发布相关指示指令,安排下达采访任 务。2.2.7 挥调度、突发事件提示、线索(策划)提示等功能;2.2.6 全文检索全媒体资源库的海量信息服务,必然需要系统具备全文检索功能,以便于编 辑、记者能够快速、准确的在全媒体资源库中查找到自己所需要的稿件和素材。因此,需基于现有全文检索系统(TRS Server)构建统一的全文检索服务。针对现有新闻采编系统,以及此项目管理数据、服务内容不同,我们总结其 共性,提出如下功能和技术需求:构建全文检索集

21、群,满足现有数据量全文检索性能要求, 并能够适应未 来数据增长的需求。支持新闻采编数据库(Notes)、SQL Server等数据源稿件的全文检索。支持 Text、HTML、XML、RTF、MS OFFICE 文档(Word/Execl/Powerpoint) 和PDF文件,可以自动建立索引。需要实现非结构化和结构化数据的统一管理和检索;支持Native XML 数据管理、实现XML的全息索引和检索;核心级支持Unicode(UTF8), 多语言数据的管理和检索;提供高效的数据和索引压缩,实现超低空间 膨胀。采用多线程设计,支持SMP体系结构,支持大量并发用户访问;自动分库(Partition

22、ing),充分利用多库并行检索技术;支持Query-CACHE技术(包括检索词/短语/表达式的一级/二级缓存技 术),从而支持更多的并发用户访问;提供全方位检索手段:包括外部特征与正文内容的各种逻辑组合检索、 位置检索、二次检索、渐进检索、历史检索、词根检索、大小写敏感检 索、概念检索、对检索结果按与检索表达式的相关性程度排序等。实现精确计算,报告准确的检索记录数。支持对检索结果的各种排序:基于文章内容与检索表达式的相关度计算 的相关性排序;基于一个或多个特征属性的字段排序。支持检索结果的分类统计和浏览;提供动态索引,能够实时提供检索服务。即数据增删改时快速同步更新 索引,无需重建整个索引也无

23、需局部重建索引。支持按词索引、按字索引和字词混合索引。即适应不同应用环境的需求。2.2.7 稿件出库应支持不同的采编系统,实现对全媒体资源库内的文字资源、图片资源、多媒体资源等多种格式资源的再编辑。并可以根据需要,生成符合报纸、网络、手 机、手持阅读器、户外大屏幕、电子阅报栏等不同媒体传播需要的文件格式。2.2.8 系统管理2.2.8.1 资源库管理中国冶金报社全媒体项目将构建待编稿库、成品库、素材库、报道指挥库, 因此,需要相应资源库管理功能:提供资源库统计功能,以便了解资源库的数据量;提供历史数据删除功能,如某类数据库某段时间前的数据;2.2.8.2绩效考核待编稿件的统计,具有着重要的功能

24、,它可以让系统管理人员了解系统资源 的使用情况,可以让编辑直观地看到稿件被浏览、关注、建稿以及采用的情况, 如一篇稿件被多少人建稿、采用过,也可以了解到每位编辑自己建了多少稿, 浏 览了多少稿件。具体功能要求如下:稿件量统计:按来源、部门、资源使用情况等组合统计;支持按大、月、 周,以及特定时间段的数据统计;支持统计数据导出;采用统计:对编辑的工作量统计,如投稿、建稿、签稿等数据的统计;统计分析结果以原始统计报表、图形显示等多种方式展示出来。2.2.8.3 系统监控实现对中国冶金报社全媒体平台的系统监控。主要功能包括:在线用户的监控对于当前在线用户的监控,可以查看到用户以什么身份登录在什么服务

25、 器上。服务运行状态的监控浏览当前系统所拥有的后端服务的运行状态、运行日志。 系统最新操作的监控浏览当前系统当前在线用户最近所做的操作。2.2.8.4 系统管理用户、权限管理:提供用户管理、权限管理功能;日志管理:提供日志管理功能,记录用户使用行为日志和系统运行日志。 配置管理:统一管理项目相关配置参数。2.2.8.5 个性化服务有权限的用户,可以通过设置检索条件定制自己关注的内容。并在待编稿中提供个人稿件管理功能,即包括草稿箱、待编稿(指个人提交的待编稿)等。2.3非功能性需求由于中国冶金报社全媒体项目是中国冶金报社业务应用服务平台,因此,该项目需要保证7*24小时不间断地对内提供服务,系统

26、稳定性达到99%以上。中国冶金报社全媒体项目系统总体设计结构合理。项目技术建设中定制开发的源代码归招标方所有,项目验收后必须移交招标方。2.3.1 软件要求(1) .中国冶金报社全媒体项目应用系统均采用 J2EE架构和MVC模式,实 现表现层和业务逻辑层的分离。(2) .应具备良好的开放性和扩展性,支持 Windows、Linux操作系统,支持 Weblogic、Webspher酢口 Tomcat等主流中间件,支持 Oracle和 SQL Server 等多种主流数据库。全文检索支持 SQL Server、Notes等。(3) .支持各种主流的浏览器,操作应充分考虑用户的操作习惯。(4) .中

27、国冶金报社全媒体项目所采用的应用软件产品必须是相关厂商目前 的最新的、经过稳定性测试的版本。本项目应用系统和软件维护期为1年。(5) .中国冶金报社全媒体项目内所有系统的检索功能,以及现有采编系统的全文检索功能均集中在中国冶金报社全媒体项目检索系统实现。(6) .如需要安装应用和系统软件,必须保证不影响现有应用系统的正常使 用。2.3.2 性能要求中国冶金报社全媒体项目各应用的主要性能指标要求如下:(1) .全媒体平台满足100人同时在线访问;(2) .在G级数据集合上达到亚秒级检索速度;(3) .数据索引更新时间平均小于 0.02s。己录(每条记录4Kb);(4) .全文检索数据库的索引空间

28、膨胀率0.5;(5) . 20万篇文章以内,相似性检索平均速度在 1s内;(6) .在10M网络带宽环境下,每小时可以采集 5万个网页;(7) .自动摘要速度平均为每秒10篇以上;(8) .基于内容自动分类的准确率达到 85%以上。2.3.3 培训要求项目需为中国冶金报社技术人员、平台使用人员提供专业的、分级的培训, 保证技术人员能够独立进行平台维护、 业务人员能够熟悉应用功能,避免由于不 熟悉系统而造成的工作效率低,工作延误等情况发生。2.3.4 系统安全要求项目中充分考虑系统的安全性。本项目应用软件的安全性主要通过系统逻辑 原型的合理准确设计、系统权限的严格分配、软件开发过程的质量控制等措施加 以保障。2.3.5 标准规范要求根据中国冶金报社全媒体信息化建设内容, 遵循并制定多个业务和管理的标 准规范。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论