(计算机应用技术专业论文)电子报纸格式与系统架构研究.pdf_第1页
(计算机应用技术专业论文)电子报纸格式与系统架构研究.pdf_第2页
(计算机应用技术专业论文)电子报纸格式与系统架构研究.pdf_第3页
(计算机应用技术专业论文)电子报纸格式与系统架构研究.pdf_第4页
(计算机应用技术专业论文)电子报纸格式与系统架构研究.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(计算机应用技术专业论文)电子报纸格式与系统架构研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ab s tra c tab s t r a c t t h e r i s e o f i n t e rn e t h a s c h a n g e d t h e s t r u c t u r e o f m a s s m e d i a . t h e i n d u s t ry o fn e w s p a p e r i s i n p r o f o u n d t r a n s f o r m a t i o n , a n d e - n e w s p a p e r h a s b e c o m e t h e n e wb r e a k t h r o u g h i n t h i s t r a n s f o r m a t i o n . i t i s n e c e s s a ry t o d e v e l o p a m u l t i - p l a t f o r mre a d i n g a d a p t i v e , i n t e r a c t i v e , p e r s o n al i z e d , m u l t i m e d i a i n t e g r a t i n g , a n d d i s s e m i n a t i n gr e a l - t i m e e - n e w s p a p e r s y s t e m , w h i c h i s t h e a i m o f t h i s p a p e r . o n t h e b a s i s o f t h e r e s e a r c h o n t h e e x i s t i n g e - n e w s p a p e r s s y s t e m p a tt e r n s ,f o r m a t s a n d m a n a g e m e n t m o d e l s , a c c o r d i n g t o t h e c h a r a c t e r s i n c o n t e n t s a n da d v e r ti s e m e n t s , t h i s p a p e r d i s c u s s e s t h e p r i n c i p l e a n d t h i n k i n g m e t h o d s t h a t t h ed e v e l o p m e n t o f e - n e w s p a p e r s h o u l d f o l l o w , a n d d e s i g n s t h e i n t e g r a t i v e a r c h i t e c t u r eo f e - n e w s p a p e r . t h e t a s k i s d i v i d e d i n t o t h r e e p a r t s : e d i t i n g s y s t e m - - d a t a b a s e ,n e t w o r k d i s tr i b u t i o n a n d t e r m i n a l p a r s e r , u s i n g c o n t a i n e r a s d o c u m e n t p h y s i c als t r u c t u re a n d t r e e a s d o c u m e n t l o g i c al s t r u c t u r e . x ml ( e x t e n s ib l e m a r k u pl a n g u a g e ) e n c a p s u l a t io n o f d a t a i s u s e d t o e n s u r e o p e n n e s s , c o m p a t i b i l i t y a n ds e c u r i ty . t h e a d v e rt i s e m e n t i s t h e l i f e l i n e o f n e w s p a p e r . a d y n a m i c a d v e rt i s i n ge n g in e i s p r o p o s e d w h i c h s e p a r a t e s a d v e r t i s e m e n t s a n d a r t i c l e s , b u t l i n k s a d v e rt i s i n gs t r a t e g i e s w it h a rt i c l e s a n d u s e r s . i n d i v i d u a t i o n a n d u s e r e x p e r i e n c e i s t h e k e rn e l o f d e s i g n , s o b r i n g o u ti n d i v i d u a t i o n - p u s h a n d i n t e r a c t i v e s t r a t e g y . f i n a l ly t h e e - n e w s p a p e r s y s t e m i sr e al i z e d o n p c a n d h a r il i n v 2 e - b o o k re a d e r . a c c o r d i n g t o t h e c o m p a r a t i v e t e s t o nd i ff e r e n t s y s t e m s , it v a l i d a t e s t h e f e a s i b i l it y , p r a c t i c a b i l i t y a n d t h e a d v a n t a g e o f t h i sb l u e p r i n t .k e y w o r d s : s c r e e n r e a d in g , e - n e w s p a p e r , a d v e r t i s i n g e n g i n e , x m l f o r m a t , t r e e s t r u c 加肥南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的规定,同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、扫描、 数字化或其它手段保存论文; 学校有权提供目 录检索以及提供本学位论文全文或者部分的阅览服务; 学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版; 在不以赢利为目的的前提下,学校可以适当复制论文的部分或全部内容用于学术活动。学 位 论 文 作 者 签 名 : * 油 我z o b年 歹 “ 7 日经指导教师同意,本学位论 友属于保密,在年解密后适用本授权书。指导教师签名:学位论文作者签名:解密时间:年月各密级的最长保密年限及书写格式规定如下:5 年 ( 最长5 年,可少于5 年)秘密加年 最长拍年,可少于1 0 年)机密*2 0 年 ( 最长2 0 年, 可少于2 0 年李南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中己经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、己公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学 位 论 文 作 者 签 名 : 、 洽 衣?0 0 年 夕 “ ! 日第一章 引言第一章 引言 世界传媒业的发展正处在一个深刻转型的变革之中,纸质媒体数字化是变革的主题之一。数字技术消洱了媒介的介质壁垒,使同一内容多介质实现成为可能,为复合利用内容资源提供了技术支持。纸质报纸电子化成为报业规模化发展过程中 竞争强度愈演愈烈、竞争成本持续加大背景下提升效率、降低成本的一条解困之途。第一节 报纸简史1 . 1 . 1概念 电子报纸依旧是报纸,因此,首先要了解报纸的概念.甘惜分主编的 新闻学大辞典对报纸定义是: “ 以刊登新闻和时事评论为主的定期连续向公众发行的散页出版物” 。这个定义包含四个部分:1 . 刊登内容:以新闻和时事评论为主; 2 . 发行方式:定期连续; 3 . 发行对象: 公众; 4 . 物质形式: 散页出 版物。d 报纸和书籍、期刊、广播、电视 ( 电影)一起构成了媒介用以传播信息。国际电 信联将媒体分为感觉媒体、表示媒体、显示媒体及传输媒体,不同的媒介在这五个方面有不同的表现 ( 见表1 . 1 ) w o 表 1 . 1 主要大众传播媒介所能承载的 信息形态表大众媒介感觉媒体显示媒体存储媒体传输媒体表示立某 体 ( 信息形态)文字照片竺幽图表音响音乐语音视频鳌幽多媒体报纸视觉报纸纸张实物传输jjjj广播听觉收音机录音带电波jjj电视视、 听电视录像电波jjjj电脑网络视 听觉电脑系统服务 器网络jjjjjjjjjj第一章 引言 由表1 . 1 也可以看出, 相对于电脑网络, 报纸的功能显得较为单一。 法国新闻学者贝尔纳. 瓦耶纳概括了关于报纸的职能:主要的报道职能,随之而来的 辩论职能 ( 即传播观点的职能) ,附带的娱乐职能。如果将报纸电子化,则网络具有韵功能,电子报纸都可以 拥有. 对于电 子报纸的概念,业界尚 未有定论. 一般来说,电 子报纸是多 媒体技术、网 络技术 和通 信技术的 产物。 有人 将之归 纳为: 伪 1 . 报纸电子化:即报纸的内容、形式、载体及存储方式电子化,把欲刊登的内 容输进计算机,形成电子信息,其内容可以 是文字、表格、图形图 像, 甚至是音视频、动画等多媒体信息。 2 . 出 版电 子化: 包括电子投稿、电 子排版、电 子编辑, 利用网络化传输和电子信息处理方式将信息编辑、排版制做成完整的电子报纸。 3 . 发行电子化: 利用计算机网络传送电子报纸, 速度快、 节省时间和经费。读者可在任一时刻和地点接收或阅读电子报纸。 4 . 阅读电 子化: 读者利用电子阅读装置进行报纸阅读、摘录、 存储、 检索,可选择报纸、栏目 和文章,查阅背景材料,还可以参加读者评论和讨论.1 . 1 . 2发展简史 现代报纸的起源是德国巧世纪开始出现的印 刷新闻纸 ( 单张单条的新闻传单) 。 一般把1 6 1 5 年创刊的 法兰克福新闻 视为 第一张“ 真正的” 现代报纸, 因为该报有固定 名称、 每周定期出 版一次、 每张纸上印 有数条而不是单条新闻。 “ 但是世界上发行最早、历时最久的报纸实际上是中国西汉时期的 邸报 。 邸报约出现在公元前二世纪,当时西汉各郡 ( 相当于现在的省级编制) 在首都长安都设有办事机构,这个办事处称为“ 邸” . “ 邸”内 派驻有办事员, 负责将皇帝和各行政部门发布的信息收集起来,写在竹简或绢帛上,通过异站传送给各郡的太守参阅。而这一写有信息的竹帛就称之为 邸报 。伴随着古代中央王权的不断加强, 邸报也得以很好的发展,自 汉、唐、宋、 元、明 直到清代, 邸报的名称虽屡有改变, 发行却一直没有中断过,其性质和内容也没有多 大 变 动 。 15 1 “ 报纸” 的 英文一词( n e w s p a p e r ) 最早出 现于1 6 6 5 年英国 第一家报纸 牛津公报上。1 6 5 0 年在德国莱比锡出现最早的日 报 新到新闻 ,但是日报成为报第三章 系统架构与关键问题第三章 系统架构与关键问题 电 子报纸系统是一种具有独立结构体系的 系统。同其他系统一样,它也是由相互联系、相互依赖、相互制约、相互作用的事物和过程组成的具有整体功能和综合行为的统一体。设计电子报纸系统时,必须从整个系统的全局出发,在综合考虑系统中 各个因素之间的相互影响、 相互作用的前提下来分析和处理问题。 从系统论的角度,本章首先分析电子报纸系统的两大基本要素:程序、数据,并分析了其特征与需求:并在此基础上,提出了系统的总体框架:物理架构与逻辑架构;为了任务并发完成, 对总体任务 进行了分解. 最后,对电 子报纸设计过程中的几个关键问题作了论述,如果系统设计中不能很好地解决这些问题,则系统必以失败而告终。第一节 系统元素3 . 1 . 1程序与数据 由于本设计是基于现有的屏幕阅读装置,不涉及到硬件的开发,所要处理的对象主要是程序与数据.因此,在电子报纸系统中,我们将硬件环节作为系统的环境载体,而将程序与数据作为系统的元素。程序与数据处于同等重要的地位。 认识程序与数据, 不能 仅从程序与数据本身去认识, 而是应该将其放到整个信息的范畴中去理解认识。程序与数据是信息范畴的一部分,用以表现信息。要真正的认识把握程序与数据,只有首先对信息有整体的认识把握。 信息作为人类生活的基本要素之一,已 渗透到社会生活的各个领域。程序及数据作为信息域的两个组成, 数据是信息的 承载形式, 信息产生于数据,只有经过解释,数据才有意义,才成为信息。 而程序正是将数据解释为信息,或将信息存储为数据的中间环节。 对程序和数据可以 从开放性、兼容性、安全性、 沉淀性、 表达力、效率、可靠 这些方 面进行评价. 程序和数据的 关系如图3 . 1 所 示. cu 7第三章 系统架构与关键问 题图3 . 1程序与数据的关系3 . 1 . 2电子报纸特征 电子报纸不仅具备传统报纸的内容特征,而且由于运营平台及传输阅读的介质发生了变化,也具备了一些网络与电子的特性.电子报纸特征如下: . 时效性 报纸本身就具有时效性, 人们一般不会对过期的新闻感兴趣。 传统报纸的时效一般以天为单位更新,但是电子报纸将大大缩短这个更新时间,甚至可以实时地推送新闻。 . 检索、链接 阅读报纸的时候,可以对感兴趣的内容进行深度阅读,通过一些检索与链接的操作,电子报纸可以 实现这个功能,这也是网络与电子特性的 表现之一。 . 互动性 电子化、网络化使得以读者为中心,实现与读者的双向交流成为可能。报社可以 通过网络自 动收集读者资料,建立起读者数据库,根据读者的阅读偏好,有针对性地推送新闻内容与广告;另一方面读者能通过交互媒介来进行深度的阅读或定制个性化的新闻等。 . 可组合性 读者可以很方便地将不同的新闻或者不同天的文章进行整合,甚至可以做自己的 报纸,内 容的整合使得电 子报纸相对于传统纸质报纸的 优势更加明 显。 . 个性化 前面讲过,读者可以定制自己 想要的内容,而报社通过对用户的调查,可第三章 系统架构与关键问 题第三节 关键问题 在电 子报纸的设计过程中,会涉及到几个关键性的问题:格式、广告、传播、阅读终端与运营平台。如果有一个问 题不能 得到很好的解决,则该设计必以失败而告终。3 . 3 . 1格式 格式问题是影响电子报纸的首要问题。怎么设计格式,使其适合电子报纸的传播与表现,是目 前业界共同探讨的问题。电子报纸格式问 题如下: 1 .目的不同决定了格式设计的不同 由 于使用目 的不同, 格式的设计目 标、 思想、 框架以 及具体设计必定不同。例如:有些文档只用于阅读,不会或很少进行再次编辑;而有的文档则主要用于编辑。可以说,这是造成目 前格式多元化现状的原因之一 根据电子报纸的目 标要求,格式显然不用支持编辑的功能,因此,一些为了编辑而设计的格式例如w o r d 显然就不在考虑范围了。另外考虑到个性化与实时性的要求,如果格式文档由那种很庞大的单个文件组成,则也不能实现这种目 标。因为实时性要求新的内容出现就马上推送出去,要是每次封装的文件太大,不仅传输时间太长,而且已 经下载过的内容再重新下效率就显得极为低下。 2 . 格式多元化不利用数据交换 出于利益纷争与设计目 的不同,各开发商纷纷出台自己的格式, 使得目 前的电子报纸格式出现多元化发展趋势。例如方正系列电 子报纸就采用了网页、p d f 及f l a s h 等格式技术,而微软利用了以x m l 为 基础的x a m l 的 格式技术。 这样就造成大量的数据无法交换,数据只能与某种格式绑定,限制了数据的流通。 3 , 选择现有格式标准还是另起炉灶 这个问题正好对应了上面两个格式的问题,如果从设计目的来看,最佳的格式应该是最适合电子报纸设计目标与特点的格式,这种格式必须是定制的;但是从兼容性与可扩展性来看,选择目 前流行的 标准格式更加利用电子报纸的推广。 我们采用了 后者, 即利用现有格式x m l . 通过定制自 己的x m l 元数据, 同时刨除x m l 中冗余部分,以实现设计目 标与通用数据交换的统一。第三章 系统架构与关键问题3 . 3 . 2广告 广告是报纸的生命线。多年来,广告一直属于大众传播的范畴,广告费是传媒赖以生存的重要的经济来源之一,其最主要的特点是伴随着媒体的传播内容来传播商业信息,是一种强制性的,也是静态的 传播。 但是,随着传统媒体的转型, 特别是电 子报纸在屏幕阅读设备上的实现,广告界开始探索新的与受众的沟通方式。 从媒体的角度来看,报社希望电子广告继续其纸版辉煌的历史, 获得高额的广告费用: 而广告商的投入不是无限的, 太多的广告也会导致阅读者的厌烦。如何设计广告系统以平衡各种需求与矛盾,并在电子报纸这个载体中发挥更大的效用取得最大的收益,需要用系统的、全局的思想来综合考虑。3 . 3 . 3传播 网络技术的发展给新闻传播带来了翻天覆地的变化,传播模式在其演进过程中,由单向 直线性到双向循环性发展。读者来信的时 代早已过去,以 往使得传统媒体头痛的 互动问 题, 很轻松地即可解决。 同一条新闻 信息通过编辑后发布在传统报纸,向报刊读者传播; 通过互联网制作成网络新闻,向普通网民传播;通过手机制作成手机报,向移动用户传播;通过电 子纸阅读器制作电子纸报纸等。也就是说同一条信息可以通过多种途径向不同的受众传播。这是电子报纸传播的不同途径。 电子报纸可以 利用互联网、g p r s , c d ma等传播渠道。利用这些新技术、新型终端必将给传统的纸介质报纸带来一种新的形态。而如何设计一套系统满足上述传播需求, 将是电子报纸系统设计中不得不面对的问题.3 . 3 . 4阅读终端 阅读终端的问 题一直是实现电子报纸的瓶颈。这个问题本质上是屏幕阅读与纸版阅读的不一致。很难找到一种电子终端,既能符合传统的用户阅读习惯,还能 够物美价廉.电子纸技术能够满足纸质阅 读感受,但是目 前电 子纸的价格远远超过了普通读者所能承受的心理价位。 但是, 报纸的 主题是内 容, 报业的发展也不能一味地追求类纸的阅读感受,第四章 电子报纸格式第四章 电 子报纸格式 格式问 题是影响电 子报纸的首要问 题。怎么设计格式, 使其适合电子报纸的传播表现,是目 前业界共同探讨的问题。本章分析了电子报纸格式功能与信息需求,通过对现存格式对比评测,选择出合适格式,并设计对应的格式方案。第一节 格式需求分析需求决定了格式设计思想以及设计框架的不同,电子报纸在格式方面具有哪些需求?下面就从功能与信息两个方面阐述。4 . 1 . 1功能域需求 在前面谈到,电子报纸不仅具备传统报纸的内容特征,而且由于传输与阅读的介质发生了变化,也具备了一些网络与电子特性。电子报纸主要特征有:时效性、检索与链接、互动性、可组合型以及个性化等等。上述特点在另一方面也构成了对电子报纸系统格式设计的需求,表4 . 1 为电子报纸格式需求。 表4 . 1电 子报纸格式与系统需求列表需求说明备注保持版面保持经编辑排版之后的版面版面模版化:通过模版适配自 动排成适合阅读的 版面。数据兼容性考虑:支持文字、表格、图形、图像、音视频、其他元数据可为特殊数据( 例如图像)检索考虑 :支持目 录、关键字、摘要等元数据视觉考虑 :数据多属性全息显示 :支持附 加字库安全封装 :支持数据加密、 压缩、 校验检索与链接元数据检索全文检索内部链接、外部链接智能下载: 用户只下载所需道或文章, 对于连载的文章, 可以自 动合并其他用户互动动态广告新闻动态更新第四章 电子报纸格式4 . 2 . 1现存格式对比分析 到目 前为止,电子报纸或者电子书籍的领域内还没有一个统一的格式标准,各个公司推出的产品都在按照自己 开发的标准生产: a d o b e的 p d f格式,mi c r o s o ft的x a m l格式, 还有其他如 wo l , d o c , t x t , h t ml , c e b , x e b ,x l s , p n g等诸多格式:此外, 还有一些以 可执行程序的形式存在的电子报纸,不需要专门的阅读软件支持。 由于格式标准不统一,又加之大部分文档格式的规范是不公开的,这就造成大量数据交换的障碍。交换性问题是格式标准的 主要问 题,毕竟数据必须与某种特定的格式绑定是不合理的。 目 前常用格式多达几十种,虽然它们各有所长,都在特定范围内占据一定市场份额,但缺乏兼容性和易用性,以及自 身的局限性都阻碍了网络出版业的发展。 随着技术的成熟和竞争的深入, x m l 和p d f 这两类格式凭借自 身的优势脱 颖而出 , 成为目 前出 版的 主 流格式。 表4 .2 所示为目 前 常用的 格式对比 分析。 ( l7 表4 . 2常用格式 对比 分析格式 开发商阅读软件功能特性局限性普及程度应用前景pdfad o b ead o b eac rob a tre a d e r可移植文档,能真实反映原文档的格式、字体、版式和图片,能在多种平台上阅读, 支持不断追加的修改能力,具有内嵌字库只适合浏览静态电子图书, 不能保护结构数据高国际上认可的电子文档格式】 . 5 ( ad o b ep o s t s c r i p t是一种描述并处理文字和图 形的页面描述语言, 能够对由文本图形和图像产生的任意组合类型进行描述, 独立于设备和操作系统平台, 可保持期刊原样与保护版权, 打印显示效果好包含图形、图像的情况下, 文件会很大高国外流行国内较少用oeb美国出版商会多款阅读器处理简单文本以及某些特定图像, 可以在不同电 子图书阅读器之间交换电子图书高质图像处理能力差, 无内嵌安全保护功能高已成为美国出版物标准格式且tml i en e t s c a p e性能较好, 编写容易、 制作简单、 阅读软件容易得到, 用户界面交互功能强-用简单的文本实现超文本和超媒体可变换页面色彩, 增加图 案、 动画、 声音等对图像、数学公式、分子结构等无能为力高面 向 we t出版 的标准语言第四章 电子报纸格式( 续表)格式开发商阅读软件功能特性局限性普及程度应用前景cem微软mi c r o s o re a d e r文件体积小, 支持 h t m l , j a v a ,ls c r ip t , v i s u a l b a s ic s c r ip t in g 和多 种图像格式0 5 要求高高有广泛适用性lf微软m i c r o s o ft r e a d e r阅读风格接近纸质书, 支持全屏阅读,支持图片浏览对中文支持不好低适用范围不广ce b北大方正方正a p a b ire a d e r文档转换采用 “ 高保真” 技术,数据量小,最大限 度保持原来的样式阅读界面不很友好高国家电子公文传递的标准格式x l : b北大方正xe br e a d e r为在移动终端上应用而推出的电子书格式,以o e b为基础,以x ml为核心技术高与 国际标准接轨x州压w3 c组织 正n e t s c a p e面向】 n t e m e t 应用的标记语言,x ml具有强大的数据表现能力,能够以简单的形式表达复杂的数据,可扩展性强,可以根据用户的需要进行扩展,尤为重要的是, x m l 具有强大的自 描述能力,同时实现了 数据与表现形式的分离数据冗余较大高国际数据交换标准 电子报纸设计目 标决定了电子报纸格式必须是开放性的,而且应当是可交换的,而x m l正是符合这些特征的格式之一,这也是我们选择x m l 作为电子报纸格式的 原因 之一, 另一个主要的原因 是目 前很多 报社的 数据都是以x m l 形式存储的 ,为了简化开发难度, 本设计就以x m l为基本格式. 在4 .2 .3 中将专门介绍x m l的知识。4 . 2 . 2格式封装对比分析 探讨这个问 题主要是考虑到电 子报纸的传输与存储。 如果将格式从文件的封装与组 织形态方面进行划分, 可将格式划分为 下面三种类型。 n b i 1 . 单文档 目 前大部分文档格式采用这种组织方式,一个文档中分多页。这种文档有些页是固定版面的,以页为单位进行解析,有明显的分页标记,且无论阅读器的页面大小如何改变,文档版面始终不变,称这种格式为固定版面格式,p d f第四章 电子报纸格式就是这一类型的典型代表; 另一种文档页的内 容是随阅 读器显示屏幕的大小变化而变化的, 一页中的内 容是不定的, 则称这类格式为流式版面格式, d o c 格式就属于这一类。 现存的电子报纸支持离线阅读的一般都属于单文档格式,例如哥伦比亚大学报的下载版, 所有的内 容都封装在一个p d f 文件里, 方正系列中e x e 类型的下载文件也属于这种类型。 2 . 多文档 这些文档一般一页便是一 个单独的文档, 但在逻辑上这些文档属于同 一个文件,通过特定的浏览器阅读这些文档的时候,阅读感受和一个文件相同。大部分图 像格式, 如b m p j p g .ip e g 等都属此 类。 很显 然, 它们的 版面不 会流式的变化,只能进行缩放, ,它们属于固定版面格式。 电子报纸文件一般不采用这种方式封装, 方正系列中p d f 格式的下载文件,虽然每个文件只对应了一页,但是它们在逻辑上并不是同一个文件,所以也不是多文档类型。 3 . 容器格式 这类格式顾名思义是将多个文件归总以某种方式放在一个容器中,而这多个文件描述的是一个文档的不同部分。容器式又可分为两类:文件夹方式和压缩方式. h t m l格式是典型的文件夹形式, 一般的f f i e 文档除了网页文件外还有一个包含网页中使用图像的文件夹:普通的压缩文件夹都属于压缩方式。 格式封装的讨论主要是针对于电子报纸的网络传播策略考虑的。如果传输网络状况不好,则以单文档方式或者以压缩包形式存储的较大的文件传输时就容易出问 题,但如果将文件打成碎片传输,出错的时候只重传该碎片,这样就大大提高了效率,反之,如果网络带宽较宽并且很稳定,则将文件打包传输会节省时间。 由于电 子报纸的下载终端不仅有p c ,还有通过无线传输的手持阅读设备,其网 络状况多样,因此我们对电子报纸格式的封装采用了一个折中的方式。细节可见下第三节。4 . 2 . 3 x m l 格式分析最终我们选择了x m l 作为电 子报纸的 基本格式。 除了因为多数报社在使用第四章 电子报纸格式这种格式存储数据, 实现时可以 无缝对接, 另一个原因是由x m l 所具备的一些特点 决 定的, 下面就 简 要 介绍。 18 1 可 扩展 标 记语 言x m l ( e x te n s i b le m a r k u p l a n g u a g e ) 是 一 个 面向i n t e rn e t 应 用的标记语言,由w3 c 组织于1 9 9 8 年2 月制定。 x m l 实际 上是一种定义语言,即使用者可以 定义无穷无尽的 标记来描述文件中的 任何数据元素, 使得文件的内容更丰富并组成一个完整的体系。 x m l 适于异构应用间的 数据共享, 可以 进行数据检索和提供多语 种支持等优点; 作为数据表示的 一个开放标准, x m l 使得在异构环境下不同 计算机系统之间交换数据变得容易; 它还具有强大的数据表现能力, 可扩展性强,可以 根据用户的需要进行扩展; x m l 实 现了数据与表现形式的 分离, 这个特点决定了x m l能 够作为数据交换中的 媒介, 从而实现异构系统的 信息交换。 x ml 拥有明确的 模式描述信息。 比较常用的 x ml模式描述方案包括文档类型定义 d t d ( d o c u m e n t t y p e d e fi n i t i o n ) 和 x m l s c h e m a等。 如果说) c m l的核心是数据,d t d / s c h e m e 是数据的形式与规范,那么x s l描述的就是数据的表现形式。通过这三类技术可以有效地将数据、形式与表达三者分层,分别处理,互不干扰,加强了之间的透明度和灵活性。 x m l也不是十全十美的,它最大的缺陷就是数据的冗余量很大,一般能达到数据的三倍。 但是, x m l的 冗余产生多在于其用于显示的 样式单中,如果简化这方面的功能, 只是根据需要来订制专门的标签与显示模版,则会大大降低这种冗余量,当然了,简化的 文档仍然是标准的x m l 文档格式.c io 第三节 格式设计电子报纸格式设计除了文档原数据与正文的定义之外,还包括文档的物理与逻辑结构设计。4 . 3 . 1 “ 容器式”文档物理架构 系统的物理结构包括了各种的物理器件、程序、数据等等一切可见的东西,以及它们的物理配置,拓扑结构等等。它是系统设计分析的基础,是逻辑抽象的依据。第四章 电子报纸格式 为了便于排版以 及网络传输,本电 子报纸采用容器式方式存储信息,容器内 可以 容纳多个文件,这些文件本身是一个完整的格式文件, 可以单独浏览、单独下载,而多个文件的组合又构成一份完整的报纸,用户体验就像对一个文件操作一样。 容器的最上层包括一周报纸总索引、七天内的报纸索引、广告索引以 及一些用户交互的日志文件:下一层次则是七天内报纸的文件夹,内 含当天的新闻文章及新闻图片,文章与图片也是独立的,广告图片存放于专门的广告图片文件夹中.图4 . 4 所示即为电子报纸的物理构成简图: 厂 一 ,一 , 一 - - - - .- - - - .- - 一 蓉mj j g 一一 ” 一 ,- - .- - 一一 飞厅 7r画 lj viz c e 31 31 c#r +卿 笆 茗 片 广篡 1篡 -篡 -叹 罗屯 篡 犷 罗巫 闽 新 闻 图 片登陆记载阅 读记 录广告 索引广告 关注其他记录图4 . 4电子报纸文档物理架构 利用容器式存放文件的 好处是,当网络状况不好的时候,由于容器内 存放每个文件都不大,每次只传送一个小文件,出错后也只重传这个小文件,这样可以 提高效率;当用户点击查看某篇文章时,可以优先下载该文章对应文件;当新闻更新的时候,只下载需更新的文件而不用全部重传。另外,新闻文章、新闻图片、广告、广告图片等单独存储,使得结构清晰灵活,易于修改。第四章 电子报纸格式4 . 3 . 2 “ 树状”文档逻辑结构 “ 逻辑” 与 “ 物理” 是相对应的,如果说“ 物理 ” 是指实实在在的,可以看得到、摸得着的, 那么“ 逻辑” 就是指非物理的,非实体的东西,它是一种抽象的东西,比 如讲一 种“ 关系 ” 、 一个“ 空间、 范围 ” 等。 逻辑结构是用图形的 描述方式体现系统运行逻辑关系或系统组成部分间逻辑关系的 模型。它是系统组成部分的逻辑关系的抽象.其主要特点是明 显的显示系统各部分之间联系,既可用于定性分析又可进行定量计算或指示系统运行程序。 可以看到,在电子报纸文档的 物理结构中,容器内包含了多个文件及文件夹,解析器怎么将这么多的文件组织起来以构成一个完整的报纸结构呢? 解决的办法是通过索引文件一级级的引用,将全部文件串联起来,所有的引用在逻辑上构成了一个树形的结构。如图4 . 5 示。级联七天前报纸索引以己j一一一朴/卜单中尸-黑 昨天报孕纸索引当天报纸一一1 一索引广 告索引级联生目-生目广-广国际新闻体育新闻 - 奋 沪 产i体 育 新 闻目于一 ! - -. 略 -电子报纸文档 “ 树状斤逻辑结构 在树状结构中,树的 “ 根” 是一周报纸的总索引,这个索引文件包含了当前七天内的报纸索引文件以及当前广告索引文件的链接,通过它依次找到下一层的索引文件。第四章 电子报纸格式 树的第二层是七天内 每天报纸内容的索引文件以 及广告索引文件,通过它可以链到树的第三层以 及最下层的各个节点,树的第三层 ( 新闻频道或广告分类)只是一个逻辑上的 层次, 本身不存在对应的文件,它对下一层的链接实际上是通过上层文件来实现的. 容器内的每个文件对应于一篇完整的文章,换句话说, 本格式是以文章为最小单位的。 所有的文件 ( 包括i n d e x 文件、 a r t i c l e 文件) , 其格式都是相同的,所不同的是i n d e x 文件是经服务器端自 动生成。文件之间的级联是通过i n d e x 文件定义的。 这种树状逻辑结构的文件形态,使得结构比较清晰,易于遍历树的各个节点,对报纸的更新实际是只是对树的某些节点进行更新,其他没变的节点就不用重新下载,这样就大大降低了由于新闻实时更新带来的问题。需要注意的是,当树的某一节点发生改变时,其对应的上层的索引文件应当重新生成,以重新定义新的链接关系。4 . 3 . 3元数据与正文定义 前面的两个小节相当于建立了电子报纸格式系统的骨架,本节的功能就是要往里填充内容,好让系统完善起来。 本电子报纸格式采用x m l , x ml的一个特点就是在其格式范围之内, 可以订制自己的原数据。按照文档的物理架构与逻辑架构,最上层的文档是七天内报纸总的索引文件,该文件由 于仅仅提供了七日内报纸与当日 广告的链接,所以结构简单,原数据也很少,这里就不再详述,下面重点叙述每天报纸的索引文件定义以及对应当天新闻 文章的格式定义,我们将之称为一级版面与二级版面由于实验数据的获取问题,目 前我们采用了西雅图邮报作为数据来源,因此,许多元数据的表达沿用了 西雅图邮 报, 并在此基础上改制而成. 如图4 .6 所示为一级版面与二级版面的结构图。第五章 动态广告引擎第五章 动态广告引擎 “ 酒香不怕巷子深”的年代早己经一去不复返,广告成为企业宣传产品亲近消费者的强势渠道。多年来, 广告一直属于大众传播的范畴,其最主要的特点是伴随着媒体的传播内 容来传播商业信息,是一种强制性的,也是静态的传播。 随 着电 子报纸应用与推广, 传统模式的 广告已 经不能满足其多样化的需求. 在电子报纸的设计中,如何将电子广告与电子报纸有机地结合,使之充分发挥各自 的 优势、 互为补充? 本文提出一种动 态电 子广告引擎的 系统设计方法,该广告引擎具有自己的格式定义、独立的显示更新及交互策略。因此,该系统是一 个独立的系统。 但是,引 擎又通过一定的 关联策略与内 容和用户相关联.第一节 广告分类 广告的分类主要应用于后面章节中的广告策略。提起广告这个词,也许你心里马上涌上诸如 “ 娃哈哈” 等之类的东西那么,究竟什么叫 广告呢? “ 广告” 一词来源于拉丁语( a d v e rt i s e ) , 本义为“ 诱导” 、 “ 注意” 和广而告之的意思。目 前最通用的广告定义是美国营销协会作出的: “ 广告是有可确认的广告主, 对其观念、 商品或服务所作之任何方式付款的非人员性的陈述与推广气 由于看待问题的角度各异,分类的标准不同,导致广告的种类很多,而广告的分类将涉及到广告的策略问 题。 下面就给出 几种分类方法:(a 1 . 广告的常见分类 最常见、最简单的分类标准,就是以 传播媒介为标准对广告进行分类,主要分为:报纸广告、杂志广告、电 视广告、电 影广告、幻灯片广告、包装广告、广播广告、 海报广告、招贴广告、 p o p广告、交通广告、直邮广告等; 如果以广告传播范围为标准,可以分为国际性广告、全国性广告、地方性广告、区域性广告、区域性广告;以广告传播对象为标准,可以将广告分为消费者广告和商业广告。以 广告主为标准,基本上可以将广告分为一般广告和零售广告。 2 . 针对电子报纸的线性分类 1 ) 房 地 产: 商 铺 租 售 写 字 楼 租 售 厂 房 仓 库 住 宅 租 售 2 ) 家居: 装饰材料 建材装饰 厨卫用品 家用工具 酒店用品 家具第五章 动态广告引擎 3 ) 工业: 工 业 衣 车食品 设 备环 保 产品空调 冷 冻仪 表仪 器机械 加工 4 ) 教育: 驾 驶培 训外语 培 训 电 脑 培 训招生 培 训 留 学 招 生 5 ) 劳动 服务 : 礼 仪 服 务 家 政家 教 清 洁 公司 园 林绿 化 运 输 票务 搬 屋 6 ) 电 器: 电 工器材 防盗 器材 影像设 备 家电 维 修 电 器 灯饰 电 脑 环保 乃交 通工 具: 轿 车 类 客车 类 货车 类 摩 托 车 汽 配 租 、 售车 8 ) 五金化工: 化工 机械 胶粘制品 塑料机械 金属 钢材 五 金 化工 塑 料 9 ) 鞋帽服装: 服装布料 纺织品 鞋业 皮革 1 0 )印刷:印 刷机械 刻字招牌 包装材料 1 1 ) 交友: 交朋友 寻人启事 征婚 1 2 ) 求职招聘: 招聘广告 人事顾问 求职广告 1 3 ) 文娱: 健身 器材 礼品 精品 收藏品 乐器 玩具文具 鲜花 1 4 ) 商业服务: 冲印美容美发 婚纫摄 影 酒楼餐 厅 化妆品 眼 镜 首饰 1 5 ) 通讯: 手# u s i m卡 交换枷配件 i mp 卡 通讯设 备 1 6 ) 综合: 二手转让 营业 求 购 拍 卖 展览 1 刀 电 脑、 办 公: 计算机 电 脑外设 电 脑配件 耗 材 软件 打印 湘描 砖真 1 8 ) 信息: 农业信息 咨 询服务 专 利转让 律师服务合作 招包 1 9 ) 其他. 本分类方法主要是针对电子广告与新闻文章的关联,如果新闻文章亦据此分类,则出现该新闻时显示对应分类的广告,会让广告效果更好。 3 . 电子广告的多级分类 目 前我们的做法是广告二级分类,将广告首先按照新闻的频道粗略分类,再将属于同一种产品的广告归为一个子类,如图5 . 1 所示:图5 . 1广告的二级分类第五章 动态广告引擎 广告的线性分类与多级分类对应的广告格式元数据定义不完全相同,多级分类时元数据也要定义相应层次。选用不同的分类标准时, 广告显示、更新策略、关联策略等都将发生变化。第二节 广告引擎模型 广告设计在电子报纸系统设计中是一个博弈的过程,从报社角度希望通过大量刊登广告来获取利益,而广告商的投入不是无限的, 太多的 广告也会导致读者的厌烦.如何设计广告以 平衡各种需求与矛盾,并使广告与内容结合发挥最大的效用,需要用系统的、全局的思想来综合考虑.这里引 入了 工程中常用的模型的思想,将电子广告作为一个系统进行建模,称之为“ 广告引擎,o5 . 2 . 1电子广告环境与约束 系统设计时,不仅要知道对象本身包含的各种要素,而且需要知道其所处环境及约束条件。下面就先分析构成广告引擎的各种环境要素。 电子广告本质上跟传统的 广告并没有什么不同, 但其自 身内 容、发布方式和传播宣传载体有了很大差别。它不仅有自己的元素, 还要处于一定的环境中,受到自 身条件与环境的约束。这些环境可以 包含人文环境与载体环境。人文环境包括广告的受众:读者;包括广告的受益者:报社与系统商。载体环境包括内容载体:电子报纸、电子书籍、电子杂志、博客等;还包括硬件载体,例如p c机、电子书,手机,p d a等等。广告引擎系统及环境约束如图5 .2 所示。圃圃内容提供商严:碑认内容载休s !一一、系统生产蔺早1广告弓 擎/了1一系统实体一l,111七li.1:。:,1日手机一内灿竺才朴吟夔、一,浪涛法.冲一读 聋图5 . 2广告引擎系统及环境约束第五章 动态广告引擎 随着报纸数字化、网络化的转变,广告的内 容与形式也发生了 很大的变化,由以前的单一静态显示向动态、可交互、多媒体融合的方向发展。无论采用哪种形式, 都要适合屏幕阅读,能 够与用户进行交互, 这就要求广告格式与表现形式符合这些特点。 广告引擎的载体环境包括了内 容载体、硬件载体。一方面, 广告的特点决定了电 子广告需依附于一定内 容上,电 子报纸、电子书籍以 及杂志等可以 作为电子广告的内容载体;另一方面,无论是读物还是广告,都要有一定的物理承载, 作为内 容与广告的发布平台的阅读设备要适应阅读需要,将媒体内 容与广告以好的效果展示. 广告引擎最重要的环境是人文环境.人文环境由两个群体构成:一个群体是广告的 读者构成的受众群体;另一个群体是由 运营商 ( 报社等) 、 系统商所构成的广告提供者。他们之间构成了既相互联系又相互矛盾的关系: 运营商与系统商为了获得更多的利润,希望能大量加载广告,但太多的广告必将导致读者的厌烦以 至于拒绝订阅内容,此时商家就会减少在该媒体上的广告投入,媒体的广告收入会相应下降,这样就构成了一个博弈的关系。所以,媒体在推广内容的时候,必须考虑受众的接受。5 . 2 . 2模型提出 上节分析了电子广告的环境约束,为了更精确地量化系统,我们将构建一个结构化的动态电 子广告引 擎模型。 那么, 什么叫模型呢? 模型( m o d e l s ) 是人们为一定目 的对原型进行的一个抽象. 人们在研究一个系统的时候,为了一定的目 的 ( 例如便于实验和预测) ,总是先要设法把所要研究 系 统的 结 构形 态 或运 动 状 态 变 为易 于 考 察的 形式 即 模型。 圆 模型是对系统的一种简化、抽象和类比表示,建模的最终目的是按照系统的要求建立一个定量地反映系统与子系统静止与运动规律的模型,并通过这个模型来寻找适当的运动与控制规律。系统模型除去本身描述的对象之外,还包括 系 统 构 成 要素, 各要 素 之间 的 关 联以 及 系 统 所处 环 境与 约 束 条 件。 o 根据我们对电子广告引擎内容与环境约束的分析可知,广告引擎作为一个系统不是独立存在的,它要附着于一定的内 容载体与硬件载体上, 脱离这些载体广告就不会存在;广告策略的制定要受到外界反馈的影响。如果把这些外界第五章 动态广告引擎的反馈作为其中的一个要素,再加上广告系统本身的要素及策略, 就构成了一个完整的系统。 广告引擎是一种内容加策略的综合体,它不是封闭的,系统与外在环境进行交互,广告策略的制定受外界反馈信息的决定;广告引擎不仅要调节其经济收益的分配均衡,还要考虑内容本身对受众的影响,这种分配与均衡不是保持不变的,应根据用户需求与市场反馈动态调节。基于以上考虑我们构建了结构化动 态 广告 引 擎 模型 。 如图5 .3 所 示. 图5 . 3动态广告引 擎模型 该模型实际上是一个控制模型。对于控制系统,总可以看成由一些典型环节组合而成。 叫本模型的构成环节包括输入端、输出 端、 模型主体及反馈。 输入端对应了电 子广告的提供者系统商、运营商;输出端对应于广告的受众 读者:模型的 主体包括广告策略、 模型描述以 及执行装置; 这个主体要受到市场调查和读者反馈这两个反馈系数的影响,根据反馈系数动态调整广告的策略。 系统各部分功能是:广告提供者发出的广告信息与反馈系统的返回信息,经过 广告 策略的 处理 ( 校正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论