(教育技术学专业论文)页面标注系统的设计与实现.pdf_第1页
(教育技术学专业论文)页面标注系统的设计与实现.pdf_第2页
(教育技术学专业论文)页面标注系统的设计与实现.pdf_第3页
(教育技术学专业论文)页面标注系统的设计与实现.pdf_第4页
(教育技术学专业论文)页面标注系统的设计与实现.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(教育技术学专业论文)页面标注系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士荦位论文 m a s t e r sf h e s i s 摘要 随着计算机的普及和网络技术的快速发展,人们很容易得到信息,却不能有效 的处理和利用信息,仍停留在消极的浅层次阅读状态。远程教育中,学习者面对大 量信息时容易产生“网络迷航 现象,这与网页只能浏览不能直接处理有很大关系, 且与传统的“读写结合”的学习方式差异很大。对内容进行标注式学习可以有效的促 进记忆、理解、阐释和视觉化的快速搜索。本文研究开发出一套适合m 浏览器的 在线页面标注系统,对远程教育中的学习者、研究者等具有非常重要的意义。 在分析标注的相关理论及技术的基础上,针对网页的只读特性和读者阅读信息 要做标注的需求,本文主要做了以下几个方面的工作: 1 ) 设计了页面标注系统,包括体系结构、功能模块、流程图、数据库等。 2 ) 开发出用于创建标注的工具。工具能自动嵌入到浏览器;能获取在线网页 的选定文本及u r l 等信息;用户的标注信息保存到数据库,并可以动态显示。一 3 ) 开发出用于定位显示标注的工具。工具实现了将数据库信息准确定位显示 到网页。 4 ) 标注工具能自动提取用户信息。利用地址特征及在线信息确定标注服务的 用户,解决了标注服务的用户信息提取问题。 5 ) 实现标注信息处理,包括标注的投票、编辑、修改、删除等。 本文开发的标注系统实现了对在线网页标注的功能,如创建、修改、保存、删 除、查看、检索和共享。该系统能降低“网络迷航”的可能性,促进信息的吸收,利 于学习者创造性、批判性思维的发展,以形成新的远程教育的学习方式,最终使学 习者适应知识经济社会的发展。 关键词:页面标注;浏览器;文本获取;定位显示;检索 a b s t r a c t w i t ht h ed e v e l o p m e n to fc o m p u t e rs c i e n c ea n dn e t w o r kt e c h n o l o g y , p e o p l ec a l l e a s i l yo b t a i nt h ei n f o r m a t i o n , b u tc a l l te f f e c t i v e l yu s eo rp r o c e s si n f o r m a t i o n , a n d s t a yi nan e g a t i v es t a t eo ft h es h a l l o wr e a d i n g i nd i s t a n c ee d u c a t i o n ,l e a r n e r sa r ee a s i l y 1 0 s ti nt h ei n f o r m a t i o no c e a n i th a sag r e a tr e l a t i o n s h i pw i t ht h er e a d o n l ya t t r i b u t eo f w e b p a g e ,a n di ti sd i f f e r e n tf r o mt h et r a d i t i o n a l r e a d - w r i t eu n i o n l e a n i n gs t y l e s t u d y b ya n n o t a t i n gt h ed o c u m e n t sc a r le f f e c t i v e l yf a c i l i t a t es t u d e n t st or e m e m b e r , t ot h i n k , t o c l a r i f y , a n dt ov i s u a ls e a r c h t h i st h e s i si sa b o u tt h ed e s i g na n di m p l e m e n t a t i o no f o n l i n e - w e b p a g ea n n o t a t i o ns y s t e m ,w h i c hi sv e r yi m p o r t a n tf o rl e a r n e r sa n dr e s e a r c h e r s b a s e do nt h er e a d o n l ya t t r i b u t eo fw e b p a g ea n dt h ec o m m a n do fa n n o t a t i o nf r o m r e a d e r s ,a f t e ra n a l y z i n gr e l a t e dt h e o r i e sa n dt e c h n o l o g i e so f a n n o t a t i o n , t h ep a p e rm a i n l y c o m p l e t e ss u c hw o r k : 1 1t l l i sp a p e rd e s i g n saw e b p a g ea n n o t a t i o ns y s t e m , c o n t a i n i n ga r c h i t e c t u r ed e s i g n , f u n c t i o nm o d u l ed e s i g n ,f l o wc h a r td e s i g na n dd a t a b a s ed e s i g ne t e 1 1 1 i sp a p e rd e v e l o p sat o o lf o rc r e a t i n ga n n o t a t i o n i tc a nb ee m b e d d e di nt h e b r o w s e ra n dc a no b t a i nt h es e l e c t e dt e x ta n du r li n f o r m a t i o no nw e b p a g e a f t e ru s e r s a n n o t a t i o ni n f o r m a t i o ni ss a v e di nt h ed a t a b a s e ,a n n o t a t i o nw i l lb ev i e w e d 3 ) n l i sp a p e rd e v e l o p sat o o lf o rm e r g i n ga n n o t a t i o ni n t ow e b p a g e i tc a nm a k e a n n o t a t i o ni n f o r m a t i o nf r o mt h ed a t a b a s el o c a t e da n dm e r g e di n t ow e b p a g ea c c u r a t e l y 钔t h ea n n o t a t i o nt o o l sc a ng e tt h eu s e ri n f o r m a t i o na u t o m a t i c a l l y i ts o i r e st h e p r o b l e mb yc h e c k i n gt h ea d d r e s sa t t r i b u t ea n do n l i n ei n f o r m a t i o nt oc o n f m nt h e a n n o t a t i o nu s e ro f t h ec o m p u t e r 5 ) 1 1 l i 8p a p e rr e a l i z e sa n n o t a t i o np r o c e s s ,i n c l u d i n gv o t i n gf o ra n n o t a t i o n sa n d e d i t i n g , m o d i f y i n ga n dd e l e t i n ga n n o t a t i o n s n 圮p a p e rd e v e l o p st h ea n n o t a t i o ns y s t e m w h i c hr e a l i z e st h ef u n c t i o n so f w e b p a g e a n n o t a t i o n :t oc r e a t e ,t om o d i f y , t os a v e ,t od e l e t e , t or e a d ,t os e a r c h , a n dt os h a r e t h e s y s t e mc a nr e d u c et h ep o s s i b i l i t yo f b e i n gl o s t i nw e b ,a c e e l e r a t et h ea b s o r p t i o no f i n f o r m a t i o n , h e l pl e a r n e r sd e v e l o pc r e a t i v i t ya n dc r i t i c a lt h i n k i n g , a n df o r mn e wl e a r n i n g s t y l eo fd i s t a n c ee d u c a t i o n a tl a s ts t u d e n t sc a na d a p tt ot h ed e v e l o p m e n to fk n o w l e d g e e c o n o m ys o c i e t y k e yw o r d s :w e b p a g ea n n o t a t i o n ;b r o w s e r ;o b t a i n i n gt e x t ; l o c a t i n ga n dm e r g i n gt e x t ;s e a r c h 硕士学位论文 m a s t e rst h e s i $ 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作 所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 作者签名:苍新日期:劢口7 年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权 中国科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通 过网络向社会公众提供信息服务。 、 懒名:苍新名:谨、,蝌 日期:砧年f 月i f 日 日期: 每 月日 i 本人已经认真阅读“c a l i s 高校学位论文全文数据库发布章程”,同意将本人的 学位论文提交“c a l i s 高校学位论文全文数据库”中全文发布,并可按“章程”中的 规定享受相关权益。圃意迨塞量銮蜃澄厦;旦兰堡;旦= 生;旦三生筮查! 作者签名:巷新 日期:砷年月f 日 导师签名: 日期: _ 雩jo 扔 年 月 日 1 绪论 计算机的普及和网络技术的快速发展,加速了进入信息时代的进程,任何人在 任何时间、任何地点都可以通过网络发布任何信息【l 】,这些信息又可被网络的任何一 个终端客户阅读和分享。与传统的以印刷媒介为主要传播介质相比,网络技术传输 信息高效快捷方便,多媒体技术使信息声色形俱全,人们更乐于利用网络来学习交 流。 然而,面对网络信息的海洋,人们能否顺利的吸收和利用这些信息呢? 从网络 信息的记录载体来看,信息主要以网页的形式【2 l 记录和表示,通过浏览器调用处理 后显示出来,供网上用户查看。 目前,对在线网页进行标注的研究比较少、尚不成熟,以致多数浏览器并没有 提供对网页直接标注的功能,人们只能消极的阅读网页信息,无法及时的进行记忆、 理解和思考、无法做沉浸式的深度阅读,最终影响了信息的吸收和利用【3 1 ,降低了 学习效果。正如教育部吴启迪部长在 2 0 0 3 中国高等教育信息化论坛”上作的全面 推进教育信息化建设,实现中国教育新的跨越式发展的发言中提到:我们“不断 需要补充和更新已有的知识,而且要学习如何获取信息、如何加工、存储、提取、 使用信息,因此学习的方式必然也发生了变化,只有这样才能适应知识经济社会的 发展。州 因此,本文针对网页的只读特性和读者阅读信息要做标注的需求开发出了一套 页面标注系统。该系统实现对在线网页的标注功能,扩展了已有浏览器的能力,同 时这些标注信息被存到数据库中供其他用户检索共享,体现了依托网络信息共享的 特性。 1 1 研究背景 利用网络信息进行学习,是远程教育的一个重要分支,也是教育信息化的一个 重要方向。远程教育p 堤指对教师和学生在时空上相对分离、教与学的行为通过各 种多媒体技术、数据库技术、网络技术等现代信息技术手段进行,从而能使任何人 在任何时间、任何地点与任何需要的知识联系、交互和整合的教育的总称。 远程教育打破了时间和地域的限制,实现了教育资源的共享,是构建终身教育 和学习体系【6 】的主要手段。以往的学习主要是在学校里面进行,现在的学习就成了 社会化的,以往的学习以教师传授为主,现在的学习更多的是主动的获取,以往的 硕士擘位论文 m a s t e r s t h e $ i s 学习是学习的使命,现在是贯穿整个人生的内容,信息社会必然使学习走向社会化 和终身化【4 】。 远程教育由于信息传送方式和手段不同,在我国大致经历了三个阶段:第一是 函授教育阶段,以纸质媒介传输;第二是广播电视教育阶段,以广播电视、录音录 像为主;第三是通过计算机、多媒体与远程通讯技术相结合的网络远程教育阶段。 网络远程教育与前两个阶段的远程教育相比,更能体现随时随地进行实时和非实时 学习的特点。 网络远程教育中,学生的自主学习是一种很重要的学习方式。自主学习是指学 习者自己确定学习目标和任务,自己选择学习时间、学习材料、学习工具、学习环 境,自己控制学习过程,并对学习结果进行自我评价和反馈的一种学习方式和学习 状态 7 】。整个过程给学习者个人的能动性、创造性的发挥提供了很好的条件,需要 学习者较高的自律性、自觉性和计划性。这种自主学习方式是在网络环境中展开, 学习者获取信息的途径非常广阔,信息量很大,要处理的信息非常多,遇到的问题 也很多。如何保证学习者在整个学习过程完成后的学习效果呢? 有的教育研究者在 学习软件中引入监测和反馈机制,监测学生在该环境下的学习情况,针对学生提出 的问题给予及时的解答。有的教育软件系统开设了b b s 论坛、告知教师联系方式、 提供知识库链接等方式以解决自主学习过程中的各种求知问题。应用最多的解决求 知问题方式是学习者用关键词检索网络,直接查找问题的答案。 自主学习中,这种求知的过程,也是对信息筛选并不断处理的过程。信息处理 的质量高低深刻影响着网络环境下的学习效果。然而,信息的主要载体网页只能被 浏览不能直接处理,产生的后果之一即是“网络学习中的迷航”现象。网络学习中的 迷航指“在利用网络自主学习下,当学生面对大量出现的信息而产生的类似于在大 海中航行时迷失方向而不知所措的现象。”j 网络迷航的危害【8 】很多,归纳为以下几点:1 ) 消耗了学生有限的注意力资源。 2 1 对时间资源的消耗。3 ) 网络资源的浪费。4 ) 对人生理上的危害。要解决网络远程 教育中网络迷航的问题,即解决如何让学习者把注意力集中到重要的信息资源上。 这虽然关系到资源本身的呈现方式、组织工具的支持力度、学习者自身的主观因素 等众多问题,但如果能对网页信息进行直接处理,就能大大降低网页迷航的可能性。 除此之外,网页标注还有更多的功能。分析如下:首先,标注能促进信息的吸 收,促进学习者的记忆、理解和思考。当阅读单个网页时,如果不能对网页信息进 行及时的处理,如勾画重点、记录自己的理解和思考等操作,很多信息都只会进入 短时记忆区而迅速在几秒钟内消失。而要让信息进入长时记忆是需要重复和再加工 2 硕士学位论文 m a s t e r st h e s i s 的。如果没有标注提示,重复和再加工的速度和可能性都降低,这也导致了很多信 息根本没有机会吸收的问题。尽管可以采取复制到w o r d 等软件中进行记录处理, 或在b b s 论坛中提问,但都不能将原始材料和问题对应,失去了灵活性和方便性, 降低了学习的连续性,于是有些学习者只过目却懒于“动手思考”。第二,标注信息 的共享对学习者的学习是非常有价值的。对网页进行标注后,标注信息聚集到数据 库中,形成网页信息的元数据库,增强了原有网页信息的语义内涵。学习者可以根 据语义检索到相关标注网页。当浏览这些有标注的网页时,不同角度不同思路的学 习者知识上能互补,能促进学习者之间的交流与协作,有利于群体学习的开展。而 且,标注数据库中的信息由于是学习者经过思考提炼出来,因而有更高的价值。可 利用数据挖掘技术、统计学原理等对这些信息进行处理,从而淘汰部分信息,产生 新的信息。 总之,网页标注系统能降低“网络迷航”的可能性,促进信息的吸收,利于学习 者创造性、批判性思维的发展,以形成新的远程教育的学习方式,最终使学习者适 应知识经济社会的发展。 1 2w e b 页面标注及国内外研究现状 1 2 1 国外研究现状分析 标注是指被第三方对原文档创建和增加的数据,这些数据可以是笔记、符号、 图片、语音片断等 9 1 。这个概念指出标注是第三方对原文档增加的各种形式的数据。 类似的标注概念还有:标注也可以称为做笔记,包括能被感知的视觉化和声音化 信息的输入、处理和输出,这些信息用不同的格式记载。【l o 】 另有学者对“标注”做如下定义:对w e b 页面标注就是对浏览器中任意w e b 文档 或选定的文档内容添加包括提示、解释、重点、体会、疑问、解答和评价等外部备 注信息或标记。简单地说,也就是关于w e b 页面的在线网络笔记。4 1 1 1 该定义更利 于同化国内对标注的理解,与传统的纸上做标记统一起来。简而言之,标注即对原 文档中的文字做记号,添加自己的理解。网页标注,即对网页中的选定文本做标记, 并添加标注内容。 w e b 页面标注的研究在国外出现较早,种类和产品较多,但都有一定的缺陷和 不成熟的地方。国内对w e b 页面标注的研究出现较晚,积累不多。分析国内外标注 的研究历程和其现有产品的种类特点,对于开发更适合浏览器的标注系统非常必 要。目前,国外关于标注的研究主要体现如下。 3 硕士学位论文 m a s t e r st h e s i s 标注根据其被标注的文档不同,分为纸质形式的标注和数字形式的标注两种。 在纸质标注的研究方面,国外专家o v s i a n n i k o ve t a 1 对纸质标注的类型( 即标注的 形式和功能) 做了详细的调查一】,目的是弄清楚三个问题:如何标注文件的? 一旦 创建标注,标注如何被使用? 一个理想的标注软件应具备什么特征? 调查结果表 明:标记类型方面,对文本进行直接的符号标记如高亮、附加颜色等使用频率最高 排第一,旁白处加标记和记录想法等排第二。标记使用方面,即标记的功能i9 】主要 是用来记忆、思考、阐释和共享。根据使用者对标注过程中各种特征按重要程度排 序,依次是:用图形表示标记、对文档格式不敏感,搜索,在旁白处写,标注文本, 在字里行间写,在顶部写,笔输入【研 此调查客观真实的描述了用户标注文件时常使用的形式,也进一步证实了标注 技术的重要功能,即记忆、思考、阐述、共享。另外,该研究表示:在标注的描述方 面,任何标记都可以用内容、形式和功能来描述。纸质标注的这些研究成果,为后 来发展起来的数字形式的标注提供了强大的理论支持,为数字形式标注的建模提供 了符合学习者特征的数据。 数字形式的标注,也称电子标注,按照存储形式分两种【1 2 】:一是文本与标注数 据不分离的文档标注软件 9 l ,如p d f 、c a j v i e w e r 、w o r d ;二是文本与标注数据分开 存储的网页标注软件,如a n n o t a t o r l l3 1 、a n n o t e a 1 4 1 、i m a r k u p 1 5 1 等。前一种存储形 式完全模拟了纸质标注的特点,是标注和原文本一体的形式。他人要查看标注时, 需采用整本传阅的方式。后一种分开存储的形式,主要针对网页进行标注,它将原 文档与标注分开存储于数据库中,这有利于信息在网上的直接共享。因此,国外标 注软件多采用分开存储的形式。 分开存储的页面标注系统又可分为两类【1 4 】:基于代理的标注技术( 标注被分别 存储,由代理服务器将标注与网页结合) 和基于浏览器的标注技术( 增强的浏览器 将文档和标注数据结合) 。页面标注系统中较为典型的标注技术产品是a n n o t a t o r 和 a n n o t e a 软件。它们都很好的实现了以下功能: 标注的创建、修改、删除。 在线查看含有标注的文档。 标注的过滤、检索,共享。 a n n o t a t o r ”】是南加利福尼亚大学的b r a i n 项目的一部分。它采用基于代理的标 注技术唧,客户端须采用n e t s c a p e 浏览器并安装j a v a 插件阴。它通过记录被标注文 字及标注的各种属性作为后面定位检索等功能实现的基础。它利用j a v a 技术制作的 代理服务器结合标注信息与网页,定位后的网页传到n e t s c a p e 浏览器浏览。n e t s a c p e 4 磺士学位论文 m a s t e r st h e s i s 在支持d o m 和x m l 方面比浏览器更全面,因此它能实现更复杂更精彩的页面 标注功能。 a n n o t e a 1 4 】是w 3 c 基于多功能的开放性元数据架构体系设计的标注项目。此项 目中的标注都是作为元数据类。它主要采用了w 3 c 开放式的源技术,例如,r d f 、 x l i n k 、x p o i n t e r 和h t t p 。a n n o t e a t l 4 1 主要用于w 3 c 的a m a y a 浏览器,a m a y a 是 支持h t m l 和各种x m l 标记文档的浏览器。其标注数据采用r d f ( r e s o u r c e d e s c r i p t i o n f r a m e w o r k ) 描述,r d f 是用来描述网络中的资源的信息的语言。最简单 的r d f 结构形式【1 4 】用( r e s o u c e , p r o p e r t y , v a l u e ) 表示。如可用( u r l , d e :e r e a t o r , j o s e ) 描述:资源是u r l ,属性是c r e a t o r ,属性的值是j o s e 。一个标注的r d f 模型包含 更多的属性和值,如注释的u r l 、创建的日期、标注的类型、标注的文本、x p o i n t e r l l 6 1 等。其中,x l i n k t l 7 j , x p o i n t e r 技术在标注的定位查找方面提供支持。 a n n o t e a 软件结构化表示的思想和对标记的查找、定位等方面是很先进的,但 是它的文档必须采用x m l 这样高度结构化的格式。而现实中绝大多数网页是以 h t m l 格式标识的,多运行于也浏览器,而不是a m a y a t l 8 】这样支持多种开放式源 技术的浏览器。浏览器结构与a m a y a 差异很大,对x m l 的支持功能有限,这都 使得a n n o t e a 这样的软件无法运行到普通的m 浏览器上。 以上两种标注软件分别采用安装插件或增强的浏览器方式实现标注功能。它们 的不足是:a n n o t a t o r 软件由于要在客户端安装代理服务器,增加了客户端的负担和 普及的难度;a n n o t e a 基于的浏览器又与普通浏览器的结构和功能差异很大,不能 被这样为全世界8 7 t 1 9 1 上的人使用的浏览器应用。尽管各有不足,但它们都很 全面的实现了在线标注功能,其中蕴含的实现方法和思想为本页面标注系统的开发 提供了宝贵的经验。 国外针对浏览器开发的标注软件还有t h i r d v o i e e l 2 0 、i m a r k u p 等。t h i r d v o i c e 允许用户“粘贴笔记”的方式标注到网页,不过可能会产生垃圾及广告。i m a r k u p 1 5 1 可以免费试用3 0 天,它提供给标注者一个 p a l e t t e ”( 调色板) ,包含粘贴笔记、声 音笔记、“数字墨水”等;它可以定位,但浏览器大小改变则发生错误;它允许在网 上标注,标注被存储在用户计算机或存储标记到中央服务器,要共享注释必须用电 子邮件传递一个复件;它还支持角色定义,不同角色用不同色彩字体显示,能检索和 过滤,不支持注释间超链接,但可以附加文件到注释。这些基于m 浏览器的软件, 在标注功能上与上面标注软件功能类似,不及前面两种软件的功能全面。但有的软 件功能实现时存在明显的缺陷,如需e m a i l 复件到共享者,而且i m a r k u p 软件并不 是免费开放的,对其实现的具体技术探讨较少。 5 硕士学位论文 m a s t e r st h e s i s 最新标记研究成果,美国开发的d i g g o 社会性书签【2 l 】,应用于砸浏览器的标 注系统,安装d i g g o 插件后可实现标记的基本功能。目前,还没有这方面的技术信 息提供。该软件的缺陷是:仅记录了标注网页的u r l 地址,难以在网页内一次定 位到指定文本标注的具体位置。 1 2 2 国内研究现状分析 目前,国内用户实现标注功能,主要应用如w o r d 、r d f 、超星阅读器、 c o r e d r a w i 2 2 1 等软件。这些软件采用的是标注数据与文档不分离的形式。采用标 注数据与文本分开存储的形式,且应用于浏览器的页面标注系统的国产软件尚不多 见。不过,我国中科院的陈联博士提出了基于也浏览器的w e b 页面标注模型i n 】。 该模型将要标注的w e b 页面嵌入其中,实现对导入的网页进行标注的功能,如创建、 修改、删除、重组和共享。标注采用分开存储的方式,存储于数据库中的是含有用 脚本描述的h t m l 标记。 陈联博士的研究与国外的软件相比有如下特点:在浏览器中开发了w e b 页 面标注模型。由于该模型要求导入要标注的网页,因此,解决d h t m l 对象模型中 跨框架安全的限制【2 2 】是关系到w e b 页面嵌入标注模型是否可行的关键【1 1 1 。他采取 的解决方案是开发出一个新的e l e a r n e r 控件来替换核心组件s h o d o c v w d l l ,由 e l e a r n e r 实现标注合并到网页的功能。该控件的开发是其研究的一个创新点。但将 w e b 页面导入到模型中,即导入到具体网站的窗1 3 中,该方法会降低学习者学习的 积极性,使用并不方便。而且在使用模型前,要将e l e a m c r 控件下载安装,如果学 习者不信任该组件的安全性,会影响标注功能的实现。 1 3 研究的主要内容与关键技术 现在网页信息爆炸式增长,由于浏览器、插件技术等等各种限制导致大部分国 外发展的标注软件都没能普及推广,人们仍停留在消极的浅层次阅读状态。在网络 环境下阅读网页这类电子文档,与传统的读书一样,必须提供能及时标注的一只 “笔”,因为标注能促进记忆、理解、阐释、视觉化的快速搜索和共享p j 。 因此,本文即研究一套适合m 浏览器的页面标注系统。它能及时的给用户提 供标注工具,标注时自动收集选定的文本、标注的作者、标注的当前网页u r l 地 址等信息,用户在此基础上,对选定的文本进行颜色、标注内容等设置和填写,完 成后即保存至数据库。另外,用户能将数据库中的标注信息提取显示出来,显示的 方式多样化。最终实现了标注的创建、修改、保存、删除、查看和检索等功能。 6 硕士学位论文 m a s t e r st h e s i $ 研究的主要内容包括: 1 1 页面标注的分类与表示等理论的研究。 2 ) i e 浏览器体系结构的研究、m 浏览器的重用和扩展研究、正对v c 的支持 研究等。 3 ) 页面标注系统的体系结构设计、功能模块设计、标注数据库设计等。 4 ) 页面标注工具的开发与实现,标注服务平台的建设。 研究的关键技术主要有: 1 ) 开发出用于扩展浏览器的两个标注工具。一个用于创建标注,一个用于 定位显示标注。关键技术是如何取得当前页面的选定文本,如何将数据库 中标注信息定位合并到网页。 2 ) 开发出该标注的服务平台网站。关键技术是对数据库的检索、查看标注等。 3 ) 服务平台与标注工具之间的通信。关键技术是标注工具如何取得用户在平 台的登陆或注销信息,以满足标注工具标注时与用户信息挂接。 1 4 论文组织结构 文章共分为6 个章节,各章节安排如下: 第一章,主要介绍了课题的研究背景及意义、w e b 页面标注及国内外研究现状 并对论文的主要内容与关键技术做了简要的概括。 第二章,主要介绍了本研究课题所运用到的相关理论与技术研究,为标注系统 的建模和开发做基础。 第三章,主要介绍了页面标注系统的设计,对系统的整体结构功能进行了明确 的分工和流程安排。 第四章,主要针对页面标注系统的开发环节中的若干关键技术进行了研究与实 现。 第五章,对页面标注系统进行了测试,并总结测试的问题。 第六章,对全文进行总结,并对系统中需要继续深入研究和扩展之处作了进一 步的展望。 7 硕士擘位论文 m a s l e r st h e s l s 2 相关理论与技术研究 在开发相应的标注系统以前,必须弄清楚标注是什么,如何才能使系统满足标 注者本身的标注需求。从纸质标注与数字标注的研究中可以得到这些需求,并能为 标注数据库的设计提供支持。另外,页面标注系统的设计,主要针对m 浏览器的 运行环境,标注主要是对网页的操作和编辑,因此对浏览器的体系结构及也支 持的开发技术等相关理论必须有深刻的理解。本章主要完成对支持页面标注系统开 发的重要理论和技术的分析研究。 2 1 标注的概念 标注 9 j 是指被第三方对原文档创建和增加的数据,这些数据可以是笔记、符号、 图片、语音片断等。标注也可以称为做笔记,包括能被感知的视觉化和声音化信息 的输入、处理和输出,这些信息用不同的格式记载【1 0 】。 2 1 1 纸质标注的研究 在纸质标注的研究方面,m a r s h a l l 1 2 1 和o v s i a n n i k o ve t a 1 9 1 分别做了比较详细的 研究。 m a r s h a l l 收集了1 5 所不同大学的学生课本,总计超过1 5 0 本,然后对其中的标 注进行分类和统计1 1 2 1 。 他首先把标注分成四组: 1 ) w i t h i n - t e x t ,附加在文本上( 例如高亮文本,圈住词汇) 。 2 ) m a r g i n a lo rb a n ks p a c e , 在空白处写标注( 例如,在空白处添加手写笔记,加 三星符号1 。 3 ) e x p l i c i t 标注的意思明确( 例如,简短的笔记) 。 4 ) t e l e g r a p h i c 含义不明确的个人符号( 例如,红色下划线代表重要性) 。 然后,他用这四组信息在下表描述了的标注的分类形式,如表2 1 所示【1 2 】。 8 硕士擘位论文 m a s t e r st h e s i s 表2 1 标注的分类形式【1 2 1 位置附加在文本上在页面旁白或空白处写称汪 内容 含义不明确的个人 下划线; 小括号,中括号,三角符号; 符号 高亮; 三星符号,星形; 对字词加圆圈或矩形框。 对整页加圆圈或矩形; 在附加文本和空白处写的标注间 加箭头。 意义明确 在行间写的简短的笔记,在旁白处的简短的短语; 尤其是外语书本中旬子或词的 在旁白处扩展的笔记; 翻译。 在书的前面空白处扩展的笔记; 在旁白处留下的问题。 m a r s h a l l 对标注进行的这种分类方式:按照位置分类,可分为附加在文本上和在 空白处写两种;按照内容分,可分为意义明确和不明确两种。基本上可根据标注的 内容和位置状态较好的在二维表中定位标注。 o v s i a n n i k o ve t a 1 【9 】则对纸质标注的类型( 即标注的形式和功能) 进行研究,在 研究部门和学术机构进行了问卷调查。如第一章中国外研究现状中纸质标注研究中 所提到的。调查结果弄清楚了三个问题:用户是如何标注文件的,即标注的形式是 什么? ( 如图2 1 所示”勺;创建标注后,标注的使用情况如何,即标注的功能是什 么? ( 如图2 2 所示【9 】) 标注软件应具备的特征是什么? ( 如图2 3 所示t 9 1 ) 符号标记 在旁自处写 在顶部写 分开处写 字霎行问处写 l | 臻 使用频率 图2 1 标注的形式【塌 9 硕士擘位论文 m a s t e r st h e s i s 图2 2 标注的使用哪 图2 3 标注软件的特征的重要程度 9 1 o v s i a n n i k o ve t a i 对标注的形式、功能、标注软件用到的特征都进行了分类列 举。通过互动的问卷调查,图2 1 中得到了最常用的标注的形式,即高亮文本的符 号标记和在旁白处记录笔记。高亮文本有利于读者浏览页面时,很快视觉化的搜索 到高亮部分,快速的组织形成文章的主要思想;旁白处记录笔记有利于读者对接近 旁白处的主题提出自己的想法、批判性的评论、问题等1 9 】。另外两种标注形式,在 项部写和分开处写,其标注内容一般是对整篇文章的归纳总结,不是对文中具体文 字的阐述,因此实际中采用这种标注形式较少【9 1 。最后一种标注形式,在字里行间 处写,对外文进行翻译时应用较多,一般情况下应用较少【9 】。图2 2 中得到了标注 的主要功能:记忆、思考、阐述。( 因为主要是对纸质标注的功能的总结,这里缺 少标注的共享功能。) 图2 3 标注软件的重要特征方面,要求标注软件提供用图片表 1 0 硕士学位论文 m a s 3 + e r st h e s i s 示的标注、关键词检索、旁白处写、符号标记高亮等功能,可以看到这些与最常用 的标注形式相符。 纸质标注的研究成果主要有:标注主要分为附加在文本上和在空白处写两种, o v s i a n n i k o ve t a i 对空白处写进一步细分,发现旁白处写是空白处写中最常用的形 式。因此,标注软件至少提供“附加在文本”和“旁白处写”两种形式。根据标注软件 特征重要性,还至少应提供利用关键词检索的功能。 2 1 2 数字标注的研究 数字标注【l2 l 即基于数字格式的文档标注,也称对电子文档的标注。电子文档的 特征是易编辑、易复制、易分发、易检索。标注的易检索,表现为标注存到数据库 后,尽管它们分布于各种不同的文档,但可在一个共同的检索网页中以“目录索引” 的方式迅速的找到标注。这种检索不是基于位置,而是基于关键词、基于语义的, 因此更符合读者的检索目的。在a n n o t a t o r 软件中实现了标注能够对应同一篇文档 的多个文本块,也可以一个标注对应不同文档的多个文本块。在国外的d y n o m i t e 2 3 】 中已实现数字文档中的标注的格式可以是多媒体样式,其输入方式可采用电子笔等 工具。很多标注系统都实现了数字文档中标注的共享功能,即不必传递整个文档便 可同时被多个用户访问和共享。 数字标注要很好的实现检索和共享的功能,必须采取文本和标注数据分开存储 于数据库的形式。在设计数据库时,既要对标注形式、功能等方面考虑,又要根据 标注的内容( 意义不明确、明确) 来决定标注的私有性或公开性,还要根据电子文 档的特征设计用于标识唯一文档的d 号。此外,国外有一个研究又对现有的数字 标注软件对学习者的作用做了调查,它为数据库的设计加入新元素。 该研究没有讨论读者应该如何标注文本,如标注采取的形式等等,而是从已有 的文本标注对后来读者的影响性出发来做调查。调查了1 2 3 位本科生剀,这些本科 生都收到了以各种方式标注的文档。结果表明:标注提高了对强调信息的回顾,标 注中的论点对读者影响较大,标注减少了学生对材料不必要的总结【2 4 l 。作者最后以 此调查为基础,提出了对数字标注软件设计的建议。 1 ) 要允许读者取得基于被标注的原始文本的标注1 2 4 1 。即根据原始文本来得到 相关的其他读者的标注信息。 2 ) 要提供丰富多样的检索方式。不仅仅只是关键词的检索,可以是基于标注 在原文档的位置 2 4 1 ( 如是高亮还是旁白处写) 。这种根据位置来检索,有助 于读者了解其他读者如何处理文本,如何围绕原始文本进行思考。多种检 硕士学位论文 m a s t e r st h e s i s 索方式,产生多种检索策略,更利于在多种视角多种目的下得到文档。 3 ) 对标注进行归类【2 4 1 。哪些是肯定的内容,哪些是否定的内容,这利于激发 学生做更复杂和批判性的思考。 4 ) 提供有关标注者的信息,包括他们在某领域研究的权威性、他们的信仰等 脚】。因为标注的观点有些是带有一定的信仰和偏见的,提供这些资料可以 帮助学生从另一个视角来看问题。 纸质标注和数字标注的研究,比较全面的阐述了标注的形式、功能、内容等理 论。这些理论主要从学习者如何标注文档来总结出最频繁使用的形式和最重要的功 能。在数字标注的最后,从标注对其他读者的影响出发,又在标注的表示上提出了 新的观点。标注的表示应更丰富和多样化,这对标注软件数据库的设计增加了新的 要求。 2 2 i e 浏览器 2 2 1i e 浏览器发展简述 压浏览器的发展从i n t e m e te x p l o r e r1 发展到最近发布的i n t e m e te x p l o r e r7 ,其 支持的技术和功能都得到了较大的发展。 i e l 0 ( 发布于1 9 9 5 年8 月) 和i e 2 0 ( 发布于1 9 9 5 年1 1 月) 是m 浏览器早 期发布的两个版本。它们的主要功能是只用标准的h t m l 语言来创建基于w e b 的 应用程序,用来在全球发布信息。信息在浏览器中显示后是只读的,用户之间交互 信息主要通过h t m l 表单完成f 2 ”。 i e 3 0 ( 发布于1 9 9 6 年8 月) 在前两个版本的功能基础上,增加了掌管a c t i v e x 控件、支持脚本、d h t m l 对象模型、w e b b r o w s e r 控件的重用这四个功斛”】。a c t i v e x 控件可以在网页中实现一般w i n d o w s 应用程序的功能。i e 3 0 支持j s e r i p t 和v b s e r i p t 两种脚本语言,脚本语言能对网页中a c t i v e x 控件以及网页中的表单内的元素编程, 用户的数据在提交到服务器前先用脚本语言验证有效性,从而大大减少了用户的时 间。d h t m l 对象模型和脚本语言配合使用取得页面中的信息瞄】。w e b b r o w s e r 控件 可以让浏览器的功能在其他应用程序中实现,如浏览网页等,使用w e b b r o w s e r 控件,你可以定制自己的浏览器。 i e 4 0 ( 发布于1 9 9 7 年9 月) 在编程和重用性方面【2 5 】有了进一步发展。首先, 支持的d h t m l 增强了d o m 模型,实现了网页下载到浏览器后依然能够改变网页 1 2 硕士学位论文 m a s t e r s t h e s i $ 内容的功能。其中,如果页面的h t m l 元素与数据库绑定,当数据库内容改变时, h t m i 元素内容随之改变。第二,增强了w e b b r o w s e r 控件的功能,加入了与控制此 控件相关的功能。第三,引入了新的用户界面e x p l o r e r 工具条,分为垂直的工具条 和水平的工具条。它是一种在浏览器内供用户控制正浏览器功能的一个框架窗 口,如搜索栏( b a n d ) ,收藏夹栏。第四,引入b h o ( b r o w s e r h e l p e r o b j e c t s ) 浏览 器帮助者对象闭。当开始一个也新实例时自动创建b h o 对象,通过此对象,你可 以挂接到浏览器,来控制导航或改变浏览页面的内容。 i e 5 0 在i e 4 0 的基础上进一步发展成为一个功能比较完善的速度更快的开发平 台,你可以在这个平台上创建基于w e b 的i n t e r n e t 应用程序,例如:开发者用m 提供的a p i 和c o m 对象来创建用组件的应用程序。这些程序能在开发平台 上运行。 i e 5 0 的新特征【2 5 】有以下几点: 1 ) 增强的h t m l 组件模型( h t c ) 。h t c 是指d h t m l 和s c r i p t 创建的行为, 行为是一种能在网页间重用的小组件。 2 ) 持续的存在性。i e 5 0 利用s e s s i o n 等技术实现了用户离开一个页面后,依 然能提供到返回至该页面的导航机制。 3 ) 告知客户端使用的浏览器的性能,便于m 开发平台的使用。 4 ) h t m l 应用程序( h t a ) 在m 中的实现。h t a 是如w o r d , e x c e l 这样在 w m d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论