




已阅读5页,还剩47页未读, 继续免费阅读
Office试卷自动评分系统的研究及实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内蒙古大学 硕士学位论文 office2007试卷自动评分系统的研究及实现 姓名:杜琦 申请学位级别:硕士 专业:软件工程 指导教师:巩政 20120530 内蒙古大学硕士学位论文 o f j i c e2 0 0 7 试卷自动评分系统的研究及实现 摘要 长期以来,由于o 硒c e ( w o r d 、e x c e l 和p o w e r p o i n t ) 操作题的主观操作性较强, 对其进行较为准确的自动评分一直是一个难题。虽然到目前为止已经有不少有 关这方面的自动评分系统面世,但在研究了大量文献和考查了现有系统的特点 之后,发现现有系统主要是建立在o 伍c e2 0 0 0 或者o 伍c e2 0 0 3 基础之上,通过 3 a 宏语言结合o l e 技术编写面向对象程序来实现对o 伍c e 操作题的自动评分, 其所提出的解决方案有诸多不足之处。 本文摒弃了使用v b a 技术和0 l e 技术实现对0 m c e2 0 0 3 文档自动阅卷的思 想与方法,就0 m c e2 0 0 7 文档的自动评分提出了一种新的解决方案。该解决方案 是以o 伍c e2 0 0 7 软件为基础,根据o 伍c e2 0 0 7 文档采用的o f ! f i c eo p e nx m i ,文件 格式,从标准答案0 伍c e2 0 0 7 文档和学生答案o m c e2 0 0 7 文档中提取相应的x 眦, 文件,对所提取的x m l 文件进行信息处理,通过对两个文档信息进行比较的方 法来实现对o 伍c e2 0 0 7 文档的自动阅卷。 考虑到目前计算机应用基础课中所使用的o 伍c e 软件还是以2 0 0 3 版本为主, 本文采用v b a 技术操作o f | f i c e2 0 0 3 文档中对象的方法,在系统中添加了o f ! f i c e 2 0 0 3 文档转换为0 伍c e2 0 0 7 文档的模块,从而实现了系统对o 珩c e2 0 0 3 文档的兼 容。 文中在比较文档时着重使用了基于字符串相似度的自动评分算法模型。该 算法模型在计算字符串相似度时引入了编辑距离算法,使得该算法的评分符合 线性规则,即被评分文件的得分与错误数呈线性关系。 o f f i c e2 0 0 7 试卷自动评分系统的研究及实现 通过对大约5 7 0 0 份o f ! f i c e 2 0 0 3 文档的自动阅卷测试,实际测试数据表明,文 中系统的算法的评分符合线性规则,对w o r d2 0 0 3 文档、e x c e l2 0 0 3 文档和 p o w e r p o i n t2 0 0 3 文档的自动评分的阅卷误差率分别为2 4 5 、2 0 5 和1 4 9 。文 中同时给出了在普通p c 机环境下,系统一次阅卷的份数为2 0 0 份左右时能达到最 大的单份文档阅卷速率。 关键词:o 倚c e2 0 0 7 ;o 伍c e0 p e n ) ( 1 儿;自动评分;字符串相似度; 内蒙古大学硕士学位论文 r e s e a r c ha n dm l e m e n t a t i o no fo f f i c e2 0 0 7 e x a m i n a t i o np a p e ra u t o m a t i cr a t i n gs y s t e m a b s t r a c t f o ra1 0 n gt i m e ,d u et ot h es 协o n gs u b j e c t i v eo p e r a b i l - i 够o ft h eo p e r a t i n gt i t l eo f t h e0 伍c e ( w o r d ,e x c e l ,a n dp o w e r p o i n t ) ,i t sm o r ea c c u r a t ea u t o n l a t i cs c o r i n gh a s b e e nap r o b l e m a 1 t h o u 曲s of i a rh a v eal o to fm ea u t o m a t i cs c o r i n gs y s t 唧i nt h i s r e g a r da v a j l a _ b l ei nm es t l l d yo fal a 坞en u i l l _ b e ro fl i t e r a t l l r ea n de x a m i n e st h e c h a r a c t e r i s t i c so ft l l ee x i s t i n gs y s t e m ,i tw a sf o u n dt h a tt 1 1 ee 】【i s t i n gs y s t e mi si n a i n l y b u i l to n0 珩c e2 0 0 0o ro f j f i c e2 0 0 3o nm eb a s i sv b al i l a c r 0l a i l g u a g ec o n l b i n e d 而t 1 1 t h eo l e t e c l u l 0 1 0 9 yt ow r i t eo b j e c t o r i e m e dp r 0 酎a m i l l i n gt oa c h i e v em e a u t o m a t i c s c o r i n go fo 伍c eo p e r a t i o n ,m ep r o p o s e ds o l u t i o nh 弱m a j l yi n a d e q u a c i e s a b a n d o n e d0 m c e2 0 0 3d o c 砌e n t sa u t o m a t i c a l l ym a r l 【i i 冯t h ei d e a s 趾d m e 吐l o d st ou s ev b aa j l do l et e c l 1 0 l o 鼢p r o p o s e dan e ws o l 砸o n t h es 0 1 u t i o ni s b a s e do nt h e0 伍c e2 0 0 7s o n w a r e a c c o r d j 血gt 0t l l e0 m c e2 0 0 7d o c u 胀斌u s i n gt h e o m c eo p e n 也f i l ef o m a t ,t h ec o 仃e s p o n m n gx m lf i l e se x t r a c 词舶mt h e s t a n d a i da n s w e rt oo 衢c e2 0 0 7d o c l 】m e n ta n dt h es t u d e l l t s a n s w e r st ot h e0 伍c e 2 0 0 7d o c u m e m 甜l dt h ei n f o m a t i o np r o c e s s i n go fm ee x t r 刁l c t e dx m lf i l e ,b yt h e m e t h o df o rc o m p 撕n gt w od o c u 脒斌si n f o h n a t i o nt ot h ea u t o m a t i cs c o 血go ft h e 0 伍c e2 0 0 7d o c u m e n t t a k i n gi n t oa c c o u n tt h eb a s i cc o u r s eo fc o m p u t e r 印p l i c a t i o n su s e d0 m c e s o 行a r et ot h e2 0 0 3v e r s i o n t h e 矾i c l ea d d e dt ot h em o d u l eo ft h e0 f | f i c e2 0 0 3 i i i 。街c e2 0 0 7 试卷自动评分系统的研究及实现 d o c u m e n tf o r0 伍c e2 0 0 7d o c u m e n t si nor d i 贸t oa c h i e v et h es y s t e mi sc o m p a t i b l e o 伍c e2 0 0 3d o c u m e n t s t h e p a p e rf o c u s e so nt h ea u t o m a t i cs c o d n ga l g o r i t h mb a s e do ns t r i n gs i m i l a r i t y m o d e l i nc o r n p 撕s o nd o c u m e n t t h ea l g o r i t h mm o d e l i si n t r o d u c e di nc a l c u l a t i n gt 1 1 e s t 血培s i m i l 撕t ye d i td i s t a n c ea l g o r i t l l m t h er a t i n go ft h ea l g o r i t l u ni nl i n ew i t ht h e l i n e a rm l e ,m es c o r ea j l dm en u 玎1 b e ro fe r r o r si ss c o r ef i l eal i n e a rr e l a t i o n s h i p a u t o m a t i cs c o r i n gt e s to fa b o u t5 7 0 0c o p i e so f0 m c e2 0 0 3d o c u m e n t s ,t h e a c t u a lt e s td a t as h o wt h a tt h ea l g o r i t h mi nm et e x to fm es c o r ei nl i n ew i mt h e1 i n e a r m l e ,w r o r d2 0 0 3d o c u m e n t ,e x c e l2 0 0 3d o c u m e n ta n dp o w e r p o i n t2 0 0 3d o c u m e n t s a u t o m a t i c a l l ys c o r em es c o r i n ge m rr a t e sw e r e2 4 5 ,2 0 5 a 1 1 d1 4 9 i nt h e e n v i r o n m e n to fm eo r d i n a 巧p c ,t h es y s t e mm 打i 【i n gt h en u m b e ro fd o c u m e n t s 丘o m a b o u t2 0 0t oa c h i e v eas i n 9 1 ed o c u m e n tm a r k i n gr a t em a x i i n u m 酗啊o r d s :0 m c e2 0 0 7 ;x m l ; a u t o m a :t i cm t i n g ;s t m gs i m i l a r i t y i v 0 伍c e2 0 0 7 试卷自动评分系统的研究及实现 图表目录 图2 1o m c e2 0 0 7 版本的文件格式容器一7 图2 2 一个e x c e l2 0 0 7 工作簿中最高级别的关系图10 图5 1o 匝c e2 0 0 7 自动评分系统的自动评分原理18 图6 1 自动阅卷操作流程2 5 图6 2 模块一程序执行流程2 6 图6 3 系统阅卷程序执行过程2 7 图6 4 系统的主界面:2 8 图6 5o f ! i c e2 0 0 3 文档转换为o m c e2 0 0 7 文档界面2 8 图6 6 导入标准答案文档界面2 9 图6 7 导入学生答案文档界面2 9 图6 8 阅卷和导出学生成绩界面3 0 图7 1 分析器c p u 采样分析3 7 图7 2 总花费时间随文档数变化趋势图3 9 图7 3 平均阅卷时间随文档数变化趋势图3 9 图7 4 各主要过程花费时间与文档数之比的变化趋势4 0 表6 1 考生信息表2 3 表6 2 标准答案信息表2 4 表7 1 系统测试运行环境31 表7 2 对照组实验结果31 表7 3 实验组实验结果3 2 表7 4 各组文档份数3 2 表7 5w | o r d 组测试结果3 3 表7 6e x c e l 组测试结果3 4 表7 7p o w e r p o 血组测试结果3 5 表7 8w o r d2 0 0 3 文档试验结果3 7 表7 9 各过程花费时间与文档数之比j 3 8 v i i i 内蒙古大学硕士学位论文 第1 章绪论 1 1 研究背景 目前,随着社会信息化程度的不断提高,以o m c e 删b r d 、e x c e l 和p o w e r p o 证t ) 办公软件 为主的计算机应用基础课程在各大专院校基本得到普及。计算机应用基础课程的测试通常采 用客观题( 即选择、填空、判断等题型) 和上机操作的考核方式。通过对国内外计算机测评系 统的研究,发现早期的计算机应用基础课程考试主要采用卷面考试的方式,这种以理论笔试 为主的考试方式,其成绩不能真正反映学生的计算机应用水平和能力,这种考试形式也会导 致学生重理论、轻实践现象的发生,考生的计算机能力大多限于“纸上谈兵”,其上机操作 能力较差。 从目前的现实情况来看,关于客观题考核方式的理论和技术比较成熟,而对于上机操作 的考核,无论是理论还是实践都比较薄弱。课程中的o 伍c e 操作类题目如果采用笔试的形式 进行考察,将不能全面以及准确的反映学生对操作类题目所涉及知识的真实掌握情况和实践 动手能力。因此,操作类题目采取上机考核的方式是最为恰当的,但目前的现实情况是任课 教师为了及时了解学生对o 伍c e 的基本常用操作的熟练掌握程度就得经常进行上机操作考 核,教师如果对学生每次所做考核文档都进行手动批改,不仅工作量大,而且由于主观因素 的影响,将不能客观公正的反映学生的学习效果。如果能对操作类题目实现自动阅卷,将在 很大程度上降低教师的工作量,提高阅卷的准确度和客观公正性,进而提高了教学质量。如 何解决上机操作中的自动阅卷是目前急需解决的一大难题。 目前,计算机应用能力的普及、培训及考核已经成为了一个产业,考核中传统的手工阅 卷也逐步走向了自动阅卷。目前国内的自动阅卷系统已经能够很好地完成对常见客观试题的 自动批阅工作,但是对于主观类操作题的考核还没有很好的解决方案。因此,如何运用高新 技术,客观、准确地对主观类操作题进行考核,已成为研究的热点问题。 1 2 国内研究状况 计算机应用基础课程的考核方式,如果采用传统的笔试方式,很难客观地反映学生应用 计算机的能力,目前大多的考试都采用上机考试代替笔试。 计算机考试自动化测试技术,简称c t a a ,是计算机辅助测评研究的一个新的领域,其 。归酏e2 0 0 7 试卷自动评分系统的研究及实现 实质是结合计算机考试无纸化的进程在对考试结果进行评价的过程中引入计算,充分利用计 算机高效、准确的特性对考试结果进行测评,在完善计算机考试无纸化的同时客观准确地评 价和反映考生对计算机知识的掌握程度【l j 。 由于计算机应用基础课程的开设在普通高校基本得到普及,对该考试的阅卷已经广泛采 用自动阅卷技术,但由于与其相关的解决方案一直不太成熟,所以该类考试的自动阅卷的研 究一直还在继续。 通过对相关能够实现o 伍c e 文档自动阅卷技术的研究和总结,发现在实际中主要采用以 下3 种技术,分别为:通过将o m c e 文档转换为r t f 文档后实现自动阅卷;使用0 l e ( o b j e c t l i n l ( i n ga n de i n b e d d i n g ) 自动化应用程序实现自动阅卷;使用v b a ( v i s u a lb a s i cf o r a p p l i c a t i o n s ) 技术实现自动阅卷。其中第种技术是目前研究和实现o m c e 文档自动阅卷系统 时采用最多的一种技术。 文 2 】阐述了一个基于中文w 诅d o w s 9 5 的自动阅卷系统的设计方法和实现方案。该系统可 以自动批阅填空题、汉字录入题、选择题、w - o r d 操作题以及w i n d o w s 操作题。文中在实现 对w b r d 操作题的自动阅卷时采用的方式是将w r o r d 生成的d o c 格式文档转换为r t f 格式文 档,再设计一个文本解释器分析r t f 格式文档。 文 3 】 1 0 】就w b 柑模块、e x c e l 模块和p o w e 心o i n t 模块的自动阅卷进行了详细的论述, 该系统在用户选择阅卷功能时,首先进入自动阅卷平台,选择考试模块,平台会从数据库中 调入试卷,再调用相应模块的主观题自动阅卷子程序,试卷评判完毕后,再由平台负责将试 卷得分和其他信息存入考试中心数据库,然后继续调入该模块的下一张试卷进行评判,自动 实现循环,直到判完用户指定数量的试卷或数据库中己没有未判试卷。该系统在运行时,要 求必须在本机装有阅卷系统或能连上装有阅卷系统的服务器。 文 1 1 1 7 提到o 伍c e 操作题的阅卷之所以是一个难点,是因为w b r d 、e x c e l 和 p o w e 心o i n t 等文档由一系列对象和数据流组成,无法从文件中发现其存储规律。文中介绍了 在阅卷过程中利用c o m 技术,创建郇p l i c a t i o n 、d o c u m e n t 等一系列o l e 对象,o l e 对象 通过调用a 接口实现对o f f i c e 文档的操作。通过a 读取学生答题文件中特定对象的属 性,与标准答案进行比较,从而实现计算机的自动阅卷。 文 1 8 、 1 9 】提到由于每个0 伍c e 文档是由许多对象组成,这些对象及其属性的值就决定 了文档的结构和格式。通过对o 伍c e 文档中若干对象的分析,提出对这些对象操作的阅卷细 节,实现对。氆c e 文档的自动阅卷。文中使用的主要技术是使用a 技术操作。伍c e 文档 2 内蒙古大学硕士学位论文 中对象。 1 3 系统研究意义 计算机自动评卷技术( 无纸化考试系统) 的研究、推广和应用,可以推进教育改革,加快 教学现代化,推动考核方法改革,实现考核手段的现代化。可以确保考试的高效、科学、公 平,实现教学管理现代化。随着信息技术的飞速发展,将计算机应用于教学评价中已经是一 种潮流。 自动阅卷作为计算机测评系统的一部分,以计算机的高效、自动的阅卷取代教师的低效 率的、机械的手工阅卷,将教师从繁重的机械劳动中解放出来。在考试结束后,立即进行阅 卷,能够对考生的学习成绩做出更客观公正的评价。同时对o f f i c e 文件操作的自动评分系统 的进一步研究将有助于计算机应用基础课程在各类学校的开设,也有利于自动评分系统在教 学过程中的应用。 长期以来,由于o 伍c e 操作题的主观操作性较强,对其进行较为准确的自动评分一直是 一个难题。以往的o 伍c e 操作题自动评分系统基本上是建立在o 伍c e2 0 0 0 或者o 衔c e2 0 0 3 基础之上,采用的技术主要是通过a 宏语言结合o l e 技术编写面向对象程序来实现对 。伍c e 操作题的自动评分,详见文献【1 3 】、 1 4 】。随着o 伍c e 2 0 0 7 的广泛使用,以及o 伍c c 2 0 0 7 采用了不同于o 伍c e 2 0 0 0 或者o m c e 2 0 0 3 文件格式的o 伍c e o p c n x m l 格式,开发一套更 适合于o 伍c e2 0 0 7 的自动评分系统已经迫在眉睫。同时由于m i c r o s o f io m c es y s t e m 是向后 兼容的,即。伍c e2 0 0 7 是o 伍c e2 0 0 3 的延续和扩展,以及v b a 与。伍c e 应用程序中的 w o r d 、e x o d 和p o w e r p o m 之间存在着密切的联系,可以通过编写v b a 程序实现。佑c e2 0 0 3 文档向o 伍c e2 0 0 7 文档的自动转换,故而研究o 伍c e2 0 0 7 操作题自动评分系统具有一定的 理论和现实意义。 1 4 研究内容 计算机应用基础操作题试题包括w i i l d o w s 、w b r d 、e x c e l 和p o w e r p o i n t 等软件的试 题,除了w j l l d o w s 软件,其他软件都属于o 伍c e 软件。目前各高校采用的计算机应用基础 教材还是以o 伍c e2 0 0 3 办公软件为操作软件来介绍o 伍c e 的具体应用。由于d o c 、x l s 和p p t 格式的文件属于二进制文件,如果不提前对文件中存储对象的属性做出相应的规定,则很难 从文件中发现其存储对象和数据流规律,给自动阅卷的实现带来了一定的难度。为了解决这 一难题,本文研究能否将d o c 、x l s 和p p t 格式二进制文件转换为其他格式的文件,以此来解 o f f i c e2 0 0 7 试卷自动评分系统的研究及实现 决从上述二进制文件中较难发现其存储对象和数据规律这一难题。在文中1 2 节的国内研究 现状中已经把d o c 文件转换为r t f 格式文件来实现自动阅卷的技术做了介绍,但这种技术操 作复杂而且自动阅卷效果不是很理想。 现有的一些。伍c e 试卷自动阅卷系统存在一些问题,主要表现在三个方面:一是o 伍c e 试题和试题的标准阅卷信息绑定在一起,这类阅卷系统阅卷针对性强,但系统中的o 伍c e 试 题是由系统设计者提出,试题具有不可开放性,且试题难度偏于简单、形式单一,不能全面 的对学生的真实操作水平进行考核;二是有些自动阅卷系统采用w i n d o w s 提供的消息截取技 术- h o o k 技术记录学生对o 伍c e 软件的所有操作步骤,通过考生的操作步骤来判断学生的 操作是否正确,但是对于操作类的题目,完成试题要求的操作步骤并不是唯一的,且考核的 重点是操作结果而不是操作过程,因此使用此技术的自动阅卷系统的局限性比较大。 本文研究将o 衢c e2 0 0 3 文档转换为0 伍c e2 0 0 7 文档,通过从0 伍c e2 0 0 7 文档中提取相 应的x m l 文件来实现自动阅卷。研究和开发出一个与试题分离的,且具有灵活性的o m c e 2 0 0 7 自动评分系统。 本文将完成以下几个方面的工作: l 、对o m c e2 0 0 7 文件特征进行分析: 2 、实现o 伍c e2 0 0 3 文档向0 伍c e2 0 0 7 文档的转换; 3 、摒弃使用o l e 技术和v b a 技术实现自动阅卷的思想,提出一种全新的实现自动阅卷 的思想和算法; 4 、在上述工作的基础上设计一个新的自动阅卷系统。该系统的特点是操作过程简单、自 动化程度高,具有较高的自动阅卷准确率和速率。系统的操作过程简单、自动化程度高体现 在在自动阅卷过程中只需要提供标准答案文档就能实现对学生提交答案文档的自动阅卷。 本文所设计的系统最终要实现的主要功能是实现对o m c e2 0 0 3 文档和0 伍c e2 0 0 7 文档的 自动阅卷,且该系统在自动阅卷准确率和速率上都要达到较高的程度。 4 内蒙古大学硕士学位论文 第2 章0 m c e ( 2 0 0 7 ) o p e nx m l 文件格式简介【2 0 】 2 10 m c eo p e n 讧l 文件格式的由来 随着2 0 世纪9 0 年代x m l 的出现,企业计算客户开始逐渐认识到,在他们所依赖的计 算机产品和应用中采用开放的格式和标准所带来的商业价值。i t 专业人员将从通用的数据格 式中受益匪浅,x m l 就是这样一种格式,因为它拥有被应用程序、平台和雠锄c t 浏览器读 取的能力。 同样,随着在m i c r o s o ro 伍c e2 0 0 0 中对于x m l 格式的支持与采用,开发人员开始认识 到,他们需要将以前的m i c r o s o ro f j f i c e 版本中的二进制文件格式转换为x m l 格式。二进制 文件( d o c ,x l s 以及p p t 文件) 在过去几年中一直肩负着存储和转换数据的重任,而现在它 们无法满足新的市场需求的挑战,其中包括轻松地在异构应用之间传递数据,以及允许用户 从这些数据中搜集商业信息。 2 0 0 7m i 啪s o ro 蚯c es y s t 锄为m i 啪s o ro 伍c ew o r d2 0 0 7 ,m i 锄s o f to 伍c ee x c e l2 0 0 7 和m i c r o s o f to 伍c ep o w e r p o 洫2 0 0 7 采用了基于订l 的文件格式。这种新的文件格式,称为 o 伍c eo p e nx m l 格式,它解决了上述市场需求的问题。 2 2o m c e o p e nx m l 文件格式的特点 o 伍c eo p e n l 文件格式增强了文件与数据的管理能力,数据恢复能力,以及与业务 线系统的互操作能力。它们是对早期版本的二进制文件的扩展。任何支持讧l 的应用程序 都可以访问o f j f i c eo p e nx m l 文件格式当中的数据,并与之协同工作。这些应用程序并不需 要成为m i c r o s o f to f ! f i c es y s t e m 或m i c r o s o r 产品的一部分。用户也可以使用标准的转换来提 取或重新组织数据。它是面向。伍c ew o r d2 0 0 7 ,o 伍c ee x c e l2 0 0 7 ,和o 伍c ep o w e r p o i n t2 0 0 7 的完全可编辑的文件格式。它有以下几个大的特点: 1 ) 开放并且免版税; 2 ) 易于将业务信息与文档集成; 3 ) 互操作性强; 4 ) 0 伍c e0 l p c nx m l 格式被设计为比二进制格式更加健壮; 0 伍c e2 0 0 7 试卷自动评分系统的研究及实现 5 ) 高效性: 6 ) 安全性; 7 ) 向后兼容性。 2 3 一些相关的术语 a p i ( a p p l i c 撕o np r 0 铲锄:吼i n gi n t c r f a c e ) :它是一些预先定义的函数,目的是提供应用程 序与开发人员基于某软件或硬件的以访问一组例程的能力,而又无需访问源码,或理解内部工 作机制的细节。a p i 是应用程序接口( a p p l i c 撕o np r o 伊聪皿i n gi n t e r f a c e ) 的简写。 转换器( c o n v 融e r s ) :可以在早期的o 伍c e 版本中打开以o f ! f i c eo p e nx m l 格式创建的 文件的免费的插件或工具。 向前兼容性( f o 御砌c o m p 舳i l i 够) :应用程序的早期版本能够打开较新版本中的文 件并忽略早期版本中未实现的功能。例如,w o r d2 0 0 3 就是与w o r d2 0 0 7 向前兼容的,它 可以使用转换器成功的打开w o r d2 0 0 7 文件。 o 伍c eo 口c nx m l 格式:一种构建块及关系的结构,用来组织、打包、分发,并展现以 文档为中心的内容。这些构建块定义了一个文件格式与平台独立的框架,它允许软件应用程 序可靠并一致地生成,交换,并显示文档。 包:z i p 容器,它包含了组成文件的组件( 部件) ,在o p e np a c k a 西n gc o n v e n t i o n s 细则 中定义。 部件:对应于包中一个文件。例如,如果一个用户双击一个e x c e l2 0 0 7 文件,并且选择 提取它,他或她将可以看到这些文件,例如一个w o d ( b o o k x m l 文件和几个s h e e 臼1 x m l 文件。 其中每个文件都是这个包的一部分。 关系。指定部件的集合在一个文档中如何绑定在一起的方法。这种方法指定了一个源部 件和一个目标部件之间的连接。关系也是存储在文档包的x m l 部件当中的( 例如, _ r e i s r e l s ) 。 x m l :扩展标记语言( x m l ) 是一种简单,灵活的文本格式,用做电子发布以及址e m e t 和其它地方进行广泛的数据交换。 z i p :一种工业标准的压缩存档格式,用来在计算机之问,使用电子邮件或者通过h l t e m e t 存储和转换文件。 6 内蒙古大学硕士学位论文 2 4o m c eo p e nx m l 文件格式的结构 0 伍c ec i p e n 讧l 文件格式的容器是基于简单的z 碑文件格式。在新的o 蚯c e0 i p e nx m l 格式的核心使用一些) ( 1 l 的引用架构和一个z i p 容器。每个文件都是由一些部件的集合组 成的;这个集合定义了文档。文档部件是存储在容器文件当中,或者存储在基于工业标准的 z i p 格式的包中。许多部件都是用来描述应用程序数据,元数据,以及自定义数据的) ( 】l 数 据,它们都是存储在容器文件当中的。其它非x m l 部件,也可以包含在容器包当中,其中 包括在文档中表示图片或者嵌入的o l e 对象的二进制文件。另外,还有一些关系部件,它们 指定了部件之间的关系;这种设计方式为o f j f i c e 文件提供了结构。部件组成了文件的内容, 而关系描述了这些内容如何组织在一起。图2 1 所示为o 伍c e2 0 0 7 版本的文件格式容器: 图2 1 0 m c e2 0 0 7 版本的文件格式容器 f i 罂珥e2 - 1o 伍c e2 0 0 7v e 器i o no f t l l ef i l ef 0 脚1 a tc o n t a i n e r o 伍c e 文档的x m l 文件格式紧密的集成在一起,但是它们是模块化的,并且具有高度的 灵活性。在下面的一些小节中,将详细地描述o m c eo p e n ) ( 1 v i l 格式的每个组成部分。它们 也使用新的文件格式描述了o m c e 应用程序。 2 5 如何打开一个0 m c e2 0 0 7x m l 文件 以w o r d2 0 0 7 为例,简要介绍打开查看个o m c e2 0 0 7 垤l 文件的步骤: 1 ) 创建一个w o r d 2 0 0 7 文档,包括文本,图片,以及其它元素,保存为一个d o c x 文件。 2 ) 在文件名的末端添加一个z i p 扩展名。 3 ) 把上述z i p 压缩文件解压到文件夹。此时可以查看组成文件的每个部件。 7 o 伍c e2 0 0 7 试卷自动评分系统的研究及实现 4 ) 在上述文件夹中可以查看组成文件的每个部件。 2 60 伍c e0 p e nx m l 格式的组成部分 在上述小节中已经简要介绍了o m c e0 p e nx m l 文件格式的结构,本小结将对它的组成 部分做详细的介绍。 1 ) z 口包 在早期的o 伍c e 版本( o 伍c e2 0 0 3 或更早期版本) 当中,开发人员如果希望管理一个o 位c e 文档的内容,那么他们需要了解如何根据这种二进制文件定义的存储结构,读取和写入数据。 这种过程是非常复杂的,因为o 伍c e 的二进制文件被设计为主要由o m c e 应用程序访问。应 用程序在内存内的结构反应的格式都可以运行在内存和硬盘比较低的计算机当中。另外,不 使用o 街c e 应用程序而对0 伍c e 二进制文件进行程序化的修改,被认为是文件损坏的主要原 因。这使得许多开发人员不敢去修改o 伍c e 二进制文件。 z i p 被选择为o 伍c eo p c nx m l 格式的包格式j 因为它是一种理解良好的工业标准。现 在,有许多的工具都可以处理z i p 格式,而且使用z 口提供一种灵活的,模块化的结构,允 许对于功能进行扩展。因此,您可以使用任何可以处理工业标准的z 口文件的工具,来访问 2 0 0 7m i c r o s o n0 伍c es y g t e m 的所有内容。在您打开一个容器文件后,您可以处理文档包中的 任何部件。例如,您可以使用。伍c e0 | p e n ) a l 格式打开一个w o r d2 0 0 7 文档,定位表示 w o r d 文档体的l 部件,使用任何可以编辑l 的工具来修改这个部件,然后将x m l 部件返回到容器包当中,从而创建一个更新的o 髓c e 文档。 2 ) 部件 在一个o 伍c eo p 肌x m l 格式的z i p 包当中,文件的许多逻辑部件都作为单独的文件或 部分存储。这种模块化的存储方式是这种文件格式的主要特点之。模块化的特点是能够快 速的定位一个特定的部件,并且直接处理这个部件。比如,可以根据预期的业务需求,编辑, 替换,甚至删除文档的部件。 所有的o f ! f i c e 应用程序都共享相同的部件类型,例如缩略图,元数据,多媒体,和关系 部件。但是,也有许多部件是特定于应用程序的文档类型的。例如,e x c e l 当中的w o r k s h e e t , p o w e r p o 砒中的s l i d e ,或者w o r d 的页首和页尾。 8 内蒙古大学硕士学位论文 部件可以是不同的内容类型。用来描述m i c r o s o f io 街c e 应用程序数据的部件是以l 的方式存储的。这些部件遵循捌l 引用架构的定义,它定义了相关的o 伍c e 功能或对象。 例如,在一个e x c e l2 0 0 7 文件当中,表示一个工作表的数据可以在一个x m l 部件当中找到, 它将一个o m c e 架构附加到e x c e l 工作表当中。另外,如果在一个工作簿中包含多个工作表, 那么将会对每个工作表都有相应的一个l 部件存储在z i p 包文件当中。 有些部件不是以删l 的格式存储的。例如,o 伍c e2 0 0 7 文档中的图片,就是在文档包 中按照二迸制文件的形式来存储的( p n g 、j p g 及其它文件类型) 。但是可以通过2 5 小节介 绍的方法立即查看,编辑或者替换这种本地格式的图片。另外,以二迸制方式存储的部件是 a 项目和嵌入的o l e 对象。( 嵌入的o l e 对象是二进制的,只要相关的o l e 服务器提 供的是二进制的表示形式。例如,2 0 0 7m i c s o ro 街c cs y s t e m 嵌入的文档将它们的内容作为 其它包嵌入。) 在o 伍c e 产品中,o 伍c eo p e n ) ( 1 l 文件格式的实现有很多通用的部件,也有很多组件 是特定于每个产品的。e x c e l2 0 0 7 除了拥有每个o 伍c e 产品通用的部件( 例如l 数据部件, 关系部件,和多媒体部件) 以外,e x c c l 还为工作簿、工作表,以及像图表、数据透视图、数 据透视表等实体提供了单独的部件。在p o w e f p o m2 0 0 7 的文件格式中,使用了许多与其它产 品相同的部件,同时还使用了一些特定于幻灯片演示文稿的对象,例如幻灯片部件,母版部 件,演示文稿部件等。同样,w o 订2 0 0 7 也使用了关于文档属性、样式和格式、页脚、页眉、 注释等额外的部件。以w o r d2 0 0 7 为例,列举部分部件对应的x m l 文件: d o c u m 锄t x m l 包含了文档当中的数据( 文本) ,样式和字体设置,以及文档页面设置。 f o o t e r x m l 包含了有关文档页脚的信息,例如它们位于什么页面上以及相关的样式信息。 h e a d e r x m l 包含了与f o o t e r x m l 文件当中相类似的信息,但是它是有关页眉的信息。 s t v l e s x m l 包含了有关文档中样式的信息,例如字体大小,表格样式,和列表样式等。 3 ) 关系 部件都是单独的元素,它们组成了2 0 0 7 版本的o m c e 文档。使用关系,可以用来指定部 件集合之间的关联,从而形成实际的文档。关系是通过x m l 来定义的。关系指定了一个源 部件和一个目标部件之间的连接。例如,您可以通过一个关系,在一个幻灯片和一个图片之 问定义连接。关系被存储在文档容器的x m l 部件或者“关系部件”当中。如果一个源部件 拥有多个关系,所有后续的关系都将会被列出在相同的) ( 】l 关系部件当中。 关系在o 伍c e l 格式中扮演着重要的角色。每个文档部件都至少被一个关系所引用 o 伍c e2 0 0 7 试卷自动评分系统的研究及实现 着。关系的使用,使得我们可以发现一个部件与另一个部件之间的关联,而且无需查找部件 的内容。在部件当中,所有到关系的引用都使用一个r e l a t i o n s h i pi d 来表示,它允许所有部 件之间的连接,并且它与特定内容的架构无关。图2 2 所示为e x c e l2 0 0 7 工作簿中最高级别 的关系。 2 7 小结 图2 - 2 一个e x c e l2 0 0 7 工作簿中最高级别的关系图 f i g 吡e2 - 2 1 1 1 el l i 班e s t 一1 e v e ld i a g r a ma b o u te x c e l2 0 0 7w o d 【b o o k 本章较为详细地介绍了本文将用到的o 街c e0 p e n x m l 文件格式的相关知识。o 伍c e2 0 0 7 文档采用0 伍c eo p e n l 文件格式。 1 0 内蒙古大学硕士学位论文 第3 章0 m c e2 0 0 3 文档向o f ! i c e2 0 0 7 文档的自动转换 虽然当前有很多的o 伍c e2 0 0 3 自动评分系统已经开发出来,但随着o 伍c e2 0 0 7 的广泛使 用,开发一套更适合于o 伍c e2 0 0 7 的自动评分系统已经迫在眉睫。然而据了解很多学校开设 的计算机应用基础课的。伍c e 软件操作部分仍是以介绍o 伍c e2 0 0 3 版本为主,为了使。伍c e 2 0 0 7 的自动评分系统实现对o 位c e2 0 0 3 文档的兼容,有必要实现o 伍c e2 0 0 3 文档向o 伍c e 2 0 0 7 文档的自动转换。由于m i c r o s o ro 伍c es y s t e m 是向下兼容的,即o m c e2 0 0 7 是o 伍c e2 0 0 3 的延续和扩展,以及v b a ( s u a lb 蕊c 的一种宏语言,主要能用来扩展w i n d o w s 的应用程 式功能,特别是m i c r o s o f 【o m c e 软件) 与o 伍c c 应用程序中的w b r d 、e x c e l 和p o w e r p o i n t 之 间存在着密切的联系,故而可以通过编写v b 程序实现o 伍c e2 0 0 3 文档向o 伍c e2 0 0 7 文档的 自动转换。 3 1v b a 编程技术简介 a 是基于s u a lb 邪i c 发展而来的,它们具有相似的语言结构。s u a lb 嬲i c 是m i c r o s o f t 的主要图形界面开发工具,v b a 则是s u a lb a s i c 的子集。虽然a 宏语言程序无法脱离 o 伍c e 应用程序运行,但它提供了一个方法,我们可以将v b a 嵌入开发语言( 如v b ) 当中实 现读写构成o 伍c e 文档的各个对象、识别文档格式的目的。 在3 a 中,对象是封装有数据和代码的客体。对象的属性是封装在对象内部的数据,它 反映了对象的特征。a 中每一个对象都拥有许多属性。对象的方法是封装在对象中用来操 作对象属性的代码段。这些代码段对于用户来说是不可见的,也是不可改写的。用户在使用 对象的方法时,只需关心方法的名称及参数,无须关心方法的具体实现过程。由于一个o 伍c e 文档是由许多对象组成的,如果确定了各对象的属性既可了解o 伍c e 文档的结构和格式,同 样如果向对象实行方法就可以控制文档的格式。详见文献 2 1 】。 3 2 自动转换主要程序 编程实现o 伍c e2 0 0 3 文档转换为o 伍c e2 0 0 7 文档的一个前提条件是要在p c 机上装有 o 伍c e2 0 0 7 软件。同时,由于要对o 伍c e 的对象和属性进行操作,需要先设置的r e f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学英语讲职业的课件
- 59 选择性必修3 第九单元 第50讲 动物细胞工程
- 食品安全分公司设立与监管合同
- 金融创新产品绿色信贷借款合同示范
- 高端商务区餐馆租赁及商务合作合同
- 商业地产项目房屋租赁及市场营销合作协议
- 智能农业能源管理系统批发考核试卷
- 医药企业海外并购风险与盈利平衡策略考核试卷
- 农业收割机械制造市场分析考核试卷
- 医药研发信息化建设考核试卷
- 父母与高中生之间的协议书
- 2022年韶关市法院系统招聘考试真题
- 2022年江苏省射阳中等专业学校工作人员招聘考试真题
- 高中英语新课程标准试题含答案(四套)
- 危险品储存、运输、使用安全技术交底
- 公安院校公安专业招生体检表
- 警务辅助人员考试真题及答案
- 2023年安龙县体育教师招聘笔试模拟试题及答案
- GB/T 27922-2011商品售后服务评价体系
- GA/T 168-2019法医学机械性损伤尸体检验规范
- 卡特彼勒标杆研究报告
评论
0/150
提交评论