谈数学论文排版技术与全文上网的实现.pdf_第1页
谈数学论文排版技术与全文上网的实现.pdf_第2页
谈数学论文排版技术与全文上网的实现.pdf_第3页
谈数学论文排版技术与全文上网的实现.pdf_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2 0 0 2年 1 1 月 Nov 2 002 华南师范大学学报 自然科学版 J OURNAL OF S OUTH CHI NA NORM AL UNI VERS I TY N A T U R A L S C I E N C E E D I T I O N 2 0 0 2年第 4期 No 4 2 O O2 文章 编 号 1 0 0 0 5 4 6 3 z o o 2 o 4 0 1 2 2 0 5 谈 数 学 论 文 排版 技 术 与 全 文 上 网 的 实 现 翁佩 萱 肖存涛 华 南师 范大学 数学 系 广东广 州 5 1 0 6 3 1 摘要 探讨 了数学 文章 编辑 排版 中的技术 问题 对 于 图文混 排 图 像格 式 转 化及 全 文上 网 的实 现 提 供 了切 实可 行 的方 法 关键 词 L a T e X 图 文混排 P D F文档 数 据库 中 图分 类号 G 2 3 o 7 文献 标识 码 A RES EARCH oN o0 MP 匝A n ON A ND ARRANG 匝NT 0lF M I 1 n 1 AL AR n CI ES AND TECHNoI oG 0lF FULL TE X r UPI D ADI NG WENG P e i x L l a n XI AO Cu n t a o D e p a r l m e n t o f Ma th e m a t i c s S o u t h C h i n a N o r ma l Un i v e r s i t y G u a n g z h o u 5 1 0 6 3 1 C h i n a Ab s t r a c t T he t e c h n i q u e o f ma t he ma t i c a l a r t i c l e s c o mp i l a t i o n i s s t ud i e d a nd a p pr o a c h e s o f g r a p h t e x t mi x e d a r r a n g e me nt a n d f o r ma t c o n v e r s i o n a r e s up p l i e d Ke y wor ds l a Te X Gr a ph Te x t mi xe d a r r a n g e me n t P DF Do c u me n t Da t a ba s e 数学 论文属 于学术 论文的范 畴 其研究往 往具有超前性 对于推动社会发展 和科学进 步起 着极 为重 要 的作用 各种数学类学术期刊作 为相应科研成果 的载体 反映 了当前 数学 的最新 科 研动态 为数学工作 者开展 学术交流提供 了平 台 因而其 出版工作 随着信息社会 的进步 和网络 的飞速发展 显得越来越重要 1 数学论 文的编辑与排版 1 1 数学论文 的特 点及排 版软 件的选择 数学论文往往 通过大量复杂 的数学公式 表格来 推导定理 的证明 辅 以插 图形象 地说 明 问 题及其应用 另外数学论文包含许 多由键 盘无 法直 接输入 的特 殊字符 标题 摘要 关 键词 参 考文献 以及章 节编排等在编辑排版 中均采用特 定 的数学格 式 国家所 制定 的排 版标 准 中对 数 学符号 公 式 图形 和数据等都有一整套严格 的准则 和规定 从 而使得 数学 文章 的排 版工作 有 其 明显的特殊性 在我 国 当前广泛应用 于科技排 版 的软件 有 T e X I a T e X w0 北 大方 正排 版 系统 等 Wo r d及方正排版 系统在 文字处 理及图文混排方 面具 有非常 强大 的功能 尽管 Wo r d具 收稿 日期 2 O 0 2 0 8 3 0 作者简 介 翁佩 萱 1 9 5 1 一 女 广东潮 州人 华 南师 范大学 教 授 博 士 博 士生 导 师 肖存 涛 1 9 7 9一 男 山东 滨 州人 华 南 师范 大学 2 O 0 0级研 究生 维普资讯 有 所见 即所得 的良好性能 而方正 系统 事实上也 是 目前 占据 国 内市 场最 大份额 的专 业排版 软件 然而它们在复 杂数学 公式和数学专 有符号处理方 面显得力 不从心 其 对数 学论文 的排版 效果要 比 T e X L a T e X逊 色很 多 T e X最初 由美 国斯坦 福 大学 的 D o n a l d K n u t h开发 后来 L e s l i e I a mp o r t 在 T e X的基础 上开发出 I J a T e x版 本 由于 I J a T e x可 以得 到标 准漂 亮 的数学 公式 对 于 数学格式 专有符号处理等方 面也 有杰 出表 现 现已经成 为数 学论文 排版 的标 准语言 并 已发 展 到 L a T e X 3 0版本 而 e X 2 为当前最为 流行 的版本 1 2 T e X L a T e X系统 的优点 1 强大 的科技排 版功能 L a T e X设 定 了数学 论文 的版 面格式 这使得 我们 不 用具 体考 虑 文 章 的版面设置 只需完成简单 的输 入工作就行 当然也可 以利用 LaT e X所提供 的命令定制合 适 的文章格式 以适 应不 同的排版需 要 在对 数学公式 的排 版效果 上 LaT e X要 明显优 于 wo 耐 利用 Wo r d的公式 编辑器编排 出的段 落总是难 以达 到预 期 的文 章格式 在 文 章字体 格式 字体 大小设 置 以及数学公式 的修改上 工作量很大 然而 LaT e X配备有丰 富的字符集 采 用统一 的格 式处理 有关字体和公式 的设置 而且非 常方便 后继 的修 改工作 LaT e X还具有灵 活 的 自动编号 功能 可 以对文章 中出现的数学公 式 参考文献 图表等 自动编号 以方便文 中对 这些编号 的引 用 这在引用较 多的文 章编排 中非常实用 另外 LaT e X可 以 自动生成文 章 目录及索引 2 良好 的开放性 LaT e X为免费 的源代 码开放 软 件 团体 和个 人都 可 以根据 需要 对其 进 行 修改和扩充 这也是其能够发展 壮大并为各 国科技 界所接受 的重要 原 因之 一 例如 美 国数 学会 A MS 根据 自己的排 版格式开发 了 A MS T e X和 A MS LaT e X 扩 充 了数 学符 号集 增 强 了多行公式 的对齐功 能 作为 向美 国数学会所属 杂志投稿 的标 准软件供科技 工作者使用 当前 许 多 国际性 的数学期 刊均 接受 LaT e X格式 的投稿 为适应 中文排 版 的需要 中科院 的张林 波等 人开发 出 中文 r e x C C r 从而使得 LaT e X的中文 处理 功能得 以实 现 利用 C C T系统 中的造 字程 序 P Z E X E可 以简便灵活 的拼造出我们所需要 的汉字 再通过 建立用 户字库 我 们便可 以 在 源文 件 中引用 自己拼制 的汉字 由于 P Z E X E所造汉字为矢量结 构 可 以满 足不 同分辨率 的 要求 其字形质量完全 可以达到正规 出版物的标准 1 3中文 L a T e X的选择 与应 用 LaT e X系统 实际上是 一种编程语 言 首先要建立 源文 件 然后调 用编译 命令得 到我们想 要 的排版结果 对于源程序 的编辑 可以采用任何不会 向文件增 加不可见控制字 符的文本编辑器 例如 E d i t P l u s U l t r a E d i t Wi n E d t 等 利用这 些软件 自身 的对 外接 口模块 我们 只要对 其作一 系 列设 置 便 可以得 到一个集成 的编译 环境 在 当前 的 D O S和 WI N D O WS操作 平 台上 主要有 两 种 比较流行 的免费 中文 LaT e X系统 C C T e m T e X与 C T e X Mi k T e X 其 代表 软件 为 E d i t P l u s e m T e x 或 U l t mE d i t e m T e X 和 中文套 装 2 0 即 n E d c k T e x 这 两种软件各有优 缺点 1 C C T e m T e X软件 体积很小 编译速 度很快 但是 其更新较 慢 对字 体 的使用 也较 困难 在应 用 E d i t P 1 u s e m T e X或 U l t r a E d i t e m T e X编辑 源程 序时要 手动设置 编译 和视 图命 令及工具 栏等选项 l 参考 网站 h t t p 2 0 2 3 8 6 7 7 8 t e x g u r u 不太适 合初 学 者使用 E d i t P l u s 还会 提 供显示 行号和 自动补足功能 便于错 误的快 速查找定位和 盲打 的实现 2 C T e X Mi k T e X支持 C C T和 C J K宏包 更新速度快 字体使用非 常方便 可以实现 D V I 文 件到 P S文件 P S到 P D F D V I 到 P D F的转化 也 可以直接 生成 P D F文档 其 D V I 查看程序 Y A P 比 C c t w i n 3 2功能更加强大 能够 直接 浏览 其 中插 入 的图形 以及颜 色 而 且 还具 有 反 向搜 索 功 1 23 维普资讯 能 但 它的编译 速度较慢 且软件 体积庞大 安装 时间较长 不过系统安装 后会 自动加载相应 的 编译命 令和视图命令 不用对 系统进行配置 工具栏 中还 提供 了特 殊字符 快速 输入 的模 板 减 少 了符号记忆的工作 而且 源文件名 中的普 通字符 和格式 字 符采 用不 同的颜 色显示 为错误 的查 找工作提供 了便利 由于其 功能强大又 比较智能 因此 比较适 合期刊排版工作或供初学 者 使用 C C T系统在处理 中文 文章时 首 先调 用 c c t e x e预处理 程 序将 源 程序 文 件名 后缀为 c t x d o c u me n t c l a s s 为 c c t a r t 类 转化 为 l a T e X能够处理 的源文 件 后缀 为 t e x 然后再调用 l a T e X命 令 l a t e x 2 e e x e 对其 进行编译生成 最终排版文件 D V I 文件 为 了应用方便 我们可 以制作 一个 简单 的批处 理文件 1 将 上面 的步骤 简化为一个命令 我们还经 常用 另一种方法来 处理 中文文 章 即加 载 C J K宏 包 C J K是 由 We me r L e mb e r g专 门为 l mT e X 2 设计 的可 以处理 中 13韩 三种 文字 的样 式宏 包 利用 这种 方法 可直接 调用 l a T e X 命令编译 而不需要像 C C T进 行转化 源文件仍采用英文 l a T e X格 式 后缀 名为 t e x d o c u me n t c l a s s 为 a r t i c l e 类 只需要 向文件 中加入相 应命令 即可 例如 d o c u m e n t c l a s s a r t i c l e u s e p a c k a g e C J K b e g i n C J K G B K s o n g e n d C J K e n d d o c u me n t 1 4 L a T e X 中插 图的处理方法 插 图处理是计 算 机排 版 的重 要 内容 l a T e X提 供 了众 多 的宏 包来 解决 图像 插 入 浮 动排 版 图文混 排 等 问题 例如 g r a p h i c s g r a p h i c x e p s fi g w r a g fi g等 1 a T e X支 持插入 的图形 为 E P S E n c a p s u l a t e d P o s t S c r i p t 格式 通常 的应用 软件 如 Ma t L a b Ma t h e m a t i c a A u t o C A D均 可生成 E P S 格式 的图形 对于非 E P S格式 的软件我们 可 以利用 C o r e lDR A W I m a g e C o m m a n d e r 等进行格 式转 化 C o r e lDR AW 是基于 向量 的图形 软件 利用 其作格 式转化 可 以保证 图像 的精确 度 获得 满意 的 图形后我们 可以采用如下命令格 式完成其插入 和浮动排 版 b e g i n fi g u r e c e nt e r i n g i n c l u d e g r a p h i c s fi l e e p s c a p t i o n T h i s i s a n i n s e r t e d E P S fi g u r e l a b e l 舷 fi l e e n d fi g u r e 2 数 学 论 文 自主 全 文上 网分 析 因特 网的迅速 发展使信息传播速度进一 步加快 传播 范围和对外影 响 1 3益扩大 作 为新的 信息载体 各 种期刊 的网络 出版正发挥着越来越重要 的作用 自主全文上 网的关键在 于实现下 面两大技术 一是文档格式 的选择和转换 3 二 是数据 库信息存 储 和中文全文 检索技 术 的实 1 2 4 维普资讯 现问题 例如 数学学报 便成功地解决了这两个 问题 实现了杂志的网络出版及全文上 网功 2 1 数学 电子 文档 格式的选择和转换 当前 电子期 刊全 文上 网采用 的格 式不外乎 以下几 种 H T ML格式 P D F格式 C A J格式 图 像扫描方式 S GM L X ML格式等 图像扫描方式数 据量大 占用 大量磁盘 空间 不利 于 网络 传输 和在线 阅读 采 用 C A J格式 的文件虽然有着 较高 的压缩 率 但 C a t 格 式 的转化 需 要专 门的软件 而且其转 化 过程 相对 复 杂 不太适合数学 论文 的 自主上 网 H T M L是 网络上最 主要 的标记语 言 其 简便 性 灵 活性 和动 态性使其被称 为 网络 上数据信息存 取 的主要格式 是处 理纯文本 文件 的最佳选择 但 是 H T ML 不支持数学公式 在处理含 有表格 插 图 特殊符 号和 复杂 公式 的文章 时 经 常 出现字符 丢失 图文错位等现象 难 以保持 原文章的版面格式 5 S G ML是 I S O颁 布的文献 生产 和管理 的国际 标准 它 可 以将 文 本 图形 视 频 文 件等 原始 资 料组 装 在 同一个 文 件 中 通 过 D T D D o c u me n t T y p e D e fi n i t i o n 来 定义文件 结构 增加文件标 识 用 以反 映文件结构 单元 X ML采用 X ML D T D 来 定义 文件结 构 的组 织规 则 即去除 了 S G ML的复杂性 又表现 出极 大的灵活 性 是今后 网络 出版的趋势 但 是 当前 的浏览 器软件如 Mi c r o s o ft I E和 N e t s c a p e N a v i g a t o r 均不 支持 S G ML 而且 编写结构和 内容都较好 的 D T D文件也 比较 困难 6 P D F是 A d o b e公 司发布 的用 于全 球 电子 文档 的开放 式 标 准 它 可 以将文本 图形 公 式封 装 在一起 完整 地再 现源文档 的版面格 式和 字体颜 色 而且 P D F文 档可 以通过 服务 器 光 盘 电子邮件等各种介质发布 P D F文 档的浏览 软 件 A c r o b a t R e a d e r 为免 费软 件 任何 人 都可 以免 费下载 另外 P D F格式还有 以下 特点 1 忠实 性 P D F与运行环境和硬件 无关 使用 者 可 以使用任何 操作 平台 任何 浏览 器 任 何显示 器 任何 打印机 创建 浏览 或 打印 P D F文 档 P D F将 忠实地再 现原稿 的每一 个字 符 公 式 图像 和色彩 2 浏览 的高效性 P D F文 档 的浏览 除 了利 用 A c robat R e a d e r 之 外 还可 以通 过 A c t i v e X控 件 把 p a 1 O C X安装 到 Wi n d o w s的 A c t i v e X组 件文件 夹 中 利用 浏览器来 查看 压缩后 的 P D F文 档 比源文档要小 有利 于网页的快 速显示和下载 另外 P D F文档 还可 以通过 制作 书签 设置 超 级 链 接 提 高 浏 览 的 效 率 3 不 同级 别的安 全保护机制 P D F文档具有 阅读 批注 数字签名 防打印等 功能 还可 以 设 置敏感文件 的访 问权 限 因而有着 良好 的安全性能 有利 于电子 出版物著作权 的保护 4 P D F文档 支持全文搜索 从数学文档 到 P D F格式 的转换非 常简便 例如利用 中文套装 2 0可 以直接 将英文 T e X L a T e X源文件 生成 P D F格式 对于 中文 T e X L a T e X文章可 以先生成 D V I 格 式 进而转 化为 P D F格 式 当然也可 以利用 A d o be A c robat 提供 的 A c robat D i s ti l l e r 或 P D F Wr i t e r 虚拟打 印出相应 的 P D F 文档 正是 由于 P D F格 式具有上述优点 它是完全 可 以胜任 数学论文 上 网的电子文 档格式 例 如 h t t p e j d e m a t h s w t e d u 就是利 用 P D F格 式实现 了全文上 网 2 2 数 据库和 中文全 文搜索技术 数据 库在全文上 网过程 中起 着至关 重要 的作用 它建立 了数 据库到文章全文 的链接 并为 检索提供关键数 据 文 7 l 8 J 提供 了实现全文检索 功能的可行性方法 1 25 维普资讯 首先我们要建立一关 系数据库来存储论 文 的重 要信 息 由于 A c c e s s 和一些 低 版本 的 O r a c l e数据库无法实现 中文 全文 检索功能 所 以这里 我们选 用 O r a c l e 8 0版本 该 数据 库我们 建有 标题 关键词 摘 要 作 者 名 地址 期 刊名 卷 期 图书 分类号 等重 要字段 为检 索工 作提供 数 据 但我们不 会把文 章全文存人数据 库 因为 这样数据 库将 会变得 过 于庞大 从 而影 响到存 储 和检索 的速度 解决 方法是 在数据库 内我们 设置一特 殊字 段来存 储相 关文 章 的地 址 用户 通 过此地址来访 问文章 的全文信 息 进行 浏览

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论