《文字属性》PPT课件.ppt_第1页
《文字属性》PPT课件.ppt_第2页
《文字属性》PPT课件.ppt_第3页
《文字属性》PPT课件.ppt_第4页
《文字属性》PPT课件.ppt_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 文字,1. 文字属性,在排版术语中,文字被称为字模。字模是一个传统概念。原指铸造的铅活字模型,现指印刷用字。 字模(文字)有三个属性:字体、字号、心身比。 字体:文字的书写样式 字号:字模边框的高度 心身比:字心与字身的面积比 过去铅字的心身比为98%, 照相文字心身比为92.5%。方 正书版和发排系统允许选择不 同的心身比。在其它条件相同 的情况下,采用不同的心身比 得到不同的版面效果。,基线:在排版时,同一行中的文字相对齐的线称为基线,横排时基线为文字的下边,竖排时基线为文字的左边线。 法线:通过上下边线中点的竖直线称为法线。 法线方向向上。 中线:通过左右边线中点的水平 线称为中线。 排成一行的文字也可以以中线 或以法线相对齐。,字模,中线,字身,字心,边框,法线,基线,1.1 汉字属性,汉字信息处理技术是汉字文字处理技术的基础,它体现在对汉字属性的处理过程中。汉字的属性包括汉字的字量、字频、字形、字音、字义等,对这些属性的信息化处理贯穿在汉字信息处理流程的各个阶段以及相关的技术考虑中。,1汉字的字量 在中文电脑中,选用或配备多少个汉字由所用的汉字编码字符集标准来决定。国家标准GB2312-80基本集共收录汉字6763个,其中常用字(一集字库)3755个,次常用字(二集字库)3008个。此外,国家标准的两个辅助集收录了稀用字和罕用字共16000余个。,2汉字的字频 上述汉字编码字符集中汉字的选用是建立在汉字使用频率的统计基础上。例如国标一集字库3755个汉字在通用文献中的使用频率是99.9%,加上二集字库一共6763个汉字的使用频率覆盖了通用文献应用的99.99。两个辅助集中的汉字的使用频率在万分之一以下。不过汉字的使用频率受时空的限制,在不同的时代背景下具有显著差异,在不同的专业领域中差异也很大。,3汉字的字形 在汉字的各种信息中,汉字的字形是最重要的一种。字形可以按照“汉字/部件/笔画”三个层次进行分解。汉字字形的分解方式是汉字的输入与输出技术、以及汉字字模生成的基础。,4汉字的字音 汉字的字音是汉字输入、排序的基础。此外,是汉语语音的自动识别与合成技术中处理的对象。汉语是一种单音节语言,在汉字中同音现象十分突出。最多一音达120130个字。 5汉字字义 语言的表现形式是“音”,其潜在内容是“义”,文字的表现形式是“形”,其潜在内容是“音”和“义”。每一个汉字都是多义的,对于语义歧义的处理是中文语音自动处理、机器翻译、自然语言理解等方面计算机人工智能技术发展的关键。,1.2 汉字的编码,汉字编码是一种以编码代替汉字的语言,即对汉字字形中的整字、部件或笔画分别以数字或字母代替,则字形就可以转换为一个数字串或字母串。这种转换为汉字编码。 编码要求:键数少,效率高、重码少。记忆量少、规律性强、操作简单。,1.3 汉字编码方案,1、字根代码类编码方案; 将一个字分解成若干基本单元,每个单元以字母代替,然后将这些单元按照一定规律排列起来,就是一串字母,也就是该字的编码。 2、字音代码类编码方案 利用汉字的字音对汉字进行编码。由于同音字较多,需要全部显示出来进行二次选择。,3、角形 汉字是方块字,每个汉字都可看成有4个角。对角码输入法将汉字的各种角形归纳为5种,这就是:横(一)、竖(丨)、点(丶)、叉()、角(),并分别用1、2、3、4、5五个号码表示。 4、音形结合,1.4 字形技术,计算机字形技术包括字形的信息压缩、存储、还原、缩放等一整套处理技术。 点阵字体 把一个汉字写在一张坐标方格纸上,区别有笔画处和无笔画处,空白处记作0,黑点处记为1,这样由0或1组成了这个汉字的点阵,顺序把点阵排列记录下来,形成一组数字,即为该汉字的字形信息,这就称为点阵成字。 点阵字库是把每一个汉字都分成1616或2424个点,这类点阵字库汉字最大的缺点是不能放大,一旦放大后就会发现文字边缘的锯齿。,矢量字体 矢量字体保存的是对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在显示、打印这一类字库时,要经过一系列的数学运算才能输出结果,但是这一类字库保存的汉字理论上可以被无限地放大,笔划轮廓仍然能保持圆滑,打印时使用的字库均为此类字库。, 曲线轮廓字 (True Type字和 Postscript 字 )这种字库描述采用二次或三次曲线作为基础,用特殊的手段保证在平滑过渡点的连续性。这种字库解决了前几代字模存在的问题,不仅连续性好,字形美观而且变化丰富,不易走形。更好的符合印刷及高质量输出的要求。,1.5 字形压缩技术,对精密汉字字库的存储则需要大量的存储空间。为了节省空间,往往采用字符压缩的方法来存储。 压缩点阵存储法 基本原理是把汉字字形看作是简单的笔画组成,采用矩形或其他基本图案进行编码、存储 。 压缩点阵的特点:是简单直观,硬件比较简单,平均压缩率在40左右。对分辨率高、字形尺寸较大的汉字,其适应变化能力较差。,矢量轮廓压缩法 基本原理是把汉字看成由两维构成的平面图形,每一笔画是由起点、终点位置的一条曲线组成,用矢量(直线、折线段)逼近字形笔画轮廓,记录下矢量线段的坐标、长度,然后用一组代码来描述汉字字形的信息。 曲线轮廓压缩法 为了解决矢量字体放大后的锯齿现象,一种用数学上的二次、三次曲线来代替一次曲线,并配合使用曲线和直线来描述字符轮廓的曲线字形压缩方法应运而生,即称为曲线轮廓压缩法。,1.6 字库,汉字字形在计算机中是一组数据信息将所有的字形数据集中在一起,就构成了计算机字库,它是集中存放的字形信息的地方。,Windows使用的字库也为以上两类,在FONTS目录下, 如果字体扩展名为FON,表示该文件为点阵字库,扩展 名为TTF则表示矢量字库。点阵字库文件的图标为一个 红色的“A”,矢量字库图标是两个“T”。,1.7 字形的质量和精度,组成汉字的点越多,表现的字形越美观,数据量就越大,存储、还原越难。实际应用中,字形精度要根据用途和需要合理的选取。通常屏幕显示为16*16或24*24,针式打印机为24*24或32*32,激光、喷墨打印机为40*40或64*64点阵。(下图为16*16和48*48),曲线轮廓字体的输出过程实际上是描绘路径元素和对其进行加网填充的过程。 从原理上讲,曲线字体可以被任意地的放大或缩小,不会产生除尺寸以外的变化。但当字体要在光栅设备上输出时,再精确的字体轮廓描述最终还是要扫描转换成离散的点阵表示。字体在扫描转换过程中的舍入是不可避免的,这对中等字号以上的字体或许不会造成太严重的问题,但对于小字号的字符在输出或在低分辨率设备上显示时,如果对舍入不加控制,则将造成字体还原时出现笔画不均、粘连或断笔等明显的字体失真现象。而在出版物中的正文通常使用的都是小字号,输出还原小号字时需附加小字还原时所需的控制信息,否则这种字库是不能用于印刷的。,1.8 字符的控制信息技术,Hinting技术 为了解决曲线字体还原失真现象,PostScript语言引入了控制信息技术,即Hinting技术。该方法将字体的重要几何特征预先测量并记录下来,作为字体描述的辅助信息与字体一起保存。还原时,字体辅助信息与字体轮廓描述数据一起提供给字体还原程序,还原程序则根据这些辅助信息对字体轮廓变化时的舍入进行控制,使还原出的字符能保证重要的几何特征不被破坏。,汉字True Type字体的控制信息特点 对汉字True Type字体来说,实施Hinting技术实质是解决输出时小字号汉字的掉点现象,主要问题是: 控制重要笔画的宽度。 控制重要笔画间的距离。 控制拐角间的对称性。 保证字符的结构特征。 保证笔画不丢失。 保证字体清晰。,1.9 字体,Type 1字体 该字体技术是20世纪80年代中期Adobe公司随页面描述语言PostScript的诞生而一起推出的。是一种PS字体,采用三次Bezier曲线描述字符轮廓,数据量小。 在使用时,需要PS打印机字体、至少一种屏幕字体以及ATM(Adobe Type Manager Adobe字体管理程序。可在屏幕上显示各种字号的字体和在非PS打印机上打印),TrueType字体 该字体技术最早由Apple和Microsoft公司联手推出。是页面描述TrueImage中的字形描述方法。采用B-Spline二次样条曲线描述字符轮廓。还原速度快,可以适用于任何打印机,支持跨系统。没有显示字库、发排字库之分。,Type 1字体和TrueType字体的比较。 Type 1字体采用三次Bezier曲线描述字符轮廓, TrueType字体采用B-Spline二次样条曲线描述字符轮廓。 Type 1字体的数据量比TrueType字体的数据量小。 Type 1字体的还原速度比TrueType字体的还原速度慢。 系统使用Type 1字体时必须有ATM(Adobe Type Manager)来进行管理,而Mac OS和Windows都内置了TrueType字体解释器,都支持TrueType字体。 Type 1字体是通过ATM提供给应用软件使用的,它被挂接到系统时需要额外的内存,TrueType字体由操作系统来直接管理,管理比方便。,2. 文字的字体规格,印刷体字:用于印刷排版的字。印刷体字具有美观、字形规范、笔画统一、大小一致的特点,非常方便人们的阅读。 从事文字排版工作,必须具备字体与字号知识,能够做到以下几点: 正确地识别各种印刷字体,了解各种字体基本特征及相互之间的区别。 熟悉各种出版物在正文、标题上用字的一般规则,掌握各种印刷字体的使用和搭配。 比较准确地掌握字大小的使用规则。 掌握字形的常见修饰方法。,2.1 汉字的印刷字体,1. 常见基本汉字字体 在汉字的印刷字体中,最常用的基本字体有宋体、仿宋体、楷体、黑体四种。,方正飞腾排版系统,方正飞腾排版系统,方正飞腾排版系统,方正飞腾排版系统,仿宋体字 特点:笔画比较细瘦,横竖笔画粗细一致,横笔画略向右上方倾斜,起笔和落笔都有顿角,笔锋十分尖锐。仿宋体字的风格独特,挺拔俊秀,清晰悦目,适用于排印诗词、古籍、说明注释、小标题等。,宋体字 特点:笔画的起笔和收笔都有装饰角,转折处有顿角;竖粗、横细,竖画比横画粗三分之一到五分之一。宋体字横平竖直,形态方正,饱满匀称,笔法严谨,风格独特,美观实用。 宋体是最通行的汉字印刷字体。常用于书籍报刊正文。,黑体字 特点:笔画粗细基本一致,但中间略细,两端略粗,方头方尾,转折处没有顿角。黑体字的字形端正古朴,浑厚有力,庄重醒目。是一种最为通用的标题字。,楷体字 特点:是笔画粗细均匀,流畅自然,如同毛笔书写出的。字形上朴实端正,易于认读。适用于通俗书刊、小学课本、幼儿读物、也适合排图书报刊的标题、信函等。,2. 其他汉字字体 除宋、仿宋、楷、黑四种基本字体外,电子排版系统还有许多种印刷字体可以供人们选用,如行楷、魏碑体、隶书、姚体、幼圆、彩云、舒体等。 3. 汉字印刷字体的阅读适性与印刷适性 印刷体汉字最大的特点,是印在纸张上供人们阅读的,因此必须满足两个基本要求:一是适合阅读,专业上叫“阅读适性”好;二是适合印刷,专业上叫“印刷适性”好。,2.2 印刷排版中的外文字,1. 外 文 文 字,2. 外文字体 国外的一些电子排版系统将多种不同的字体集中在一起,叫字体族。 Time字体族、Heivetica字体族、Courier字体族 现代罗马体:Times Roman,俗称白正体; 意大利体:Times Italic,俗称白斜体; 黑体:Times Bold,俗称黑正体。 字的间隔处理、合成(叠)字(Kerning)、分词(Hyphenation),2.3 印刷排版中的数字,2.4 标点符号的种类及排法,1. 标点符号的种类,全角(全身):文字排版中标点符号在版面上占一个汉字的位置。 半角(对开)占半个汉字的位置。 具体排法有下面几种形式: 开明制 仅句号、问号、叹号占一个汉字的位置(全身),其它标点符号全部占半个汉字位置(对开)。 全身制 所有标点符号全部占一个汉字的位置。但当两个标点符号排在一起时,前一个采用对开,以免过于稀疏。,2. 标点符号的形式及排法,全部对开制 全部标点符号都排成对开。 竖排形式 句号、问号、叹号、逗号、顿号、分号和冒号放在字的下方偏右; 破折号、省略号、连接号和间隔号放在字下居中; 引号改用和; 着重号放在字的右侧,专名号和浪线式书名号标在字的左侧。 破折号、省略号 这一类符号比较特殊,只能是全角的。,3. 中外文混排时标点符号的用法 混排中要照顾到两种不同文字的排法规则,使用标点符号的原则是: 汉字后面使用汉字的标点符号; 外文后面使用外文的标点符号。,4. 容易混淆的符号,2.5 排版中的线型、花边及底纹,1. 线型 排版中使用各种线型,主要作用是分隔、分界以及版面的修饰。常见的有正线、反线、双线、文武线、曲线、双曲线、点线、花线等。,2. 花边 花边用作版面的修饰。电子排版中,花边可以自动围成封闭或不封闭形多种形状。,3. 底纹 底纹也叫网纹,是版面修饰的一种大面积图案。,2.6 印刷文字的规格与制式,印刷文字有大、小变化,电子排版中字形大小的计量,目前主要采用印刷业专用的号数制、点数制和级数制。尺寸规格以正方形的汉字为准,对于长或扁的变形字,则要用字的双向尺寸参数。,字号: 号数制:活字排版时设定。号数越大,文字越小。 级数制:照相排版时设定。1级=0.25cm 点数制(磅数制):计算机排版应用。 1p=0.35mm=1/72inch 派卡制:很少使用。 1pica=12p=4.21752cm,2.6.1 号数制,号数制是将一定尺寸大小的字形按号排列,号数越高,字形越小。,优点:简单、方便,使用时无需关心字形的实际尺寸。 缺点:字大小受号的限制,大字无法用号数来表达;号数不能直接表达字形的实际尺寸;字号之间没有线性倍数关系,折算起来不方便。,2.6.2 点数制 点数制是国际上通行的一种印刷字形计量方法。“点”是传统计量字大小的单位,也称“磅”(Point),一般用小写的英文p表示。换算关系: l p=0.35146毫米0.35毫米 1英寸72p 点数可以直接反映印刷字形的尺寸大小。 点数制比较适合电子排版系统,字大小可以灵活地无级缩放。 2.6.3 级数制 级数制是手动照排机实行的一种字形计量制式,它是根据这种机器上控制字形大小的镜头的齿轮,每移动一个齿为一级。 1级=0.25毫米,1毫米=4级,2.6.4 制式换算及字号系列,2. 号数制间的关系 某几种字号之间具有一定的整倍数关系,构成一个号数系列。总共可分为5个号数系列: 系列一:初号(42p)、二号(21p)、五号(10.5p)、七号(5.25p) 系列二:小初号(36p)、小二号(18p)、小五号(9p) 系列三:一号(27.5p)、四号(13.75p) 系列四:小一号(24p)、小四号(12p) 系列五:三号(15.75p)、六号(7.875p),2.7 字形的变化和修饰,2.8 文字的基本排列形式,2.8.1 文字的密排、疏排与紧排 紧排:让字与字之间的排列有一点重叠。 密排:正常的排法,就是不与字之间无间隙挨着排列。 疏排:字与字之间均匀地空开一些间隙。,2.8.2 横排与竖排,横排字符是由左向右排列成行,字行由上向下排列的方式。 竖排是版面上的字符由上向下、字行由右向左排列的版式。,横排文字大都左边对齐排,文字转行有换行和换段之分。字行排列还有右齐、居中与撑满和强制撑满等形式。 居中:字行排在一行的中间位置。 标题、表格、公式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论