




已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
文献资料课题: 古汉字视觉设计研究专 业 艺术设计(平面) 学 生 姓 名 吴少春 班 级 B平面062 学 号 0611240203 指 导 教 师 黄本亮 专 业 系 主 任 季 荣 完 成 日 期 2010年3月29日 甲骨文会意字构形模式传统小学有“六书”,即:象形、指事、会意、形声、转注和假借,这是古人对汉字结构方式的一种概括和总结。“会意字”是传统“六书”中的一种结构类型。一、会意字界定许慎说文解字最早对六书进行了界定,其中:“会意者,比类合谊,以见指撼,武信是也。”但是许慎许慎所举的这两个字,多少有些问题。说文武字条:“楚庄王日: 夫武,定功戢兵,故止戈为武。”不确。甲骨文“武”字作;,所从止乃足趾之趾本字,甲骨文从止多表示行动之意。于省吾谓“武本义为征伐示威,征伐者必有行,止即示行也,征伐者必以武器,戈即武器。”案于说可从。“信”,人言为信,表示说话人要言而有信。大多数学者认为“信”字是形声字,不是会意字。郑樵六书略指出:“象形、指事,文也。会意,字也。文合而成字。”也就是说,会意字是一种由象形、指事等独体之。文”,组合而成的一种合体之“字”。 他已注意到了会意字结构上的特点。戴侗认为,“何谓会意?合文以见意,两人为从,三人为众,两火为炎,三火为众,由此是也。”戴侗所谓的会意字只是会意字中的一部分。段玉裁说文解字注指出:“会者,合也。合二体之意也。一体不足以见其义,故必合二体之意以成字。”甲骨文、金文等古文字资料的出土,为汉字结构研究提供了新的材料。现代文字学家开始认识到,用传统六书分析古文字形体,有一些“不精确”之处固,应该建构新的汉字结构理论。唐兰先生最早提出了“三书说”,即象形、象意和形声。陈梦家先生在殷墟卜辞综述里提出了新的“三书说”,即象形、假借和形声。裘锡圭先生基本同意陈先生的意见,但提出改象形字为表意字,提出了表意、形声、假借“三书说”。裘先生的三书说,把传统的“会意字”归入表意字类型中。他认为,“凡是会合两个以上意符来表示一个跟这些意符本身的意义都不相同的字,”都可为会意字。笔者认为这种看法颇为精到。二、甲骨文会意字构形模式分析拼音文字是线性排列的,汉字则不同。汉字在形体上表现为平面展开的状态。这种平面展开的形体特征,早在甲骨文时代就已经比较固定了。在汉字发展的过程中,这种形体特征也只是被调整和改良过,而没有被废除,平面性是汉字形体的主要特点。郑樵认为,会意字“有同母之合,有异母之合”,但“主意则一”也,这种观点是对许慎“比类合谊,以见指掇”的创造性的阐发。这里,我们将从构形方面,对甲骨文中的会意字进行分类。借鉴传统分法,首先将甲骨文中的会意字,分为两大基本类型:一类是同符会意字,一类是异符会意字。分别举例分析如下:1同符会意字同符会意字,即郑樵所谓“同母之合”,就是通过重复同一字符以指向新意义的会意字。一般来说,字符数量不同,字义也或有不同。两个相同字符组合成的会意字,通过两个字符的并列,可以表示字符意义的类聚。有些同符会意字所表示的字义,并不是字符意义的类聚,而是表达与字符义相关的某种意义。有的同符会意字,由三个或三个以上的相同字符组合而成。2异符会意字异符会意字,即郑樵所谓“异母之合”,是指通过不同字符的组合,来指向新意义的会意字。甲骨文中的会意字绝大多数是异符会意字。这类字的构成比较复杂。根据字符的性质,我们将异符会意字初略地分为:比形会意字和比义会意字两类。比形会意字就是通过形符比拼构成的会意字。比义会意字,是指通过义符意义上的联系构拟出的会意字。下面,我们对以上所分会意字类型,分别加以说明。A比形会意字在甲骨文会意字中,这类字的数量较多。字形往往是几个图形的组合,通过图形间的形象关系,来表现一种情境或者状态,从而表达某种动作或行为的语义。这类会意字的图画意味较浓,细节描绘性较强,字义对字形的依赖很强。正因为如此,有学者认为这类会意字是复合象形字固。但从图形的拼合产生了新的意义这一点来看,我们认为这类字更多地具有会意字的特征。因为是以字符本身的形象来参与构意的,我们认为划为“比形会意字”更合适。B比义会意字“比义会意字”利用字符义来构字,换言之,这类会意字的字符是义符。与“比形会意字”相比,这类会意字的图画意味相对较淡,而字符之间逻辑上的联系加强了。需要明确的是,以上两类会意字之间,并没有截然清晰的分界点。因为在甲骨文里,“有些由两个以上意符构成的字,它们所用的意符究竟应该形符还是义符是两可的。三、结语“六书” 是古人对汉字结构方式的一种概括和总结。但是,处于汉字形成初级阶段的甲骨文的形成和构造是相当复杂的。相应的,甲骨文中会意字的构形模式也是错综复杂的。总的来说,甲骨文中的会意字构造模式有两种,即同符会意字和异符会意字。其中异符会意字又包括比形会意字和比义会意字两类。浅论汉字的联想特性张璇秦瑞四川大学吴玉章学院汉字初始草创到尔后的演化构拟 孳乳衍变中所反映的华夏各族人民的人文背景 语言习惯和思维结构都延续在文字的传承与应用之中 汉字的表意手段是在独体字的 依物象形 法上扩充到会意字的 比类合谊 法及 形声兼备 法从而 合文为字 的创造新字方法趋于主流 本文试从汉字的形体结构所引发的探求造字初义是所进行的联想 由本义到寓意扩大化联想 由活生生的事物抽象到符号化过程的联想三方面来讨论。一 从形体结构推究造字初义的联想从形体结构推究其原始义不失为一条正路 如汉字中的则 字 从金文来看 它左边的构件是烹煮食物的鼎的象形右边构件则象刀之形 但是 说文解字 的解释确是 则 等画物也 从刀 从贝 贝 古之物货也 由于 说文 作于东汉故未能解释出古 则 字字形结构本身所反映的词义特点 若返回其金文字形 则可发现 无论是鼎还是刀 都是远古人切煮食物的常用工具 日积月累的生活经验凝固了此字的字形 古人为此字立型 则有了一种从日常的烹饪经验中总结了技术和规律的共识 以 说文 中所显示的制作器物的过程为参照 朱骏声在其 说文通训定声 中曾指出 贝者 鼎省刀者 刻画鼎纹也 鼎者重器 故以为科则之偁 综合 则 字早期字形的解读和说文中 比照样子刻画器物 做东西 的现实经验 我们可以得出则字就具有从现实生活中提取同一标准制作 处理的意思 我们的先民事实上就是以简单明晰的汉字形体来总结 记录自己生活中得到的启发 因此 我们必须了解汉字的初始形体结构的面貌 结合文字理论 考古材料 历史文献 通过想象力 弥合自己与古人的时空距离 以求得对本字的真知。二 本义 寓意 的联想本义和寓意的层层递推 演变规律也是可以通过联想来实现沟通的 如汉字中的 天 字 其甲骨文的形体中 其上半部分的为一圆形实体或方框符号 但这并非代表人头 因为其下部就是一个正面的人形 所以其上半部分就是一个丁字 所以天字或结构从大 丁声 表示头顶 天就有头顶的本义 章炳麟就在 章氏丛书 小学问答 中解释 山海经 海外西经 中的 刑天 为因受刑而无首之人 既然天为头的代指那么我们就可以理解 集韵 先韵 中提到的 天 刑名 削凿其额曰天 为一种与头有关的酷刑了 所以也可以理解为什么我们常称头盖骨为天灵盖了 其实天字为人耳熟能详的涵义是 天空 因为头顶是人身最高最神秘的部分 在先民的类比思维中 天空应该也有高于人类的种种神秘内涵 天空 一义横向发散 就可引申为天体 天象 如 旧唐书 中记载的善占星纬的傅效忠是长于两眼看天的 若将此种内涵以观念化的方式处理一下 就更加抽象的哲学意味 如荀子在天论 中提出的 天行有常 不为尧存 不为桀亡 中的天则泛指自然界的恒常规律了 自然界一义在横向发散就是天然或季节 气候之义 由于古人多认为天是有意志的神灵 视天 或君王 人伦中的尊者为万物之至高无上的主宰 由此纵横勾连的连锁意义反映中 汉字的抽象涵义是在其本原意义的基础上稳固的建立 而不是无规律 无原则生发的 汉字看似高度概括 明确简约 实则复杂深刻 但其逻辑思理和文化意识的有向性助于我们在汉字引申义中同样地发现文化因素 尽力厘清汉字由 本义 到 寓意 的意义过渡的中间环节才利于我们切实全面了解一个字。三 由活生生的事物到符号化过程 的联想如汉字中的 求 字 其甲骨文和金文的字形都是在衣上加毛的象形 似有毛的皮衣 即 裘 的初文 说文 云 求皮衣也 古文省衣 即求本是裘的古字 我们在当下的使用中也往往忽视了其原始的含义 只注意到其公认的符号化过程后的完成义了 又如 众 字 其甲骨文字形类似于多人在烈日下干活的形状 所以 众 的本义就只在烈日下卖力劳动的奴隶 但在古籍中 众字的本义已逐渐消亡 自 荀子 以来的古籍的 众 多诠释的是 群众 许多人 大家 或其横向引申义 多 许多 众 也变成了 多 的符号化的代名词了 由此观之 汉字的视觉符号的本性在人际沟通和社会交际中的独特作用则充分凸显出来。综上 汉字是语言精细化的一种表现 其简约流畅的外形在意义层面介入并干预者后世人对它的丰富含义的释读通过发挥对汉字核心本质意义的联想及参照历代用法的资料 则有助于我们构建一个对 字 的有机意义群体系。浅谈五笔字型汉字输入法的教学郭变云忻州市原平农业学校034100一、 汉字的三个层次汉字分三个层次:笔划、字根、单字。也就是说由若干笔画复合连接交叉形成相对不变的结构组成字根,再将字根按一定位置关系拼合起来构成汉字。五笔字型还遵从人们的习惯书写顺序,以字根为基本单位进行编码拼形输入汉字。二、 汉字的五种笔划 基本笔划及变形:横:一、提笔竖:I、左竖钩撇:J捺:、点、各种带转折的笔划三,汉字的三种字型结构汉字町以分三种字型:左右型、上下型、杂合型。四、 汉字的130个基本字根由笔画交叉连接而形成的相对不变结构通称为偏旁、部首,在五笔字型中称为字根。130个基本字根又按起笔的笔划分为五大区,每区内又分五个位,十位数为区号,个数位为位号,以1 1-55共计25个代码表示。五、 字根的结构关系基本字根町以拼合组成所有汉字。在组成汉字时,字根间的位置关系可以分为四种类型,概括为单、散、连、交。六、 汉字分解为字根的拆分原则1、 顺序拆分2、取大优先3、兼顾直观4、能散不连5、能连不交。七、 五笔字型编码方法 l、键面字1)键名汉字的编码方法:把所在键的字母连击四次。即:“王”字编码为:GGGG,输入时需连击G四下。2)成字字根汉字的编码在130个基本字根中,除25个键名字根外,还有几十个本身也是汉字,称它们为“成字字根”。成字字根的编码公式为:报户口+首单笔码+次单笔码+末单笔码当成字字根仅为两笔时,只有三码,公式为:报户口+首单笔码+末单笔码注:首单笔码、次单笔码和末单笔码,不是按字根取码,而是按五种笔划的单笔划取码即各类第一字母,对应关系如下:单笔划种类:横、竖、撇、捺、折单笔划码:GHTYN八,末笔划字璎交叉识别码识别码用末笔划的类型编号和字型编号组成。具体地说,识别代码为两位数字,第一位(十位)是末笔划类型编号(横1、竖2、撇3、捺4、折5),第二位(个位)是字型代码(左右型1、上下型2、杂合型3)。把识别代码看成为一个键的区位码,这就会得到交叉识别(字母)码,即:G11 F12 D13,H21 J22K23,T31 R32 E 3 3,Y 4 lU42 143,N51 B52 V53。1、关于末笔划有如下规定,这规定可使取码简单,明确。1)末字根为“力、刀、九、七”等时,一律认为末笔划为折。2)进、逞、远等字,不以走之的末笔为末笔,约定以去掉“走之”部分后的末笔为整个字的末笔来构造识别码。例:进、逞、远的识别码为:23 K;13 D;53V。3)我、成等字的末笔取撇“J”。2、关于字型有如下约定:1)凡单笔划与字根相连者或带点结构都视为杂合型。2)字型区分时,也用“能散不连”的原则。知、卡、严都视为上下型。3)内外型字属杂合型,如困、匝。但“见”为上下型。九、简码输入1、一级简码一级简码,即高频字码。“五笔字型”中,从l 15 5共2 5个键位代码,根据每键位上的字根形态特征,每键安排一个最为常用的高频汉字,这类字只要击键一次,再加击一次空格键,即可输入。2、二级简码二级简码字的简码和其全码的前两位相同,即只用前两个字根编码。再加击一次空格键,即可输入。3、三级简码三级简码字字数多,输入三级简码字也需击四键(含一个空格键),三个简码字母与全码的前三者相同。但用空格键代替了末字根或代替识别码。十、词语输入1、二字词二字词的词语由所含的两个汉字各取两个字根码组成,即每字按笔顺取前个字根为编码。2、三字词三字词前两汉字各取第一码,最后一字取前两码。3、四字词四字词的词语由每个汉字的第一码组成词语的输入码。4、多字词超过四个字的词由一二三和末四个字的第一字根构成的。一种笔段网格汉字字形描述方法摘 要 现有计算机汉字字形描述方法在特征选取、 字形比对计算方面存在缺陷 ,无法解决输入错字、 古籍异体字、 拼合字和自动比对字形等问题.面向应用提出一种具有颗粒度适当、 无歧义、 规范化基元特征 ,能描述一切可能字形(包括错字、 异体字、 拼合字)骨架异同的笔段网格汉字字形描述方法 ,并基于该描述给出了简单笔画、 复合笔画分类及自动提取、 结构关系计算等算法.实验表明 ,该方法可用于支持各种字形的描画输入和字形整体、 局部比对计算.目前汉字在计算机内缺乏统一有效的字形形式化描述方法和比对计算支持 ,无法通过字形描写方字形进行深入比对分析研究 ,这些问题严重影响了计算机在汉字研究、 汉语教学、 历史文化研究等领域的应用.前人对汉字字形描述做过很多工作 ,一般方法是把汉字按照人对字形的认知分类 ,划分结构类型 ,如上下、 左右、 包围等 ,并使用人认知的构形单位 ,如部件、 笔画来分层次描述122 .基于这种结构分析思想的字形描述方法有汉字信息字典、 汉字部件规范、表意文字描述序列( IDS) 、 汉字数学表达式、 字符描述语言(CDL)等 329 .这类方法把汉字看作大部件到小部件的递归组合,有很强的字形能产性 ,能用有限的部件和结构类型组合描述相当多的汉字 ,这在一定程度上克服了汉字大字符集编码方案的封闭性弊病 ,但选取的字形描述特征依赖于人的知识 ,颗粒度过大、 不统一,字形描述中存在着大量歧义和描述缺失,无法实现字形特征的自动提取、 比对等计算处理.汉字识别技术采用字形统计特征来描述汉字 ,建立了多种汉字识别模型10 ,这些模型从大量汉字图像样本中提取全局统计特征来刻画字形 ,特征稳定性好,无论对印刷体还是手写汉字都能取得较好的识别性能 ,具有极强的鲁棒性.不足是只涵盖了与样本字形同分布的汉字字形特征 ,对事先无法收集样本的错字、 古籍异体字、 民俗拼合字等特殊汉字的特征无法准确刻画 ,识别性能难保证.另外 ,基于整字图像获取的全局统计特征很难再逻辑解析来描述局部字形 ,与人认知的构形单位(如笔画、 部件、 结构类型)很难建立对应关系 ,因此 ,很难用于汉字整字识别以外的应用领域.如汉字研究和教学研究中需要从整字中提取笔画、 部首、 结构关系等不同层次构字元素进行字形局部分析计算 ,识别模型难以胜任.本文结合应用提出一种笔段网格汉字字形描述方法 ,能统一描述正字、 错字、 古籍异体字以及拼合字等各种字形的骨架异同 ,也能支持字形的整体、 局部比对计算;可用于文字研究、 汉语教学研究的字形资源库建立及字形比对分析中.1 笔段网格字形描述方法1. 1 描述基元选取为保证描述汉字的基元规范、 无歧义 ,支持高效字形比对计算 ,选取了颗粒度介于点与笔画之间的笔段作为描述基元 ,笔段为一个小矩形内的如下 3类线段。1)上水平边框线被中点分成的2 段 A E, EB ,称为水平笔段;2) 左竖直边框线被中点分成的 2 段 A H , HD ,称为竖直笔段;3) 4 个顶点到其 2 条对边中点的连线 A G,A F, B G, B H , CE, C H , D E, D F 以及 2 条对角线A C, B D ,共 4 2 + 2 = 10 段,称为斜笔段. 因此,一个小矩形内共含 14 个笔段.1. 2 汉字字形的笔段网格描述把大小相等的 N N 个包含笔段的小矩形组成一个方阵,称为笔段网格,用于描述汉字字形骨架。规定笔段网格中每个小矩形下水平边框线归属其下面小矩形,最下一行小矩形的下水平边框线不在可用之列;每个小矩形右竖直边框线属其右边小矩形,最右一列小矩形的右竖直边框线不在可用之列.因此, N N 笔段网格中共有 14 N2个笔段,这些笔段构成一个集合,记为 G:G = Ski , j | 0 i , j N , 0 k 14 , (1)其中,元素 Ski , j代表一个笔段,下标 i , j 为笔段所属小矩形在笔段网格中的行、 列编号, N 为组成笔段网格的小矩形行(列) 数,上标 k 为笔段在小矩形内不同方位的编号:0 ,1代表两种水平笔段,2 ,3 代表两种竖直笔段,413代表10种不同方位的斜笔段.笔段存在有效和无效两种状态;笔段被描画过为有效状态;否则为无效状态.汉字字形的笔段网格描述定义为笔段网格中被描划过的有效笔段集合.记为 H :H A G, H = Ski , j | 0 i , j N ,0 k 14 , State ( Ski , j ) = 1 , (2其中, S tate( Ski , j )是笔段的状态函数,定义如下:St ate ( Ski , j ) =1 , 笔段 Ski , j 被描画过,0 , 否则.(3图2 中深色笔段为有效笔段,所有深色笔段的集合是 “招财进宝” 拼合字的笔段网格字形描述.2 笔段网格字形描述中笔画的分类与提取为了支持从整体到局部不同层次字形特征的比对计算,需要建立网格字形描述中笔段与面向人的最小构字单位 笔画之间的一种对应关系,因此,定义了笔段的有效组合类型,称为简单笔画、 复合笔画.2. 1 简单笔画定义 1. 笔段类型及端点. 如图 3 所示,笔段共有 8 种方向类型,记为 A H.规定水平笔段左为首端点,右为尾端点,其余类型上为首端点,下为尾端点. 定义2. 基本笔画.网格字形描述中所有首尾相连的同类有效笔段序列,构成一个基本笔画,按包含笔段类型不同,也分为 8 种类型,记为 ah.如所有相连的 A 向有效笔段集合构成水平基本笔画 a ,其余同理类推.基本笔画的首端点为其中起始笔段的首端点,尾端点为终止笔段的尾端点.定义 3. 简单笔画包括 Heng ,Shu ,Pie ,Na 4 种类型.其中:Heng为水平( a)类型的基本笔画;Shu 为竖直( b)类型的基本笔画;Pie 为首尾相连的基本笔画序列 bh d f ,其中每种简单笔画都可以不出现,但 h , d , f 必须至少出现一种;Na 为首尾相连的基本笔画序列 bgce ,其中每种简单笔画都可以不出现,但 g , c , e必须至少出现一种.Pie ,Na 类型又依据包含笔段倾角不同细分为4种子类型 ,用于细致描述同类笔画的差异 ,具体分类及图例。2. 2 简单笔画提取算法先把笔段网格字形描述中相连有效笔段合并为基本笔画 ,再把相连基本笔画合并为简单笔画 ,实现简单笔画的提取. 下面以提取 Pie 类简单笔画为例说明.算法描述:Step1. 将笔段网格字形中相连的同类有效笔段合并为水平( a) 、 竖直( b) 、 左斜( f , d , h) 、 右斜( e ,c , g) 类型基本笔画,其中 a , b 类型基本笔画就是“横” ( Heng) 、 “竖” (Shu)类型简单笔画;图 4 为合并两两相连 H , D , F类有效笔段得到的 3 个左斜基本笔画 h , d和 f 的示例.Step2 . 将基本笔画作为边 ,首端点为顶点 ,建立图邻接表结构,图 5 示出按图 4 基本笔画建立的邻接表.Step3. 基于邻接表搜索首尾相连的左斜( h , d ,f ) 、 右斜( g , c , e) 基本笔画合并成 “撇” ( Pie) 、 “捺”(Na)类简单笔画(示例如图 6 所示) .3. 1 查找边链表,找到一个未处理(标记为F)的左斜或右斜基本笔画边结点 p ; 3. 2 再查找首端点与 p 尾端点相等的边链表,找到一个与 p同类倾角不增的未处理基本笔画边结点 q ; 3. 3 p 置已处理标记 T ,修改 p 的尾端点指针为 q 的尾端点指针, q的首端点度减 1 ,删除 q; 3. 4 转第 3. 1 步执行,直到邻接表中无未处理的左斜或右斜简单笔画边结点为止.Step4. 基于邻接表搜索首尾相连的简单笔画“竖” (Shu)和 “撇” ( Pie)或 “竖” ( Shu)和 “捺” (Na) ,进一步合并成 “竖撇” ( Pie3) 、 “竖捺” (Na3) 类简单笔画. 4. 1 查找边链表,找到一未处理的 Shu 类简单笔画边结点 p ; 4. 2 再查找首端点与 p 尾端点相等的边链表,找到 Pie 或 Na 类基本笔画边结点 q; 4. 3 修改 p 的尾端点指针为 q 的尾端点指针, p置已处理标记 T , q的首端点度减 1 ,删除 q; 4. 4 转第 4. 1 步执行,直到邻接表中无未处理的 Shu 类简单笔画边结点为止.Step5. 从首端点链表中删除度为 0 的结点.Step6. 按首端点链表结点次序输出简单笔画 , 得到按首端点坐标排序的简单笔画列表.2. 3 复合笔画定义4. 在简单笔画基础上进一步定义了17 种简单笔画的有效组合类型 ,称为复合笔画 。3 笔段网格字形描述中笔画结构关系计算汉字是一种平面图形,笔画间相对位置关系是字形本质特征之一,是描述字形的重要成分11 . 在笔段网格描述中,两笔画间的位置关系采用方向关系矩阵12 描述. 设 A 是网格字形中任意笔画,将的最小外包矩形各边及其延长线作为边界,将笔段网格划分为以 A 为中心的 3 行 3 列 9 个矩形区域分别表示笔画 A 周边 8 个不同方位,如图 8 所示对各区域按行、 列编号,如 1 行1 列区域表示笔画的左上,3 行 3 列区域表示笔画 A 的右下: 建立一个 3 3 二值方阵 RAB ,元素 RAB i , j 的值表示笔画 A 周边第 i 行 j 列区域是否与另一笔画B 的最小外包矩形区域相交:如区域相交,则 RAB i , j = 1 ,否则 RAB i , j = 0 ,因此,方阵 RAB描述了笔画 A 与B 的位置关系,称为笔画 A 与 B 的方向关系矩阵.图8 示出 “心” 字第 2 点(标为 A 的区域)将网格平面划分的 9 个区域. 它与其余笔画(标为B , C, D的区域)的方向关系矩阵值如下:RAB =0 0 01 1 11 1 1,RAC =0 0 01 0 01 0 0RAD =0 0 00 0 10 0 1类似地可以计算出字形中任意两笔画的方向关系矩阵.两个字形的笔画方向关系矩阵的差值反映了两字形的结构差异度.此外,笔画相交关系可直接通过交点来描述.两字形笔画交点数的差值反映了相交关系的差异度.4 实验结果4. 1 笔段网格字形描述与点阵字形的对比实验由于 N = 16 的笔段网格字形包含的笔段数 =14 16 16 = 358460 60 = 3600 ,近似相当于60 60 点阵字形包含的点数 , 因此 ,实验选取宋体60 60 点阵字形与 16 16 笔段网格字形进行对比 ,统计了 GB K字符集20902 个汉字(涵盖简、 繁体字)点阵字形有效点数和网格字形有效笔段数增长比例与汉字笔画数增长的关系(如图 9 所示) ,以及 实验结果表明同一字的笔段网格字形有效笔段数只有点阵字形有效点数的 15 %20 % ,描述更高效,有利于提高字形比对计算速度;随着汉字笔画数从 1 增长到 48 ,简、 繁网格字形中有效笔段数平均增长了约 8. 2 倍和 12. 9 倍 ,而点阵字形有效点数平均只增长了约 4. 5 倍 ,表明笔段网格字形间区分度比点阵字形大 ,有利于提高字形比对计算的准确性.4. 2 网格字形描述的不同笔段分类方案与汉字笔画方向吻合度的对比实验方案 1. 如图 11 (a)所示 ,取小矩形顶点到对边中点(即二分点)连线作为左斜、 右斜类型笔段;方案 2. 如图 11 (b)所示,取小矩形顶点到对边三分点连线作为左斜、 右斜类型笔段.点阵字形有效点数和网格字形有效笔段数随汉字笔画数增长变化的关系。对方案1 和方案2 ,实验统计了 GB2312 字符集6763 个楷体字形骨架中各线段的斜率分布 。表 3 中结果表明三分点方案 2 比二分点方案覆盖楷体字形骨架的线段数量比例提高 10. 2 % ,覆盖线段长度比例提高 8. 2 % ,但仍存在数量、 长度比例为 24. 8 %、 18. 6 %的骨架线段方案 2 无法覆盖由于方案 2 比方案 1 细分了笔段类型 ,造成网格描述中笔段数量快速膨胀(如图 12 所示) ,使字形描述操作及比对计算处理更复杂.从简化描述方法 ,提高不同笔段类型间区分度 ,确保比对计算结果可靠、 高效等方面综合考虑 ,二分点方案 1 更适合应用.对于方案 1 ,综合考虑提高网格中笔段覆盖字形骨架线段的比例及提高有效笔段的比例两方面因素 ,将网格设定在 16 16 范围内 ,是符合汉字字形实际的性价比较优的网格划分方案.4. 3 笔段网格描述汉字及笔画提取实验笔段网格字形描述实验采用自行开发的手写绘制工具进行 ,目前完成了 GB K字符集中全部 20902个汉字及近 1000 个外国留学生汉语作文错字和异体字形的描述. N = 12 的笔段网格可以描述绝大多数汉字字形, N = 16 笔段网格可以描述所有字形.在此基础上实现了字形描述中简单笔画和复合笔画的自动提取 ,提取准确率达到 100 %.实现了字形中笔画位置关系的自动计算.这些实验结果说明笔段网格字形描述是一种可靠、 有效、 支持字形比对计算的字形描述模型.5 结束语笔段网格字形描述方法用定义好的有限类型线段 笔段 作为描述基元 ,特征规范、 颗粒度适当 ,克服了现有汉字字形描述体系存在的以下问题:1)以结构类型、 部件、 笔画作为描述单位 ,颗粒度过大,描述存在歧义和缺失 ,无法表现开放的汉字集合 ,无法有效比对一些字的相似性和差异;2)点阵字形或 True Type 曲线轮廓字形的描述基元颗粒度太小 ,规范性差 ,包含许多因书写工具和美学观念不同带来的书法上的差别 ,这些差别不是汉字字形的本质差别;3) 汉字识别模型采用的全局统计特征很难逻辑解析来描述字形的局部,也很难与人认知的字形特征(如笔画、 部件、 结构类型)建立对应关系 ,难以应用在整字识别以外的领域.在支持字形特征自动计算方面 ,由于描述基元规范、 无歧义、 颗粒度适当,只描述汉字的骨架而剔除字形非本质特征 ,使字形特征的变化得到了有效约束 ,从而保证了字形描述中结构特征的稳定性 ,使实现从整字中准确提取字形局部特征(如简单笔画、复合笔画等构字元素) ,并准确判定特征类型成为可能 ,一方面降低了字形特征提取的复杂度 ,另一方面也使计算结果更可靠.也容易与现有其他字形描述体系建立对应关系.在易用性方面 ,没有任何汉字文化背景的外国人只要对图形能正常认知,就能使用该字形描述方法描画出他所想到看到的汉字.因此 ,可作为一种生僻字、 错字输入工具 ,并能按需求提取不同层次字形特征和结构关系 ,支持字形自动比对计算.进一步的工作目标是实现汉字部件的自动提取以及检索等处理功能 ,为建立汉字字形语料库提供有效工具 ,为汉字研究和教学提供服务.张怀瓘书断 中的汉字起源观点詹其仙(福建农业职业技术学院 ,福建 福州 350119)摘要:张怀瓘在其书论著作书断 中用了较大篇幅讨论汉字的起源问题。唐代的汉字起源观点有:八卦说、 结绳说、 仓颉造字说、 河图洛书说。而张怀瓘认为 ,上古时伏羲结绳而治 ,后文字取代了结绳 ,但文字并不直接起源于结绳;文字起源于八卦 ,八卦是文字之祖;造字者是黄帝史官苍颉 ,他先造的是象形字一类的“ 文 ” 。汉字起源问题是汉语文字学学科一个很重要的课题 ,也是古代学者们津津乐道的话题。古代讨论汉字起源问题的著作主要有两类 ,一类是文字学著作 ,另一类是书法理论著作。生活在盛唐的书法理论家张怀瓘就在其书论代表著作书断 中用了较大篇幅讨论汉字的起源问题 ,提出了自己的观点。然而 ,许多文字学家在论及汉字起源时 ,并未提及张怀瓘及其书断 ,不能不说是个遗憾。为了让大家了解其中的相关观点 ,今不揣陋见 ,拟成此文 ,求教于方家。一、 张怀瓘所处年代关于汉字起源的各种观点中国的历史源远流长。中国的文字 汉字也是如此。文字作为记录语言的符号 ,很遗憾地未能在它产生之时为自己作一个记录 ,因而关于它的身世便成了许多人关注的焦点。古人限于条件的限制 ,未能对其进行科学的考证 ,只能根据神话传说或古籍记载来推测。因此 ,在张怀瓘所处的唐代关于汉字的起源 ,便有了各种各样的说法。主要有以下几种:(一)八卦说八卦是古代用于占卜的八种符号 ,由阴爻 ( - )和阳爻 ()组合而成。一些学者认为文字起源于八卦 ,这便是文字起源的“ 八卦说 ” 。这种文字起源观点至迟在汉代便已有萌芽。托名为孔安国著的尚书 序 里说:“ 古者伏牺氏之王天下也 ,始画八卦 ,造书契 ,以代结绳之政 ,由是文籍生焉。 ” 1 ( P5)按照这种说法 ,“八卦 ” 和“书契 (文字 ) ” 具有类似的功能 ,它们共同替代了结绳记事。东汉时许慎所著的文字学奠基之作说文解字 里也有类似的记载:“ 古者庖牺氏之王天下也 ,仰则观象于天 ,俯则观法于地 ,观鸟兽之文与地之宜 ,近取诸身 ,远取诸物;于是始作易八卦 ,以垂宪象。及神农氏 ,结绳为治 ,而统其事。庶业其繁 ,饰伪萌生。黄帝之史仓颉 ,见鸟兽蹄迒之迹 ,知分理可相别异也 ,初造书契。百工以乂 ,万品以察 ,盖取诸夬。 ” 2 ( P314)虽然许慎的说法与尚书 序 有一些不同 ,但他们都将八卦与书契联系在了一起 ,但均没有明确说明文字起源于八卦。为尚书 作疏的初唐经学家孔颖达在为上句作疏时也只认为文字与八卦是属于性质相同的事物 ,但他同时还认为文字并不源于八卦。 1 ( P5 - 6)可见 ,在唐代初期 ,文字起源于八卦的观点还是很模糊的 ,一些学者甚至存有疑议。到了唐代中期 ,一些学者提出了文字源于八卦的观点 ,如唐开元间文臣李周翰在为萧统所编文选 卷二四诗 赠答二 之为贾谧作赠陆机 作注时便有“ 伏牺始为君 ,结绳阐化 ,后画八卦 ,以成文字 ” 这样的注解。 3 ( P457)(二 )结绳说这种观点认为文字的产生与结绳有着紧密的联系 ,文字起源于结绳记事。根据史料记载 ,在文字产生以前 ,上古社会的人们用结绳来进行管理和记事。 4 ( P4)老子 道德经 就有关于“结绳而用 ”的记载:“虽有舟舆 ,无所乘之;虽有甲兵 ,无所陈之;使民复结绳而用之。 ” 5 ( P180)随着社会的发展 ,文明的进步 ,“后世圣人 ” 把结绳记事改为用文字记事。古书中关于这方面的记载很多。如周易 系辞 有“ 上古结绳而治 ,后世圣人易之以书契 ,百官以治 ,万民以察 ” 的记载。 6 ( P573)另庄子 胠箧篇 、 7 ( P142)说文解字叙 2 ( P314)等都有类似的记载。到唐代 ,人们也都延续旧说 ,没有突破。(三)仓颉造字说这是传播最久、 影响最广的一种文字起源观点。这种观点认为汉字是仓颉所造。根据现有材料看,这种说法始于战国时期。如荀子 解弊篇 :“ 好书者众矣 ,而仓颉独传者壹也。 ” 8 ( P356)韩非子 也有类似的记载。到了秦汉时代 ,这种传说更加盛行。如吕氏春秋 君守 :“ 仓颉作书 ,后稷作稼。 ” 高诱注:“ 苍颉生而知书 ,写仿鸟迹 ,以造文章。 ” 9 ( P203)说文解字叙 :“ 黄帝史官仓颉 ,见鸟兽蹄迒之迹 ,知分理可相别异也 ,初造书契。 ” “ 仓颉之初作书 ,盖依类象形 ,故谓之文 ” 。 2 ( P314)淮南子 本经训 中也有相关的记载。 10 ( P79)根据这些古书记载 ,一般都认为仓颉是黄帝的史官 ,其造字的方法是“ 写仿鸟迹 ” 。唐代时 ,学者们在说明这个问题时基本上都是引用前人旧说。如初唐房玄龄在其晋书 中就引卫恒四体书势 来说明 , 11 ( P1061)与张怀瓘同时代的李林甫在为唐六典 作注时 ,也引了与上述观点类似的前人各种说法。 12 ( P562)(四)河图洛书说这里的“ 河 ” 当指黄河 ,“ 洛” 当指洛水。黄河可出“ 龙图” ,洛水能出“ 龟书 ” ,并且授予轩辕氏 ,于是文字就这样产生了。另有一种说法是河图洛书授予了伏羲 ,伏羲“ 效河图而画八卦 ” ,“ 法洛书而陈洪范 ” 。 13 ( P1315)古书中关于这种传说的记载也很多如易 系 辞 : “河 出 图 , 洛 出 书 , 圣 人 则之。 ” 6 ( P556)竹书纪年 :“龙图出河 ,龟书出洛 ,赤文篆字 ,以授轩辕。 ” 14 ( P190)对于这些观点,唐人多引用旧说 ,或对古说加以解释 ,没有什么创见。二、 张怀瓘的汉字起源观点张怀瓘在书断 中有大量篇幅论及汉字的起源问题 ,他认为 ,对于文字的起源问题 ,众说纷纭 ,莫衷一是。“及兼论文字始祖 ,各执异端 ,臆说蜂飞 ,竟无稽古 ,盖眩如也。 ” 15 ( P208)因此 ,他有意来考证一番 ,以“ 拔狐疑之根 ,解纷挐之结。 ” 15 ( P209)他的主要观点有:(一)书契 (文字 )并不起源于结绳1、 何为“ 书 ” 、 “ 契 ” 与“ 书契 ”张怀瓘在书断 中对什么是“书 ” ,什么是“ 契 ” 、 “ 书契 ” ,“ 书契 ” 有什么作用等进行了具体的论述。他认为“ 书 ” 、 “ 契 ” 是两种不同的事物 ,它们是在不同的情况下产生的 ,且各有不同的作用。“ 大道衰而有书 ,利害萌而有契。契为信不足 ,书为言立征。 ” 那么什么是契呢 ? 张怀瓘认为,“凡文书相约束皆曰契。契亦誓也 ,诸侯约信曰 誓 。 ” 他还引了春秋传 中的“王叔氏 ” 的事例来说明 ,“契 ”就是一种文书凭证。为了让时人更加明白 ,他还用“ 昔之铜虎竹使 ,今之铜鱼 ,并契之遗象也 ” 来进一步解释说明。对于“ 书契 ” ,张怀瓘认为是用文字记载的简牍 ,用来决断一切事情的凭证 ,并引用了魏晋时皇甫谧的话来说明。 15 ( P213)张怀瓘对于“ 书 ” 、“ 契 ” 等的认识应是正确而客观的。由于“ 书契 ” 是用文字记载的凭证 , 因而也成了“ 文字 ” 的代名词。张怀瓘在论述文字的创始时提到“ 书契 ” ,分明其所说“ 书契 ” 也是“ 文字 ” 的意思。2、 上古时伏羲结绳而治张怀瓘在其书论中多次提到“结绳 ” 记事。除上引周易 系辞下 :“ 上古结绳以治 ,后世圣人易之以书契 ” 外 ,另还有“ 夫至德之道 ,化其性于未然之前;结绳之教 ,惩其罪于已然之后 ” 15 ( P213),“ 迨乎伏羲氏作 ,始定人道 ,辨乎臣子 ,伏而化之 ,结绳而治 ” 15 ( P241)等等。如前所述 ,张怀瓘极为认可周易 所说“ 上古结绳以治 ,后世圣人易之以书契 ”的观点 ,认定“ 上古 ” 指“ 伏羲、 神农之时 ” ,且所引有关“ 结绳而治 ” 的说法中 ,只提到伏羲 ,未见提神农氏等。可见 ,从张怀瓘书论中的引文来看 ,他颇为认同上古时伏羲“ 结绳而治 ” 这种观点。3、 书契 (文字 )取代结绳 ,但并不直接起源于结绳张怀瓘在论及文字的起源时,虽然多次提及“ 结绳 ” ,但只是说书契取代结绳 ,没有说明书契由结绳发展而来。如:“ 邈邈苍公 ,轩辕之始。创制文字 ,代彼绳理。 ” 15 ( P218)“ 易 曰:上古结绳以理 ,后世圣人易之以书契。 ” 15 ( P243)这里用了“代 ” 和“ 易 ” 两个词来说明二者的取代关系。按段玉裁说文解字注 ,“凡以此易彼谓之代 ” , 16 ( P375)其中的“ 易 ” 当是“ 换 ” 的意思。 17 ( P340)“后世圣人易之以书契 ” 的“ 易 ” 当也是“换 ” 的意思。这里 ,不管是张怀瓘 ,还是周易 都没有明说是在“ 结绳 ” 基础上的更新换代 ,因而依段注 ,应是“ 以此代彼 ” 的成分居多。也就是说 ,从字面上看 ,应该是:书契取代结绳 ,但并不一定是源于结绳。 再从张怀瓘书论看 ,他明确提出了文字起源于八卦的观点 ,而对于结绳与文字的关系 ,却未有任何表态 ,可见 ,张氏并不认同文字起源于结绳的观点。(二 )文字起源于八卦张怀瓘通过考证后认为 ,文字实起源于八卦 ,八卦是文字之祖。他还认为 ,伏羲只作八卦而不造文字。1、 八卦是文字之祖书断 开篇 ,张怀瓘即对文字的发展历程进行了简要概述 ,他认为文字体系自伏羲氏作八卦 ,轩辕氏造文字后,繁荣于商周时期 ,到了秦汉时期就很完备了。因此文字的历史是很久远的。 15 ( P202)在论述了十种书体源流后 ,他对八卦与文字的功用进行了阐释。他认为 ,八卦不等于文字 ,且二者的功用各有不同:卦象是用来暗定事物的规律的 ,文字是用来宣扬记载事情的;八卦与天地一样深远渺茫 ,变幻莫测 ,而文字却能够发挥道理 ,使隐微难见的显现出来。 15 ( P240)也就是说 ,文字能使幽深的卦象显现出来。所以他下结论认为 ,“ 是知卦象者 ,文字之祖 ,万物之根。 ” 15 ( P240)“ 故知文字之作 ,确乎权舆 ,十体相沿 ,互明创革 ,万事皆始自微渐 ,至于昭著。 春秋 则寒暑之滥觞 ,爻画则文字之兆朕。 ” 15 ( P247)明确提出了文字起源于八卦的观点。但这种观点似乎也并不是张氏首倡 ,前面提到的李周翰 ,为文选 作注是在开元六年 (718) , 18 ( P39 - 47)张怀瓘书断 成书是在开元十二年 ( 724) , 19 ( P778)可见二人的观点提出的时间应该不相上下。这也说明 ,在唐代开元年间 ,关于文字起源于八卦的说法已经很普遍了。宋代郑樵干脆把八卦与文字相附会 ,或许就是受唐人的影响。2、 伏羲造八卦而不造文字对于八卦是谁造的 ,张怀瓘进行了考证。他首先对“ 先贤 ” 的观点提出质疑 ,“ 先贤说文字所起 ,与八卦同作 ,又云八卦非伏羲自重 ” 15 ( P240),“自仲尼没而微言绝 ,诸儒之说,是或不经 ” 15 ( P241)。并批判了孔安国“伏羲造书契代结绳 ” 的说法 ,经过考证 ,他得出结论:“则知伏羲自重八卦 ,不造书契 ,焕乎可明 ,不至疑惑也。 ” 15 ( P244)即伏羲造八卦而不造文字。其次 ,由于张怀瓘认为汉字起源于八卦 ,那么对于八卦是如何来的自然也很关心。他对于八卦的来源也有一番自己的见解。他先批判了马融、 王肃等人认为八卦来源于“ 河图洛书 ” 的观点 , 15 ( P244)认为 ,河图、 洛书是圣人受天命为帝王时才出现的祥瑞之兆 ,与伏羲作八卦无关。 15 ( P246)那么伏羲是依什么作八卦呢 ? 张怀瓘认为是他仰观俯察 ,近取诸身 ,远取诸物的结果。 15 ( P243)(三)造字者是苍颉在书断 中 ,张怀瓘对“先圣
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 部编版小升初语文模拟试卷分类汇编诗歌鉴赏(附答案)
- 徐州市人教版八年级生物上册期末期末试卷及答案
- 数学人教六年级下册期末真题模拟试题经典套题
- 人工智能训练师3级理论知识复习题练习试题及答案
- 2025年新安全员专业知识考试题及答案
- 2025年度CPA注册会计师考试税法预测题含答案
- 深圳传动方案咨询中心
- 扬州品质截流井施工方案
- 校园文艺活动策划方案模板
- 服装咨询渠道方案怎么写
- 2024-2029全球及中国湖泊管理行业市场发展分析及前景趋势与投资发展研究报告
- 快手磁力聚星星选达人认证考试试卷答案
- 一元二次方程-相似三角形-锐角三角函数复习
- 冰皮月饼的制作方法课件
- 在职党员到社区报到登记表“双报到”登记表
- 降低10炉脱硝系统液氨消耗量0
- 地下储藏室产权使用权转让协议
- 高考专题复习:小说专题训练人称的交替使用
- 大数据在高速公路收费稽查打逃方面的应用
- TY/T 3001-2006中国青少年儿童 手腕骨成熟度及评价方法
- GB/T 9722-2006化学试剂气相色谱法通则
评论
0/150
提交评论