王永民:新世纪五笔评测报告.doc_第1页
王永民:新世纪五笔评测报告.doc_第2页
王永民:新世纪五笔评测报告.doc_第3页
王永民:新世纪五笔评测报告.doc_第4页
王永民:新世纪五笔评测报告.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

读第三代五笔字型(新世纪版)评测报告后感我个人也是深有感触,以前当98出来时,网上就有了评测报告,说98如何的退步。王码公司的说法是各方面都有进步。观点相当对立,我相信双方在态度上都是严谨的。只是统计的对象不同,一个是静态、一个是动态。而王码公司的回应是摘要:(说明:我删去了大量言辞过激的部分,可能读起来不太通顺)看了网上一位不署名的“业余研究者”写的一篇关于“新世纪版五笔字型”的评测报告(以下简称“报告”),不能不使人想到“相对论和牛顿力学”之区别:在静态的三维空间中,牛顿力学是正确的;可是一旦加入“时间”这个坐标,在动态的四维空间中,牛顿力学因为不能解释诸如光线弯曲、红移等现象,就不灵了!就错了!“报告”作者虽然对输入法有某些诸如统计重码、计算编码空间的“功夫”,但内行人一看便知,他的“统计和分析”全部都是“静态”的、表面的,没有一项考虑到设计输入法时更为重要的“动态”参数,这些参数关系到汉字、键盘与人这些复杂因素。因而“报告”中那些仅仅是表面文章的“统计”,一旦加入“时间”这个“四维”坐标,就像牛顿力学一样,就不灵了!王永民教授1980年发表了汉字字根的静态频度表和动态频度表,是花了两年时间完成的。“两表”不但成为五笔字型的理论基础,还被学术界广泛采用。其实汉字输入法的设计,难在“动态”,贵在“动态”。比如字根的实用频度、键位的动态负荷、重码的动态表现、指法的负荷分配等等,这些设计输入法必须的“真功夫”,在“报告”中是只字未提的。王码五笔。长青。最根本的原因,是因为这项发明建立在坚实而厚重的理论基础之上王永民教授的科学论文计算机汉字输入技术设计三原理相容性、规律性、协调性(见计算机学报2005年第5期)。以下分6个方面评判那份“报告”。,来澄清事实。1、关于“字根”:五笔字型字根的优选是从理论分析入手的。字根有“静态”作用和“动态”作用之分。比如“虫”的静态频度为0.951%,排序在第13位,“虫”的动态频度则只有0.184%,排序在第124位;“寸”的静态频度是0.441%,排在51位,“寸”的动态频度则是0.85%,排在第21位。构成汉字的“部件”有640个之多,五笔字型何以只选200来个?这决非是“木、子、口、立、早”如此简单的一回事!只有计算并合理“加权”每一个字根的这两个频度,才能定量地权衡并安排字根的键位,再考察计算“字根键位指法”的“权重”以及排列组合的相容性、规律性、协调性,使三者达到“多目标统一”,就成为设计“形码”输入法必须追求的目标,任何一个字根的移动,都是牵一发而动全身。新世纪版的字根,都是在大字符集(27533个汉字)的情况下,全部重新计算的,计算包括每一个简体字根和繁体字根的“组字频度”与“实用频度”,二者“加权”,再计算各个键位的负荷及重码的“动态频度”之后,一步步优化才得以确定的。新世纪版五笔字型还设计有一些“繁体字根”,这些字根及其键位,决不是“想多就多,想少就少”,更不是放到哪个键位上都可以的,也不是谁都可以随意摆放的。王码公司并不准备公布每一个字根的“身价”,那就请“业余研究者”自己去“统计”吧!。“三原理”之一的“指法协调性”。这一“原理”是要合理地、协调地安排键位的“动态负荷”,只有这样,才能保证提高键入速度,才使得长时间打键“不累”。而“五笔”的“业余研究者”们,顶多能够计算一下静态的“重码”字数。2、关于重码:重码字数是衡量编码质量的一个重要指标,尤其是重码的“动态”表现。但如果字根的“相容性”较大地“妨碍”了指法的“协调性”,那么字根就得移位!如果字根在某一键位上成为“害群之马”引发出了大量的重码,我们也得舍弃一些“规律性”让它“背井离乡”到别的键位上去落户!这个设计过程,岂止是“木子李、双口吕”这样的“小儿科”?新世纪版与86或98相比,被移动的若干个字根,有一半是在保证相容性、兼顾规律性的情况下,较多地照顾“协调性”。比如“广”从Y键移到O键,“力”从L键移到E键,“乂”从Q键移到R键,都较多地考虑了键位负荷,便于提高打字效率,使打字不累。“乂”是一个使用频度较高的字根,原在Q键上,用左手小指打键,小指很累,移到R键上,用左手食指打键,就好得多了!同时减轻了小指的负担。这样设计的原因是:记忆一个字根的键位,只是“一时的代价”,而影响打字效率,才是天天时时要付出的“代价”。孰轻孰重,是不言自明的。知道这些重码字的“实用频度”吗。3、关于“笔顺规则”:对于庞杂无羁的汉字来说,既要考虑字源、理据、习惯和规范顺序,又要提高编码的唯一性和易学性,可以断定,谁也不可能制订一个“一刀切”、对每个字全都适用的“规则”让编码“合理”!合理不合理、规范不规范,永远是相对的。“报告”人仅以几个字的例外情况来评价“新世纪版”的取码规则是否“规范”。“报告”人列举出了一些“书写顺序”与“取大优先”互相矛盾的例字,来指责新世纪版五笔字型。指责说“贰、腻、甙、忒”的拆分“不符合笔顺原则”。我们不知道该“业余研究者”是从哪儿弄到的“数据”啊!实际情况是:任何人只要装入“王码大一统”的软件,再切换到“新世纪版”,都可以测试出“贰”的正确码,完全是按笔顺取码的!是DMNY,而不是AFMY;“腻”的编码是EDMY,而不是EAFY。“报告”人不从“大一统”的正版软件中找编码,却不知道从哪儿弄到一套“编码”,张冠李戴地来评价“王码大一统”,这样的“报告”还有什么真实性(也许是把“大一统”中的容错码取出来“充分利用”了)?另外,“报告”人指责:新世纪版中“辔”和“轡”的“笔顺错了”!我们可以肯定这位业余研究者,根本没见过国家语言文字工作委员会语言文字规范GB13000.1字符集汉字笔顺规范这一册重要资料!那就请你翻到该书的第264页查对一下吧:“新世纪五笔字型”中“辔”的编码“车(車)+纟(糹)+纟(糹)+口”根本没有错,完全正确。其实,一些汉字的书写顺序,历来都存在争议,“辔”如此,“万”和“方”也是如此!为了照顾各种习惯,五笔字型从一开始就专门设置了“容错码”,即使你按“不规范”的笔顺也能打出来,。当一个写文章的人很有“情绪”时。,自然就不会得出正确的结论。4、关于“规范”谁在骂五笔字型五笔字型问世仅仅一年之后,即1984年10月,“中国文字改革委员会”正式被更名为“中国文字工作委员会”。此后,那些主张“汉字走拼音化道路”的人,便开始一拨又一拨地骂起五笔字型来了!说五笔字型“把汉字拆得乱七八糟”,说五笔字型设计了的字根“不符合文字规范”,如“鱼”没下面一横,“礻”和“衤”只剩下前三笔,“革”被杀了头,。然而,事实怎么样呢?那些“不规范”的五笔字型字根,久而久之,已经为数千万人接受了!“不规范”变成了“规范”。这就是汉字编码研究中的“黑猫白猫论”。5、关于“编码空间”和“键位占用”:“报告”显示,“业余研究者”开始涉足“编码空间”和“键位占用”了,这总算是一件好事!只可惜,“报告”人的“研究结果”和列表数据,全部都是“静态”的,丝毫没有、大概也不知道更为重要的是“动态”的各项技术指标!必须说明的是,20多年来,众多的“业余研究者”之所以研究输入法屡屡失败,就是因为他们只看“表面”,只研究“静态”,而从来不知道“动态”更重要,更实用!汉字文本中的汉字,是活的,动态的,因此,字根、字根频度、重码、键位负荷、指法,也都是动态的。一个高效率的编码方案和键盘设计,最科学、最重要的是“字根的键位布局”,既要“适配”汉字字根在“文本”中的“动态”情况,又要“适配”手指负荷能力的不均匀性,让“能干”的手指负担分配重些;让“不能干”的手指负担分配轻些。这正是用五笔字型打字的人越打越快的原因。这一切,难道也只是“木子李、双口吕”的“功夫”吗?。会发现键位字根的布局,是一个“信息爆炸”式的“多目标优化”过程,200个字根在25个键上分组摆放的“方案”何止万亿个之多?岂能是“木子李、双口吕”这样简单?6、关于“试用版”:。另外一文更专业摘要如下由上表可知,一个组字能力很强的字根,如“虫”,由它组成的汉字,频度可高达0.95,但是,这些字的实用频度却很低,只有0.18;相反,一些组字频度很低的字根,如“白”,由于它参与组成了特别常用的字“的”,立即变得身价百倍,成为实用频度高达1.8的重要字根。 因此,一个拼形编码方案字根的选取,必须同时考虑到以上两种频度:两种频度很高的字根当然要选;只有一种频度高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论