谈《输入法词库别发烧》一.doc_第1页
谈《输入法词库别发烧》一.doc_第2页
谈《输入法词库别发烧》一.doc_第3页
谈《输入法词库别发烧》一.doc_第4页
谈《输入法词库别发烧》一.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

谈输入法词库别发烧一文输入法词库别发烧作者:王永民(五笔字型发明人)原文地址:【编者注】搜狗五笔的推出让输入法领域又添了一把火,当1.1版中引入八万字的大词库时,作为五笔字型的发明人王永民教授却对汉字与词语的关系有不同见解。舍字而专注于词,那便是舍本求末,王永民先生八易其稿完成了这篇词库发烧的病因,委托IT168网站首发。作为汉字输入研究少有的学术文章,希望对广大用户和输入法研究者提供参考。-舍字而专注于词,那便是舍本求末这句话很适合86方案,但是不适合093。与其恰恰相反,093的核心思想是专注于词,兼顾单字。-五笔字型、数字王码发明人,中国发明协会副会长王永民教授摘要本文是纪念五笔字型发明25周年的一篇学术论文。自五笔字型今年元月荣获国家技术发明奖以来,学习使用者以及连个招呼也不打的五笔开发商越来越多。不过问题也是越来越多,其中最突出的莫过于词库发烧!许多人误以为五笔字型的词库像个橡皮囊,可以随意撑大。错了!五笔字型发明人警示广大用户和开发商:比赛词库大导致词库发烧,不是忽悠老百姓的商业炒作,就是根本不懂汉字编码的科学常识。字词兼容输入技术的发明人呼吁:词库发烧和10年前的语音输入一样,源于同一种基因,国人再也不要只图一时之快而上当受骗了!本文指出:对于词库,唯一正确的解决方案是在以字为本的基础上,建立一个总数不过4万的通用词库+专业词库;希望有能力又有爱心者,在50个专业词库方面下功夫,以便造福汉字文化和广大用户。-打词可以降低码长,但86五笔不适合太大的词库,因为86的编码方案在挂接大词库的时候会造成重码率激增,如果用基于86方案的词库,会经常遇到常用词需要选重码的现象。093的词库是10万,远远超过了王永民所建议的4万词库,但是093的10万词库的重码率也不会比86的4万词库的重码率高。相反,较大的词库可以使用户在打一个词的时候更加有自信,因为流光词库093版的收词原则是只要看着像词,词库里就有。另外重码率之低让用户进行的选词操作会最大限度地减少。-1、汉字输入的难与乱汉字输入的问题,30多年来,一直在两个字上打转转。一个是难,一个是乱。难是因为汉字太多太繁,于焉有万码奔腾;乱则是因为人们始终弄不清字和词的关系,致使词库发烧,离科学越来越远。难,对汉字来说,是没有办法的,谁让咱是中国人?骂电脑自然也不管用,于是只好骂祖宗(发明了汉字)。好在五笔字型1983年革命性地突破了汉字输入电脑速度和效率的瓶颈,用他们的洋键盘,一个螺钉也不动,每分钟便可输入100多个字,使洋大人们目瞪口呆,使国人为之一振!然而,同样是在英文标准键盘上,用五笔字型输入汉字,比起打英文打字来还是要多一道拆字的手续,并不轻松。所以我才坦然承认:五笔字型有点难。但毕竟五笔字型避免了为电脑制造几千万个专用汉字键盘,将大键盘变为小键盘,变大难为小难,将每日每时的难(输入)变为学会五笔字型的难。谁能说,这点难比起汉字走入死胡同来,中国人不是赚大发了?只须少玩点游戏,少打几次麻将,花三天功夫受点罪,便能学会五笔字型(再用5天熟练指法),学一阵子,用一辈子受益终生,咱们再也不用废除汉字,岂不是弊小而利大?当下,联合国总部和全世界各地的华文报刊,当然包括我国文字输入的大量工作,都少不了用五笔字型,我国数千万白领,将五笔字型作为工作技能和谋生手段,中国汉字获得了新生畅行于信息时代,谁能说五笔字型不是功大于过呢?然而,汉字输入软件的那个乱,就不是一下子可说清楚的了。从1978年开始,人们一直在探寻音码与形码的关系,自然也是乱。音码和形码既对立又统一,像男和女一样,你说哪一个更重要?争来争去,还是得相辅相成,双轨并行,平分秋色,相得益彰。现在,这二者早已相安无事、和谐共处、乱而后治了。当前最重要的乱,是输入软件的开发者始终弄不明白字和词的关系,搞拼音习惯了,甚至主张输入时要以词代字;或是以为五笔字型打词是个宝贝,便恣意滥用,结果导致了违背科学常识的词库发烧。打4下就能输入一条很长的词汇,是我发明的,是不是宝贝,我自然知道。问题是过犹不及,宝贝用过头了,发烧了,就乱了套,走入迷津。-093的配套词库有10万条,但是并不发烧,它的收词原则与091、092有所不同,就是看着像词的都收,不像词的或者由多个词组成的低频长词坚决不收。比如海峰6万词库里的精神现象学非婚生子女马克思恩格斯等词,流光词库093版都不会收。093的词库虽然多,但是绝对不收垃圾废词(酌情收录一些如好象莫明其妙迫不急待之类的高频错词)。为什么093词的重码率低?举例来说吧,如果以每个词所包含的字数来分类,词库里数量最多的就是二字词了,二字词的编码方式是取每字的前两码,如果一个二简位上的常用字过多,那么必定会造成这个编码的上的重码多。比如在常用1500字范围内,如果一个字只取前两码,86的重码数前10名是这样的(重码按音序排列):17个/tf/待/德/等/告/街/靠/毛/千/迁/廷/徒/午/先/行/选/赞/造15个/wy/仿/含/集/今/领/令/念/偏/食/售/停/信/依/仪/住13个/ud/差/关/减/卷/判/善/送/头/羊/养/郑/状/着13个/wg/便/倒/登/合/剑/例/命/拿/全/使/侠/愈/债13个/yn/遍/词/房/废/户/记/刻/启/亡/忘/望/讯/永12个/ip/尝/常/沉/党/觉/赏/深/沈/堂/学/演/掌12个/kh/跟/贵/距/路/跑/遣/跳/遗/中/忠/足/嘴11个/ww/从/份/谷/价/伦/人/俗/偷/欲/众/坐11个/yt/放/话/旅/旗/施/庭/谢/许/旋/州/族10个/fh/超/赴/赶/起/趣/越/赵/真/直/走10个/gk/带/副/赖/吏/融/事/束/速/吾/整10个/th/版/彼/处/牌/片/算/息/延/怎/自10个/wf/传/付/会/祭/仁/舍/什/侍/伟/值常用字的组词能力是很强的,比如tf上这么多常用字,那么tf和tf这样的编码必定会有很多重码,随便挑了几对重码多的如下(重码按音序排列):tfww/待人/等价/丢人/先人/行人/造价tfud/告状/街头/行善/行头/选送wytf/领先/停靠/伪造/信徒/依靠tftf/德行/等待/等等/乖乖/毛毯/先行(所选的这几组另外三对字母ww/ud/wy也恰好出现在上面的前10名,呵呵。)如果要将重码扼杀在摇篮之中,就必须把常用字尽量平均分配到625个二简位中,另外如果两个字能同时和另外的某字组成许多词的话,那么这两个字的前两码最好也不要相同,比如两/再,如果前两码相同的话,会造成两者/再者再次/两次再说/两说等重码,最最常用的字,第一码也不要相同,因为它们组常用三/四字短语的能力很强。比如这/就,不/还/正分别会造成这是一个/就是一个这是一种/就是一种这是因为/就是因为不是一个/还是一个不是一种/还是一种不是没有/还是没有不是这样/正是这样不是因为/还是因为/正是因为等等重码组。所以进行字根排布的时候一定要考虑多方面的因素。在093方案的常用1500字范围内,如果每个字都取前两码的话,那么在625个位置中,最少的有2字(86有10个位置为0字),最多的有5字(86有13个位置有10个以上,最多的17个)。而每个位置的最佳值为2.4字。-2、词库发烧的始作俑者-五笔字型30多年的汉字输入法研究史中,输入字和输入词,孰轻孰重,一直是一个争论不休的难题。最早,也是最有名的汉字词语计算机处理专家,要首推北航的刘源教授了。他老人家几十年如一日都在研究汉字的词,还承担了国家级项目,研究计算机自动分词,整理过100万条、1000万条汉字的词而著述颇丰。终于积劳成疾,早早仙逝,临终也得不出一个结论。为什么?因为词和人一样,有生有死,动态变化,每一时刻都不是它自己。1983年五笔字型发明了小键盘高效汉字编码输入法的同时,作者又首创了字词兼容的词汇码-几十个字的词,打法仅仅相当于一个字,一律打4下便可输入。而且,打字与打词,不用换档,没有间隔,不用任何附加操作。这是一项极有实用价值的发明。有了词汇输入,3字词本来要打12下,中华人民共和国按简码也要打16下,现在只要打4下,汉字输入的速度平均提高了两倍之多。千万别小瞧了本人发明的字词兼容输入技术!若是没有这项发明,中国的文字产品也许就不会有现在那么多。由此,大家都希望多打词,认为词越多越好。于是,某些门户网站和各种盗版抄袭王码五笔字型的所谓五笔,便热衷于比赛谁的词库大,把词库的大小当作软件的卖点-词库发烧了。想一想,若是有人把词汇输入设计得很麻烦、很累-要按空格、要换档、要先输入词的标示符才能打一条词汇,谁还会乐于打词呢?今天还会有比赛谁的词库大这一洋洋大观吗?所以嘛,词库发烧的始作俑者不是别人,正是五笔字型。-093没有标示符,相反,它把86字词兼容的思想发挥得更加淋漓尽致!86五笔所有的词都必须要打全四码,而093则不然,它包括全码词、一简词、二简词、三简词,这样做完全是为了提高打字速度。不但093这样做,甚至有些86的用户也经过自己改造词库,用上了自己设计的二简词。比如86五笔的二简jr是蝗字,这个字即使用到,也是在蝗虫飞蝗蝗灾等词中出现的,所以完全可以打词,这样一来,jr这个位置就浪费了,于是有些86用户将它改成了最近最后等高频词,这样,既没有浪费这个位置,词的码长还降低了,何乐而不为呢?-3、词库发烧的症状种种解铃还需系铃人,让我来为词库发烧把脉诊病。开发商们将词库发烧的温度越烧越高,今天一个版本,明天一个版本,比大,比时髦,比赛谁的词库灵活机动。你5万,我就来10万,还有号称20万的,更有所谓海量动态智能词库,可以把输入过的内容整句自动变成词存入库中备用,至此,含有大量垃圾词汇的词库不是发烧,而是发高烧了。可是,汶川出名了,水立方出现了,马英九上台了,菲尔普斯得金牌了,迪吧、水吧冒出来了,一时间,不管是google的海量词库或是搜什么的智能词库,仍然是一个个不够用。结果呢?打字时,字与词重码,词与词重码,词与句子重码,提示行摆得满满的,顿然使五笔字型盲打-高效的优势丧失殆尽-盲打变成了看打,自动上屏变成了选字上屏,这和拼音选字输入已经没什么差别了。结果呢?由于重码太多,目不暇接,频繁选词,错误难免,慢不必说,还使文本质量大为降低,豆腐渣文件越来越多。结果呢?长期打词不打字,字的笔画结构不甚了了,不会写字了,提笔忘字了。词库发烧的副作用还在于:词汇,特别是不常用的句子,在电脑中占据了很大的存储空间,检索起来很费时间,很可能输入码打完了,得等好一会儿才会显示结果,速度便谈不上了!词库发烧,各自为政,各自有库,必然使词库不通用。你离开自己的电脑,便到处找不到可用的词库。一些人士认为,随便自造一条词,比如广东省佛山市经济贸易委员会办公室主任林有亮,21个字只打4下就出来了,很带劲,很方便,很高兴,乐此不疲,这是可以理解的。然而,软件开发商故意让词库发烧,情况就不一样了。他们盲目地追求卖点,故意吹泡泡,暗示公众越大越好,造成垃圾词汇堆积成山、怨声载道、精疲力尽,不知如何回头是岸。也许这个时候,有人会想起来要问一下王永民:这个词库到底多大才算好啊?有没有一个科学的解决方案?-这个科学的解决方案就是093。重码是86的敌人,却是093的秘密武器。093关注的是全码词的重码率的降低。但是设置多重简码却可以大大提高打字效率。现在的极点五笔、QQ五笔、小鸭五笔等优秀的五笔输入法均可以使用分号键和引号键使第二重码和第三重码上屏,分号键的按键难度和字母键A相同,引号键也比数字键2、3容易按到。所以093设置了多重一二级简码,设置它们的原因一是可以降低码长,二是可以空出一二简重码字原本需要占据的三简给次常用的字和三简词,为GB范围内消灭全码字提供了基础。只要记住了字的重码位置,分号和引号键权当字母键用了,不过与字母键不同的是,它可以直接使字上屏,又省了一个空格键。-4、字有限、词无边:24年前的一个忠告其实,这个词库发烧的问题,早在24年前,本发明人在印行过上千万册的五笔字型培训教材的前言中,就写过一篇字有限、词无边的文章,早就说得到位、写得清楚了。只是那段至理名言的学术观点,后来被无视科学的商业操作淹没了。懒人们或是觉得打词汇很好玩的人,把五笔字型的词汇快捷输入法这剂灵丹妙药吃多了,发烧了。现将原文录在下面,但愿能给当前的词库发烧降温。文字是记录语言的书写符号系统。一个文明发达的社会是必须有文字的。有了文字以后,语言中便增添了书面语这一非常重要的存在形式。用声音表达的语言是听觉语言,而以文字形式记录的语言则是视觉语言。尽管任何文字系统的基本符号都总归有限,但使用它们所记录的语言词汇却像万花筒中的图案,简直无穷无尽。由2400个常用汉字可以组成10万条常用汉字词汇,反过来,即使是100万条书面词语,也未必用尽7000个不同的汉字。如若不是专门设计,100万条词语中也不会有河南名菜鹑蛋红扒鸡这样的词和六王毕、四海一、蜀山兀、阿房出以及积腋成裘、轻诺寡言、好雨知时节,当春乃发生这样的语句和成语。至于地名和人名,就更加无法计算了。5万条词语对于整个汉语来讲,也只能是九牛一毛。无论计算机的容量有多大,也永远无法存储全部的词语。何况目前机器的容量总是很有限度,而词语的发展永无止境呢?因此,一个计算机汉字处理系统,应当首先有效地解决汉字作为单字的输入与输出问题!这样才能够一通百通,一解百解,使汉字进入计算机的问题走向实用化。当代汉语词汇的出现频度是很不一样的。经济这个词汇,就比车裂常用得多。为了提高输入汉字的速度,完全有必要、实践上也已证明,五笔字型创造的词语输入法是科学而有效的。例如:中华人民共和国七个字,只用按口亻人口4个字根就可以输入。还应当提到的是,汉语的书面语言是以单字为单位书写的,一个字就可以是一个词,几个字也可以组成一个词,字和词混排在一起,从形式上看,字词之间从来没有任何明显的界限。例如:白日依山尽,怎样划分其中字词的界限呢?这是汉语文字与诸如英文等西方文字很不相同的。计算机汉字输入,最好能体现并利用这一特点。采用五笔字型首创的字词兼容编码法,既能准确地处理尽可能多的单字,又能有效地处理常用的词汇。在输入操作中,字与词之间没有任何换挡操作。例如输入黄河入海流时,黄河作为词汇打4次键输入后,不用任何换挡或作特殊标记,就可连续打入海流三个单字。这样设计,是完全符合汉语书面语言字词不分这一固有特点的。当然决不是词汇越多越好,词汇多了重码呈几何率增加,想打快结果不可能打快了。真正科学有效的办法是:系统提供一个12万条词的常用词库,再设计一个自造词软件,使得不同专业的用户,可以方便地自行增加并保留自己的专业词汇,也可以删除自己不用的词汇,静态库是常用的、公用的、相对稳定的;动态库是个性的、专业的、可变的。这就比较合乎现代社会新词语不断涌现,旧词语不断更新的现实情况。(本文原载1984年王永民、张一平著五笔字型培训教材。)5、词库发烧背离了汉字编码的科学原理30年来,对于字词的关系,作者一贯主张字为本、词为次;字有限、词无边。常用汉字3000个左右已足够用于各行各业的日常之需,可是10万条、100万条词,也不能满足三五个专业领域使用。中外的人名、地名有几百亿个,动物植物的物种有上千万种,细菌有百万种,疾病有几十万种,各类产品名目有千亿种,化合物有几亿种,哪个不是词?开了奥运会,新星新词有多少个?每天的新闻都会有上千条新词!所以,无论谁,想弄一个万能适用的词库或软件,那就像是要数天上的星星一样,不仅是不可能的,简直就是愚蠢的。汉字与词语的关系,一如原子和分子的关系:原子为数只有100多种,可由原子构成的分子和物质,是不可穷尽的,舍字而专注于词,那便是舍本求末。人们为什么会越来越忽视、越来越淡化字的输入呢?为什么对词的输入越来越发烧呢?本来是为了快却适得其反呢?说得深刻一点,最根本的原因是开发商不懂汉字编码的学问,有意无意地在输入技术领域制造泡沫。在汉字编码设计中,字也好,词也好,都是编了码才得以用字母键输入的。像客人住旅馆一样,每一个码都要在编码空间中占据一个房间。房间的总数是有限的,决不是一个可任意拉伸变大的橡皮囊。用25个字母键,打4下键的编码空间(总编码数)为:也就是说,不管多少字、多少词,全部只能有406900个房间。国标一、二级汉字占据了6763个,重码率仅仅为,可以保证编码的唯一性,这正是五笔字型重码少、打得准的原因所在。但是,由于字和词的编码形式完全相同,增加词,就等于增加字;当词汇多达10万条时,重码率便上升到=26.23%。这是什么概念呢?这就是说,平均每打4个字(词),就会出现一次重码,常常需要手选,五笔字型盲打的优势没有了,还有什么效率可言呢?设计汉字输入软件时,必须首先计算出字集+词库的重码率。因为重码率才是输入效率和输入质量的决定性因素。不妨以S1代表字码总数,S2代表词码总数,我们很容易用计算出各种情况下的重码率如下表所示:由上表可见,当词库发烧到10万条时,即使只有国标基本字集的6763个字,重码率也会陡升到26.23%,这个值是单字输入时的16倍、是1万条词汇时的4倍!这种情况下,任何人再想盲打提高效率,都是不可能的!可见词库发烧是盲打的杀手。-我认为这个重码算法不科学。首先现在的软件完全可以实现根据字的编码来自动编码词组并测试重码率这一功能了,我们完全可以实战测试重码率,而不用它的理论值。我分别测试了海峰15000词库和北语大20000高频词在86编码下的重码率,分别为6.81%和12.23%。(不含单字)。如果按照它的算法来看的话,那么15000和20000词组的重码率分别应该是15000/67631.66%=3.68%和20000/67631.66%=4.91%。而实际的重码率却几乎是理论值的2倍。这是因为字的重码可以用简码来分流,而词却不可以,所以字和词是不可以等同的。如果对86单字库作出简不出全处理的话,那么在6763字当中,有:25一简,588二简,3812三简,2338全码。从这几个数据中就可看出简码分流的作用了。顺便列出86五笔单字重码的详细情况(我算的重码率是1.80%,不知为何老王算的是1.66%)。共计116组重码,122个非首选字。ynky羸/蠃/嬴/赢afff葑/鞲/鞋bnh阝/卩/凵dnv万/尢/尤qgjf鲣/鲤/鲥aadn葚/慝afcu芰/芸afqb芜/芫aftj鞒/蓍ahf苜/芷ahkm颐/赜alkf茴/茄anb芑/艺aqkf苟/茗aqky警/菟aqyg茑/鸢awnu恭/薛bynw陔/孩cbtg鹜/鹬cbtj蝥/蟊dfny瓠/砖djdn悲/翡ebf孚/孕fcu去/云fghy寸/雨fnn圮/圯fpgc彀/觳gcft臻/致gqwe殄/餮hwbk龆/龉hwbx龀/龇ians渠/渫ifh汗/汁ijg汩/汨ipgg泻/渲iugi澜/漾iwyf雀/誉jtyq鉴/览kawk嗒/嗬kdht嗄/嘁khdf踌/蹰khgp遣/遗khwb啮/跄kwyc呤/噙lfod黩/默lgey辅/圃naj异/羿nfcy怯/忮nkue臂/襞nkuv嬖/劈nkuy璧/譬ntfh忏/忤nyhy忭/忄nywf悴/翠oyv粮/糖pufj褚/襦pynn礼/祀qjh刈/钊qnn钆/钇qnnk锔/饲qtgf锤/锺qtle猥/猬qtqh獬/狰qvhc锼/皱qwye镌/飧qynm岛/凫rdfn翱/挎rnwy抉/擢rqcc魃/魑rtol播/皤rufh拌/抖rwyc拎/擒sfiu柰/票sgne醪/醑sgtk酷/酪snn杞/札stfh杵/桁swyc柃/檎tfj竿/午tfkg鹄/秸tfnj氇/氆tlqi囱/囟tmgt徽/徵ttnt秭/笫ubk疖/疗udjn羯/阉udnv疠/疣ukqb兑/竞umih蹩/瞥uqwn瓷/恣usgd奠/猷usgp遒/遵uygh辛/丬uywu阏/瘀vnuv鼢/鼹vyi刃/丸wbg佴/仔wfg仁/仕wgen毹/愈wgkm凳/颌wgmy俪/债wlge偎/儇wtfh仟/仵wtfm赁/凭wycn瓴/翎wynm颔/贪xtdh疑/肄ybh邡/邝yntl劾/谧y nwy雇/诀ypta亳/诧yqvg谄/诌yssc么/魔yssd靡/磨ywwg谶/鹰yyn访/讠其实还有一个例子可以说明,就是张码,张码的GB单字重码率是0(在有简码分流时),那么难道它加几十万的词组之后重码都是零吗?答案显而易见。-其实,只要你会打喜、来、乐三个字,什么组合都不用怕。犯不着你把喜来乐、喜乐来、乐来喜、乐喜来、来喜乐、来乐喜都造成词,几个月也用不到一次白占地方,这个道理不是很简单吗?涉及科学的问题,决不能背离科学的基本原理,最好少一些个商业炒作。现在,到了防止污染、净化一下空气的时候了。6、词库发烧和语音输入是同一种病因当前社会上的肤浅、浮夸、浮燥之风,在学术界也是很有市场的。在词库的问题上之所以高烧不退,一概是不做学问、不求真、不务实的表现。归根到底,词库发烧不是学术问题,而是学风问题,甚至是一个社会问题。词库发烧的病因主要有三个:其一,顾此失彼、非常容易被忽悠,是当代中国人常犯的错误,是词库发烧的首要原因。我们有成语说过犹不及,但常常会忘记万事过了头,就会变成坏事。汉字输入以字为本这个简单的道理,我们的学术界、教育界、商业界、五笔开发商、门户网站,常常弄不明白,任凭有人用大词库来唬外行、忽悠老百姓。浮啊!用公式可算出结果的学术问题,也飘着!也浮着!总也落不到实处。不讲效率,不讲质量,宁肯少、慢、差、费,宁肯把五笔字型的盲打优势变成翻屏选字的劣势,也不愿下点功夫把单字打准、打好。更可怕的是,一些人从来不在乎会错多少个字!人非圣贤,岂能不错?反正是闲着没事嘛,先打上去,回头慢慢校对,让别人修改就是了。计划经济嘛,时间不值钱,打快、打慢该怎么样?错多、错少有啥关系?那么,就请你到一家报刊杂志社、编辑部体验一下。按字数发工资,错字罚钱,电视播出的字幕错一个字罚你800元!如此一来,大概你就知道单字打准很值钱了。就能体会到词库发烧会让你挣钱少甚至要赔钱了!真是钱能通神啊,也许只有钱才能让你冷静、降温,最终让你明白一个道理:字有限、词无边。五笔字型发明25年来,国内外的打字高手,无一例外,都是注重先把单字打好的。包括本人举办过的三届全国汉字输入大赛参赛的上千名选手,凡是得奖的人,凡是在解放军机关、报社、杂志社、机要局、海关工作的选手,没一个是靠大词库吃饭的。他们最清楚:靠打单字可以处理古今中外各行各业的一切文本,靠词库发烧只能会慢,挑得眼花,错得惊人。本人亲自办了20来年培训班,教过几万人打字,也调查过上百人,凡是打字高手,他们仅仅有一个12万条的常用词库,都深知不怕慢,就怕站,他们的看家本事是打单字。其二,就输入而言,许多人对字-词关系的认识本末倒置,不知道以字为本。第三个病因是有点懒。许多人只顾打词痛快,却不怕选词慢!始终不愿意下一点功夫熟练掌握3000来个常用汉字的基本编码输入(包括简码),打4下出来一条长长的词,甚至出来一句话,出来一首诗,很过瘾!误以为词库越大越好用!为了提供一点历史线索供大家反思,不妨海底钩沉,把本人10年前正当语音输入在中国大陆熊熊燃烧之际,写过22篇小文章键盘过时随想录(这组文章曾登在中关村科技报上,因为给当时语音输入产品的销售以当头棒喝,中关村的王等大牌

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论