已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
五笔字型输入法编码本的设计*【作者简介】李澄举(1949),男,广东梅县人, 嘉应学院计算机系 副教授李澄举 (嘉应学院 计算机系, 广东 梅州 514015)提要:应用数据库技术制作的五笔字型编码本,具有一定的实用价值。关键词:五笔字型,汉字输入技术,数据库、引言 学习汉字五笔字型输入法的时候,初学者由于不熟练汉字的编码,常常在计算机面前发楞。这时如果手中有一本五笔字型编码本的话,就可以解除初学者的烦恼:上机输入汉字遇到困难,翻一翻编码本困难就解决了;更多的是平时练习拆字编码,编码本也可以帮上大忙,如果拆一百个汉字,有九十多个编码正确,那么他在上机时就成竹在胸。由此可见,若给学生五笔字型输入法的编码本,可以加快汉字输入的教学进度。 然而要给“新华字典”中七千多个汉字(其中包括同字不同音的汉字)编五笔字型码,工作量大且会有差错;就算给所有的汉字都编好了码,出版商面对那么多汉字和编码的排版,差错也在所难免。市面上出版的汉字编码本常常会有这样的缺点,即不是汉字弄错就是编码不对,这些都是人工操作难于避免的。 本文尝试用FOXPRO关系数据库编写的程序取出UCDOS希望汉字系统字库中的单字拼音编码和五笔字型编码,将它们结合在一起,然后由激光打印机输出三维的按拼音索引的五笔字型编码表,最后集装成本,整个过程几乎由计算机完成,编制出来的编码本不但毫无差错,而且可以设计得美观大方。1、算法流程图及设计表样1.1 流程1.2 表样设计由此所设计出的三维五笔字型输入法编码本的第一页为:A BANG 拼音 字 编码拼音 字 编码拼音 字 编码拼音 字 编码A 阿 BSA 啊 KBA 腌 EDJNA 锕 QBSAI 爱 EPAI 埃 FCTAI 碍 DJGAI 矮 TDTVAI 挨 RCTAI 唉 KCTAI 哎 KAQAI 哀 YEUAI 皑 RMNNAI 癌 UKKAI 蔼 AYJAI 艾 AQUAI 隘 BUWAI 呆 KSAI 捱 RDFFAI 嗳 KEPAI 嗌 KUWAI 嫒 VEPCAI 瑷 GEPCAI 暧 JEPAI 砹 DAQYAI 锿 QYEYAI 霭 FYJNAN 安 PVAN 按 RPVAN 暗 JUAN 岸 MDFJAN 案 PVSAN 俺 WDJNAN 氨 RNPAN 胺 EPVAN 鞍 AFPAN 谙 YUJAN 埯 FDJAN 揞 RUJGAN 犴 QTFHAN 庵 YDJNAN 桉 SPVAN 铵 QPVAN 鹌 DJNGAN 黯 LFOJANG 昂 JQBANG 肮 EYMANG 盎 MD LAO 凹 MMGDAO 奥 TMOAO 敖 GQTYAO 熬 GQTOAO 翱 RDFNAO 袄 PUTAO 傲 WGQTAO 懊 NTMAO 澳 ITMAO 坳 FXLAO 拗 RXLAO 嗷 KGQTAO 岙 TDMAO 廒 YGQAO 遨 GQTPAO 媪 VJLAO 骜 GQTCAO 獒 GQTDAO 聱 GQTBAO 螯 GQTJAO 鏊 GQTQAO 鳌 GQTGAO 鏖 YNJQBA 把 RCNBA 八 WTYBA 吧 KCBA 巴 CNHBA 拔 RDCBA 霸 FAFBA 罢 LFCBA 爸 WQCBA 坝 FMYBA 芭 ACBA 捌 RKLJBA 扒 RW YBA 叭 KWYBA 笆 TCBBA 疤 UCVBA 跋 KHDCBA 靶 AFCBA 耙 DICBA 茇 ADCBA 菝 ARDBA 岜 MCBBA 灞 IFABA 钯 QCNBA 粑 OCNBA 鲅 QGDCBA 魃 RQCCBAI 百 DJBAI 白 RRRBAI 败 MTYBAI 摆 RLFBAI 伯 WRBAI 柏 SRGBAI 佰 WDJBAI 拜 RDFHBAI 稗 TRTFBAI 捭 RRTBAI 掰 RWVRBAN 办 LWBAN 半 UFBAN 板 SRCBAN 班 GYTBAN 般 TEMBAN 版 THGCBAN 拌 RUFHBAN 搬 RTEBAN 斑 GYGBAN 扳 RRCBAN 伴 WUFBAN 颁 WVDBAN 扮 RWVBAN 瓣 URBAN 绊 XUFBAN 阪 BRCYBAN 坂 FRCBAN 钣 QRCBAN 瘢 UTECBAN 癍 UGYBAN 舨 TERCBANG 帮 DTBANG 棒 SDWBANG 邦 DTBBANG 榜 SUPBANG 梆 SDTBANG 膀 EUPBANG 绑 XDTBANG 磅 DUPBANG 蚌 JDHBANG 镑 QUPBANG 傍 WUP . 1 . 2、单字编码的取得 要取得UCDOS字库中单字的拼音和五笔编码,必须先取得相应的编码源文件,因为在编码源文件里面汇集了单字和词组的编码。拼音和五笔字型编码源文件PY.DIC和WB.DIC可以在UCDOS目录下通过运行万能输入法管理器IMGMNG.EXE获得: IMDMNG DRV.IMD PY.DIC,及 IMDMNG DRV.IMD WB.DIC。 为了将PY.DIC和WB.DIC这两个文本文件的正文部分传入对应的库文件中,应先建立好这两个库文件的结构: PY.DBF: WB.DBF: 字段名 类型 长度 字段名 类型 长度 PM C 6 PM C 4 KG C 6 KG C 8 ZM C 150 ZM C 20以上各字段名的长度是这样确定的: 在PY.DBF中,单字的拼音码最长为6个字符,故取拼音编码(PM)字段长度为6,在字码字段(ZM)前多余的6个字符位设为空格(KG)字段长度。ZM字段的长度为150,是因为在拼音输入法中,同音单字(即重码)较多的缘故。 在WB.DBF中,因五笔字型码长最长为4,故取五笔字型编码PM字段长度为4,KG字段长度为8,又因重码单字不多,考虑了余量后取ZM字段长度为20。 由于记录近万条,字段的长度的大小将显著影响程序运行的速度,在将编码源文件的正文传到库文件中后,即用拷贝库文件的方法即行将KG字段去掉,生成新的库文件PY1.DBF和WB1.DBF,同时为了节省磁盘空间,及时把原库文件PY.DBF和WB.DBF中的记录用ZAP命令删除。如: USE PY APPE FROM PY.DIC FOR ISLOWER(PY)=.T. SDF COPY TO PY1 FIELDS PM,ZM ZAP USE WB APPE FROM WB.DIC FOR ISLOWER(WB)=.T. SDF COPY TO WB1 FIELDS PM,ZM ZAP 用以装载单字编码的库文件为PY2.DBF和WB2.DBF,它们的库结构是在以上两个库结构去掉KG字段并将ZM字段长度改为2得到的,另外在PY2.DBF中增加了长度为4的WB字段,准备给按汉语拼音顺序排列的汉字编五笔字型码。 在取单字编码的转换程序中,主工作区打开PY1.DBF,第二工作区打开PY2.DBF,跳过PY1.DBF中的词组记录,只将拆取的单字及其编码传送到PY2.DBF中。由于取单字的拼音码和取单字的五笔字型码的过程一样,下面是以取拼音码为例的一个程序段:* MABEN1.PRGUSE PY1SELE BUSE PY2SELE ADO WHILE .NOT. EOF(1) X=TRIM(PM) Y=TRIM(ZM) M=AT( ,Y) IF LEN(Y)=2 SELE B APPE BLANK REPL PM WITH X,ZM WITH Y SELE A SKIP LOOP ENDIF DO WHILE M0 M=AT( ,Y) Z=SUBSTR(Y,1,M-1) Y=SUBSTR(Y,M+1) N=IIF(M=0,Y,Z) IF LEN(N)=2 SELE B APPE BLANK REPL PM WITH X,ZM WITH N SELE A ENDIF ENDDO SELE A SKIPENDDORETURN3、单字拼音编码库文件记录的修改 由于全拼双音编码字典PY.IMD采用模糊搜索,使得生成的编码源文件PY.DIC中单个声母也对应有许多单字的重码。因此,在PY2.DBF中应删除这些记录,即删除那些编码长度为一个字符,并且这些字符不是a,e,o的记录: USE PY2 DELETE ALL FOR LEN(TRIM(PM)=1 .AND. TRIM(PM)a .AND. TRIM(PM)e .AND. TRIM(PM)o PACK 另外,对于编码为a,an,e,o的记录中由于模糊搜索加进里面的不符合汉语拼音规则的单字也应删除。这时可采用BROWSE全屏幕编辑命令,删除单字后存盘退出全屏幕编辑,最后用 DELETE ALL FOR LEN(TRIM(ZM)=0 PACK删除这些记录。经过修改整理的PY2.BF中共有记录7221条。4、给PY2.DBF中的汉字配五笔字型码 在给PY2.DBF中的汉字编五笔字型码时采用的方法是汉字按原拼音顺序不变,先将生成的单字五笔字型编码库文件WB2.DBF按字码(ZM)为关键字建立索引,同时合并汉字相同的记录,索引文件为IWB2.INX,这样,在索引文件中,汉字的五笔字型编码有简码的用简码,并且以最少编码为准。然后在PY2.DBF中逐个记录对每一个汉字在索引文件WB2.INX中用SEEK命令查找相同汉字的五笔字型编码,找到后替换到该记录的WB字段中去。在查找替换完成后,将小写的拼音和五笔字型编码全部换成大写字母。* JM。PRGUSE PY2SELE BUSE WB2 INDEX IWB2SELE ADO WHILE .NOT. EOF(1) Y=ZM SELE B SEEK Y SELE A REPL WB WITH B-PM SKIPENDDOSELE BCLOSE INDEXSELE AREPL ALL PM WITH UPPER(PM),WB WITH UPPER(WB)5、三维编码本的输出 下面的程序可以根据所设计的每页版面输出。例如设计每页35行,4列,共140个汉字的拼音码和五笔字型码,则编码本的第1页如本文第二部分所示,每列汉字左边是用来索引的拼音码,右边是五笔字型码,第二列紧接第一列的末尾,第三列紧接第二列的末尾,如此类推。第二页紧接第一页,如此类推,总共有52页,列与列之间用细竖线分隔,用两粗竖线做边线。根据输出格式要求,用作最后输出的库文件PY3。DBF对应有如下的库结构: 字段名 类型 长度 字段名 类型 长度 ZF C 2 ZF3 C 2 PM C 6 P3 C 6 ZM C 4 Z3 C 4 WB C 4 W3 C 4 ZF2 C 2 ZF4 C 2 P2 C 6 P4 C 6 Z2 C 4 Z4 C 4 W2 C 4 W4 C 4 ZF5 C 2共17个字段。 本段程序设计:* LL.PRGN=1K=35M=4USE PPYSELE BUSE PY1DO WHILE NM+1 P=LTRIM(STR(N) COPY TO PYY&P USE PYY&P DELETE NEXT K*(N-1) IF N1 SKIP ENDIF DO WHILE .NOT. EOF(2) SKIP K DELETE NEXT K*(M-1) IF RECNO()PM,Z&P WITH B-ZM,W&P WITH B-WB SELE B ZAP ENDIF USE PY1 N=N+1ENDDO SELE A REPL ALL ZF WITH ,ZF2 WITH ,ZF3 WITH ,ZF4 WITH ,ZF5 WITH COPY TO LCJ SELE C USE LCJ SELE AGO 1Y=1 INSERT BLANK BEFOREDO WHILE .NOT. EOF(1) P=LTRIM(STR(Y) SELE C YY1=PM SKIP K-1 YY2=P4 IF RECNO()RECCOUNT() SKIP ENDIF SELE A REPL PM WITH YY1,ZM WITH -,WB WITH YY2 INSERT BLANK REPL ZF WITH ,PM WITH ,ZM WITH ,WB WITH ,ZF2 WITH ,P2 WITH ,Z2 WITH ,W2 WITH REPL ZF3 WITH ,P3 WITH ,Z3 WITH ,W3 WITH ,ZF4 WITH ,P4 WITH ,Z4 WITH ,W4 WITH REPL ZF5 WITH INSERT BLANK REPL ZF WITH ,PM WITH 拼音 ,ZM WITH 字 ,WB WITH 编码,ZF2 WITH ,P2 WITH 拼音,Z2 WITH 字 ,W2 WITH 编码 REPL ZF3 WITH ,P3 WITH 拼音 ,Z3 WITH 字 ,W3 WITH 编码,ZF4 WITH ,P4 WITH 拼音,Z4 WITH 字 ,W4 WITH 编码 REPL ZF5 WITH INSERT BLANK REPL ZF WITH ,PM WITH ,ZM WITH ,WB WITH ,ZF2 WITH ,P2 WI
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《GBT 18473-2016 工业机械电气设备 控制与驱动装置间实时串行通信数据链路》专题研究报告
- 矿井通风工安全宣教能力考核试卷含答案
- 2025年自考土木工程(专科)《工程测量》测验卷及答案
- 重冶固体物料配料工岗前班组协作考核试卷含答案
- 海绵钛还原蒸馏工操作规程测试考核试卷含答案
- 化工原料准备工安全管理强化考核试卷含答案
- 甘油精制工创新实践评优考核试卷含答案
- 《GBT 35590-2017 信息技术 便携式数字设备用移动电源通 用规范》专题研究报告
- 人工智能算法测试员持续改进知识考核试卷含答案
- 证券期货服务师岗前个人防护考核试卷含答案
- 医疗人工智能在疾病诊断与治疗中的应用
- 消防改造施工技术方案范本编写方案
- 2025年法宣在线普法考试试题库及答案
- 新人教版初三数学期末试卷分析
- 信息技术安全合规检查表
- IT部系统架构设计报告
- 流行性感冒预防课件
- 个人学期成长计划
- 2025贵州毕节市市直事业单位面向基层考调工作人员39人笔试考试参考试题及答案解析
- 旅行社导游合同范本
- 超声骨刀拔牙技术
评论
0/150
提交评论