GB13131-1991信息交换用汉字编码字符集第三辅助集.pdf_第1页
GB13131-1991信息交换用汉字编码字符集第三辅助集.pdf_第2页
GB13131-1991信息交换用汉字编码字符集第三辅助集.pdf_第3页
GB13131-1991信息交换用汉字编码字符集第三辅助集.pdf_第4页
GB13131-1991信息交换用汉字编码字符集第三辅助集.pdf_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

I C S 3 5 . 2 4 0 . 2 0 IL 6 7 石日 中 华 人 民 共 和 国 国 家 标 准 G B / T 1 7 9 6 1 -2 0 0 0 印刷体汉字识别系统要求与测试方法 R e q u i r e me n t s a n d t e s t m e t h o d s f o r i d e n t i f y s y s t e m o f p r i n t e d C h i n e s e c h a r a c t e r 2 0 0 0 一 0 1 一 0 3发 布2 0 0 0 一 0 8 一 0 1实施 国 家 质 i ft技 术 监 督 局发布 cB / T 1 7 9 6 1 -2 0 0 0 前言 本标准是非键盘输人标准. 它规定印刷体汉字识别系统的功能、 技术要求、 测试方法, 该标准的制定 和实施将正确引导印刷体汉字识别系统的研制与开发。 本标准的附录A是提示的附录。 本标准由中华人民共和国信息产业部提出。 本标准由中国电子技术标准化研究所归口。 本标准起草单位: “ 八六三 ,计算机智能主题专家组。 本标准主要起草人 : 顾小凤、 丁晓青、 刘迎建、 钱跃良。 中 华 人 民 共 和 国 国 家 标 准 印刷体汉字识别 系统要求与测试方法 G B / T 1 7 9 6 1 -2 0 0 0 R e q u i r e me n t s a n d t e s t me t h o d s f o r i d e n t i f y s y s t e m o f p r i n t e d C h i n e s e c h a r a c t e r 1范围 本标准规定了印刷体汉字识别系统的功能、 技术要求和测试方法。 本标准适用于印刷体汉字识别系统, 也适用于其他有关系统。 2 引用标准 下列标准所包含的条文, 通过在本标准中引用而构成为本标准的条文。本标准出版时, 所示版本均 为有效。所有标准都会被修订, 使用本标准的各方应探讨使用下列标准最新版本的可能性。 GB 2 3 1 2 -1 9 8 0 信息交换用汉字编码字符集基本集 G B / T 7 5 8 9 -1 9 8 7 信息交换用汉字编码字符集 第二辅助集 G B / T 7 5 9 0 -1 9 8 7 信息交换用汉字编码字符集 第四辅助集 G B / T 1 2 3 4 5 -1 9 9 。 信息交换用汉字编码字符集 辅助集 G B 1 3 0 0 0 . 1 -1 9 9 3 信息 技术 通用多八位编码字符集( U C S ) 第 1 部分: 体系 结构 ( i d t I S O/ I EC 1 0 6 4 6 - 4: 1 9 9 3 ) G B 1 3 1 3 1 -1 9 9 1 信息交 换用汉字编码字符集 第三辅助集 GB 1 3 1 3 2 -1 9 9 1 信息交换用汉字编码字符集第五辅助集 3系统功能 3 . 1 基本功能 3 . 1 . 1 预处理 将普通纸媒体文本在 自动或人工干预下通过光学输人设备将印刷信息转换成适合识别的灰度( 含 二值) 图像。 3 . 1 . 2 识别 将上述图像所包括的印刷符号转换为G B 2 3 1 2 , G B / T 7 5 8 9 , G B / T 7 5 9 0 , G B / T 1 2 3 4 5 , G B 1 3 0 0 0 . 1 , G B 1 3 1 3 1 和G B 1 3 1 3 2 所规定的编码信息 3 . 2 扩展功能 3 . 2 . 1 版面分析 应将版面自动分成块, 并正确标明每个块的属性, 对文字块还需标明各块之间连接关系的逻辑序 号 。 3 . 2 . 2 表格识别 应能正确识别表格线, 并可将表格和文字建立对应关系。 国家质f技术监督局 2 0 0 0一 0 1一 0 3批准2 0 0 0一 0 8一 0 1实施 Ce / r 1 7 9 6 1 -2 0 0 0 4要求 4 . 1 识别率 对于正式出版物及打印质量与其相当的打印文件的识别率应大于 9 5 0 o . 4 . 2 误识率 对于正式出版物及打印质量与其相当的打印文件的误识率应小于2 X. 4 . 3 识别速度 使用 6 . 3版本 , 识 别速度应大于 1 0字/ 秒 5测试方法 5 . 1 测试样张 测试时参照采用附录 A给出的测试样张, 在实际测试时, 有关测试机构可依据样张的字体、 字号和 版面布局随机提供多种测试样张, 测试样张至少应包含 1 0 3 个印刷符号。 5 . 2 识别率、 误识率测试 5 . 2 . 1 测试设备 应采用通用操作系统及与其相适应的微型数字电子计算机。 5 . 2 . 2 测试样张 测试样张采用 5 . 1 规定的样张。 5 . 2 . 3 测试结果 识别率测试结果按式( 1 ) 计算: 识别率 二 ( C / N) X 1 0 0 % 。 。 , (1) 式中: C -测试样张中被正确识别的印刷符号数; N测试样张中印刷符号总数。 误识率测试结果按式( 2 ) 计算: 误识率 二 ( E / N) X 1 0 0 % 。 一 (2) 式中: E -测试样张中被错误识别的印刷符号数; N-测试样张中印刷符号总数。 测试结果应符合4 . 1 和 4 . 2 的要求。 5 . 3 识别速度测试 5 . 3 . 1 测试设备 采用 5 . 2 . 1 规定的测试设备。 5 . 3 . 2 测试样张 测试样张采用 5 . 1规定的样张。 5 . 3 . 3 测试结果 识别速度测试结果按式( 3 ) 计算 : 识别速度 =NI T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ( 3) 式中: N-测试样张中印刷符号总数; T识别系统从开始读取测试数据至将识别结果记录到媒体上所用的时间。 识别速度应符合 4 . 3的要求 cB / T 1 7 9 6 1 -2 0 0 0 附录A ( 提示的附 录) 测试样张 客中 作 李 白 兰溪掉歌 戴叔伦 春望 杜甫 兰陵美酒郁金香 , 玉碗盛来琉角光。 但使主人能醉客, 不知何处是他 乡。 凉月如眉挂柳湾, 越中山色镜中看。 兰溪三日桃花雨. 半夜鲤鱼来上滩。 国破山河在, 城春草木深。 感时花溅泪, 寸 民 别鸟惊心。 烽火连三月, 家书抵万金。 白头搔更短, 浑欲不胜替。 宣州榭眺樱麟别校害叔霎 李白 案我去者, 昨日之日不可留。 乱我心者, 今日之日多烦夏。 畏夙离里送秋雁, 封此可以酣高楼。 蓬莱文章建安骨, 中简小榭又清聆。 俱镶逸舆壮思采, 欲上青天境明月。 抽刀断水水更流, 攀杯销愁愁更愁。 人生在世不裤意, 明朝散夔弄扁舟。 拓目 ,、了 进 白 李 将 君不见黄河之水天上来, 奔流到海不复回。 君不见高堂明镜悲白发, 朝如青丝暮成雪。 人生得意须尽欢, 莫使金博空对月。 天生我材必有用, 千金散尽还复来。 烹羊宰牛且为乐, 会

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论