标准解读
GB/T 17961-2000 是一项由中国发布的国家标准,全称为《印刷体汉字识别系统要求与测试方法》。这项标准主要针对印刷体汉字的自动识别技术,规定了此类系统应满足的基本要求及性能评估的测试方法,旨在促进汉字识别技术的标准化和规范化,提升系统的可靠性和准确性。以下是该标准的主要内容概览:
1. 范围
该标准明确了适用范围,即规定了印刷体汉字识别系统在设计、开发、评估时应遵循的要求和测试方法。这些系统主要用于从各种印刷材料中自动识别并提取汉字信息。
2. 规范性引用文件
列出了实施该标准时所直接引用或参考的其他标准文献,确保了各项要求和技术细节的一致性和兼容性。
3. 术语和定义
对涉及的关键术语进行了明确界定,如“识别率”、“拒识率”、“误识率”等,为后续要求和测试提供了统一的语言基础。
4. 系统要求
- 识别能力:要求系统能有效识别规定范围内的汉字字符集,包括常用字、罕用字以及特定领域的专业字符。
- 准确率:设定了识别准确率的最低标准,包括总体识别准确率和特定条件下的识别准确率(如不同字体、字号、印刷质量)。
- 处理速度:规定了系统处理文本的速度要求,确保在实际应用中的效率。
- 鲁棒性:要求系统对文档条件变化(如倾斜、噪声、背景复杂度)有较好的适应性和稳定性。
- 用户界面:对于面向用户的系统,要求具备友好、直观的操作界面,便于用户操作和结果查看。
5. 测试方法
详细描述了如何对上述要求进行测试,包括:
- 测试样本集:建立包含各种条件下的样本文本,以全面评估系统的识别能力。
- 测试环境:规定了测试时的软硬件环境和条件,确保测试结果的可比性和重复性。
- 评价指标:具体说明了如何计算识别率、拒识率、误识率等关键性能指标。
- 测试流程:阐述了从样本选取到数据处理、结果分析的整个测试过程。
6. 性能报告
指导如何编制性能测试报告,包括测试条件、测试结果、性能分析等内容,以便于系统性能的客观评价和比较。
如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。
....
查看全部
文档简介
I C S 3 5 . 2 4 0 . 2 0IL 6 7石日中 华 人 民 共 和 国 国 家 标 准G B / T 1 7 9 6 1 -2 0 0 0印刷体汉字识别系统要求与测试方法R e q u i r e me n t s a n d t e s t m e t h o d s f o r i d e n t i f y s y s t e m o f p r i n t e d C h i n e s e c h a r a c t e r2 0 0 0 一 0 1 一 0 3发 布2 0 0 0 一 0 8 一 0 1实施国 家 质 i ft技 术 监 督 局发布免费标准下载网( w w w . f r e e b z . n e t )免费标准下载网( w w w . f r e e b z . n e t ) 无需注册, 即可下载cB / T 1 7 9 6 1 -2 0 0 0前言 本标准是非键盘输人标准. 它规定印刷体汉字识别系统的功能、 技术要求、 测试方法, 该标准的制定和实施将正确引导印刷体汉字识别系统的研制与开发。 本标准的附录A是提示的附录。 本标准由中华人民共和国信息产业部提出。 本标准由中国电子技术标准化研究所归口。 本标准起草单位: “ 八六三 ,计算机智能主题专家组。 本标准主要起草人 : 顾小凤、 丁晓青、 刘迎建、 钱跃良。免费标准下载网( w w w . f r e e b z . n e t )免费标准下载网( w w w . f r e e b z . n e t ) 无需注册, 即可下载中 华 人 民 共 和 国 国 家 标 准印刷体汉字识别 系统要求与测试方法G B / T 1 7 9 6 1 -2 0 0 0R e q u i r e me n t s a n d t e s t me t h o d s f o r i d e n t i f y s y s t e m o f p r i n t e d C h i n e s e c h a r a c t e r1范围 本标准规定了印刷体汉字识别系统的功能、 技术要求和测试方法。 本标准适用于印刷体汉字识别系统, 也适用于其他有关系统。2 引用标准 下列标准所包含的条文, 通过在本标准中引用而构成为本标准的条文。本标准出版时, 所示版本均为有效。所有标准都会被修订, 使用本标准的各方应探讨使用下列标准最新版本的可能性。 GB 2 3 1 2 -1 9 8 0 信息交换用汉字编码字符集基本集 G B / T 7 5 8 9 -1 9 8 7 信息交换用汉字编码字符集 第二辅助集 G B / T 7 5 9 0 -1 9 8 7 信息交换用汉字编码字符集 第四辅助集 G B / T 1 2 3 4 5 -1 9 9 。 信息交换用汉字编码字符集 辅助集 G B 1 3 0 0 0 . 1 -1 9 9 3 信息 技术 通用多八位编码字符集( U C S ) 第 1 部分: 体系 结构 ( i d t I S O/ I EC 1 0 6 4 6 - 4: 1 9 9 3 ) G B 1 3 1 3 1 -1 9 9 1 信息交 换用汉字编码字符集 第三辅助集 GB 1 3 1 3 2 -1 9 9 1 信息交换用汉字编码字符集第五辅助集3系统功能3 . 1 基本功能3 . 1 . 1 预处理 将普通纸媒体文本在 自动或人工干预下通过光学输人设备将印刷信息转换成适合识别的灰度( 含二值) 图像。3 . 1 . 2 识别 将上述图像所包括的印刷符号转换为G B 2 3 1 2 , G B / T 7 5 8 9 , G B / T 7 5 9 0 , G B / T 1 2 3 4 5 ,G B 1 3 0 0 0 . 1 , G B 1 3 1 3 1 和G B 1 3 1 3 2 所规定的编码信息3 . 2 扩展功能3 . 2 . 1 版面分析 应将版面自动分成块, 并正确标明每个块的属性, 对文字块还需标明各块之间连接关系的逻辑序号 。3 . 2 . 2 表格识别 应能正确识别表格线, 并可将表格和文字建立对应关系。国家质f技术监督局 2 0 0 0一 0 1一 0 3批准2 0 0 0一 0 8一 0 1实施免费标准下载网( w w w . f r e e b z . n e t )免费标准下载网( w w w . f r e e b z . n e t ) 无需注册, 即可下载Ce / r 1 7 9 6 1 -2 0 0 04要求4 . 1 识别率 对于正式出版物及打印质量与其相当的打印文件的识别率应大于 9 5 0 o .4 . 2 误识率 对于正式出版物及打印质量与其相当的打印文件的误识率应小于2 X.4 . 3 识别速度 使用 6 . 3版本 , 识 别速度应大于 1 0字/ 秒5测试方法5 . 1 测试样张 测试时参照采用附录 A给出的测试样张, 在实际测试时, 有关测试机构可依据样张的字体、 字号和版面布局随机提供多种测试样张, 测试样张至少应包含 1 0 3 个印刷符号。5 . 2 识别率、 误识率测试5 . 2 . 1 测试设备 应采用通用操作系统及与其相适应的微型数字电子计算机。5 . 2 . 2 测试样张 测试样张采用 5 . 1 规定的样张。5 . 2 . 3 测试结果 识别率测试结果按式( 1 ) 计算: 识别率 二 ( C / N) X 1 0 0 % 。 。 , (1)式中: C -测试样张中被正确识别的印刷符号数; N测试样张中印刷符号总数。 误识率测试结果按式( 2 ) 计算: 误识率 二 ( E / N) X 1 0 0 % 。 一 (2)式中: E -测试样张中被错误识别的印刷符号数; N-测试样张中印刷符号总数。 测试结果应符合4 . 1 和 4 . 2 的要求。5 . 3 识别速度测试5 . 3 . 1 测试设备 采用 5 . 2 . 1 规定的测试设备。5 . 3 . 2 测试样张 测试样张采用 5 . 1规定的样张。5 . 3 . 3 测试结果 识别速度测试结果按式( 3 ) 计算 : 识别速度 =NI T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ( 3)式中: N-测试样张中印刷符号总数; T识别系统从开始读取测试数据至将识别结果记录到媒体上所用的时间。 识别速度应符合 4 . 3的要求免费标准下载网( w w w . f r e e b z . n e t )免费标准下载网( w w w . f r e e b z . n e t ) 无需注册, 即可下载cB / T 1 7 9 6 1 -2 0 0 0 附录A ( 提示的附 录)测试样张客中 作 李 白兰溪掉歌戴叔伦春望杜甫兰陵美酒郁金香 ,玉碗盛来琉角光。但使主人能醉客,不知何处是他 乡。凉月如眉挂柳湾,越中山色镜中看。兰溪三日桃花雨.半夜鲤鱼来上滩。国破山河在,城春草木深。感时花溅泪,寸 民 别鸟惊心。烽火连三月,家书抵万金。白头搔更短,浑欲不胜替。宣州榭眺樱麟别校害叔霎 李白案我去者,昨日之日不可留。乱我心者,今日之日多烦夏。畏夙离里送秋雁,封此可以酣高楼。蓬莱文章建安骨,中简小榭又清聆。俱镶逸舆壮思采,欲上青天境明月。抽刀断水水更流,攀杯销愁愁更愁。人生在世不裤意,明朝散夔弄扁舟。拓目,、了进 白 李将君不见黄河之水天上来,奔流到海不复回。君不见高堂明镜悲白发,朝如青丝暮成雪。人生得意须尽欢,莫使金博空对月。天生我材必有用,千金散尽还复来。烹羊宰牛且为乐,会须一饮三百杯 。岑夫 子, 丹丘生,将进酒, 君莫停。与君歌一曲,请君为我倾耳听。钟鼓撰玉不足贵 ,但愿长醉不复
温馨提示
- 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
- 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。
最新文档
- 高中生冬季预防传染病
- 常见传染病的识别与预防
- 行政主管年终总结模版
- 梅毒护理诊断及护理措施
- 人教版高中物理必修二第七章第8节机械能守恒定律习题课教学设计
- 下学期历史教学的工作总结模版
- 新质生产力绿色生产力
- 山东省济南平阴县联考2025年数学七下期末综合测试试题含解析
- 内蒙古鄂尔多斯准格尔旗第四中学2025届八年级数学第二学期期末综合测试模拟试题含解析
- 2025届福建省福州师范大泉州附属中学数学八下期末质量检测试题含解析
- 教练技术三阶段讲义
- GB/T 27760-2011利用Si(111)晶面原子台阶对原子力显微镜亚纳米高度测量进行校准的方法
- GB/T 223.26-2008钢铁及合金钼含量的测定硫氰酸盐分光光度法
- GB/T 1766-2008色漆和清漆涂层老化的评级方法
- 2023年第五届全国大学生化学实验竞赛笔试题及答案
- GB 31634-2014食品安全国家标准食品添加剂珍珠岩
- GB 2715-2016食品安全国家标准粮食
- 二年级体育教案-《立定跳远》说课稿 全国通用
- 门诊特殊药品使用申请表
- 第25课《活板》复习课件-部编版语文七年级下册
- 北京服务器采购招标文件
评论
0/150
提交评论