下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICS35.240.01
CCSL77
34
安徽省地方标准
DB34/T4555—2023
儿童智能指读技术规范
Specificationforintelligentfinger-pointingtechnicalofchildren
2023-10-07发布2023-11-07实施
安徽省市场监督管理局发布
DB34/T4555—2023
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由安徽淘云科技股份有限公司提出。
本文件由安徽省经济和信息化厅归口。
本文件起草单位:安徽淘云科技股份有限公司、科大讯飞股份有限公司、安徽工程大学计算机与信
息学院、合肥巴灵瑞教育科技有限公司、合肥赑歌数据科技有限公司、安徽长三角数据感知与治理研究
院、江苏理工学院、合肥师范学院、合肥智能语音创新发展有限公司。
本文件主要起草人:朱翠玲、刘庆升、王晓斐、叶娟、方明、叶剑鸣、陶皖、陈慧珺、毛四方、吕
雪、胡连峰、宋若淼、王忍宝、姜志文、孙艳、张泽之、武方芳。
I
DB34/T4555—2023
儿童智能指读技术规范
1范围
本文件规定了儿童智能指读技术的术语和定义、技术路线和要求。
本文件适用于儿童智能指读技术的应用。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T34053.3纸质印刷产品印制质量检验规范第3部分:图书期刊
GB/T34053.4纸质印刷产品印制质量检验规范第4部分:中小学教科书
GB/T34053.5纸质印刷产品印制质量检验规范第5部分:报纸
GB/T36480-2018信息技术紧缩嵌入式摄像头通用规范
3术语和定义
下列术语和定义适用于本文件。
智能指读技术Intelligentfinger-pointing
基于手指检测、图像检索、图文识别、热区匹配等技术,通过TTS或其他信息映射技术,将读物内
容输出为语音或文本的一种人机交互技术。
指向词技术Directionalwordtechnology
基于指尖检测模型对摄像头获取的图像进行处理,提取指尖位置信息,获取指尖处文字区域,经图
文识别输出数据的一种人机交互技术。
点读技术Clickreadingtechnology
基于指尖检测模型对摄像头获取的图像进行处理,提取指尖位置信息,利用检索模型检索当前读物
信息,结合指尖位置信息做热区匹配相关交互处理,输出数据的一种人机交互技术。
4技术路线
儿童智能指读技术路线见图1。
1
DB34/T4555—2023
图1儿童智能指读技术路线
5要求
图像采集
5.1.1概述
采集设备上的摄像头对放置在设备拍摄工作范围内放置的读物进行拍摄采像。
5.1.2采集读物要求
读物具体要求见表1。
表1读物要求
序号项目指向词技术点读技术
适用于满足GB/T34053.3、GB/T34053.4和适用于GB/T34053.4中规定的教材、教
1读物范围
GB/T34053.5中规定的质量要求的印刷材料辅、绘本等印刷材料
最大可以支持2号字体
2字号要求—
最小可以支持6号字体
适用字体中文包括但不限于宋体、楷体及隶书
3字体要求等,英文应包括但不限于TimesNewRoman、—
Arial及Calibri等。
4读物位置读物应置于设备的拍摄工作范围内
5.1.3采集设备要求
5.1.3.1摄像头几何失真要求
摄像头的几何失真应满足GB/T36480-2018中6.4.7几何失真的要求。
2
DB34/T4555—2023
5.1.3.2装配尺寸要求
摄像头与产品手板装配时,确保摄像头安装配合尺寸的一致性。
5.1.3.3图像质量要求
图像应满足色彩质量、清晰度和分辨率的要求,详细内容见表2。
表2色彩质量、清晰度和分辨率的要求
序号项目具体要求
1色彩质量RGB三通道数据能还原出所拍摄的拍摄对象真实色彩信息。
2清晰度在6号字,A3纸中字体轮廓清晰可见。
3分辨率在6号字,中文字符所占像素不少于50×50。
5.1.4手指要求
5.1.4.1手势要求
单手指指向读物内容。
5.1.4.2手指位置
在指向词应用场景中,手指指着读物上的内容下方;在点读应用场景中,手指指着读物上的内容。
5.1.4.3指读精度
手指检测定位精度不超过5号字一个字符的宽度。
5.1.5环境光要求
环境光亮度应满足以下要求:
——不应在拍摄对象的表面形成反光;
——环境光亮度不能太暗,导致拍摄图像不清晰。
区域判定
5.2.1概述
把摄像头拍摄的图像送入指尖检测模型进行图像处理,并在处理后的图像中提取用户手指指尖在
读物上的位置信息,并根据位置信息判定是指向词还是点读。
5.2.2图像处理
5.2.2.1对采集图像的外围区域进行切除处理,去除无效边界区域,但不能去除含有读物的图像。
5.2.2.2对采集图像进行缩放处理,以提升检测效率和指尖定位精度。
5.2.2.3对采集图像进行转码处理,以满足手指检测模型的检测需要。
5.2.3提取位置信息
5.2.3.1应包含对手指图像的稳定性检测判断,以保证手指指尖位置信息提取的准确性。
5.2.3.2通过指尖位置信息判断用户意图是使用指向词功能还是使用点读功能。
3
DB34/T4555—2023
5.2.3.3指尖检测模型的训练数据应包含儿童应用的各种场景,场景包括但不限于不同年级学生、不
同肤色手指及不同指甲颜色等。
5.2.3.4指尖检测模型的总训练数据不少于100万条,并按照均等化的比例分配在各种场景中。
识别和搜索
5.3.1概述
5.3.1.1根据位置信息判定是指向词功能,则执行识别应用功能。
5.3.1.2根据位置信息判定是点读功能,则实行搜索应用功能。
5.3.2识别
5.3.2.1识别过程
根据指尖位置信息,裁剪指尖处文字区域图片,文字区域图片要覆盖指尖处的字或词;然后使用预
训练好的识别模型对指尖处文字区域图片进行文字信息识别,获得可读文字信息。
5.3.2.2识别模型
识别模型的训练数据应含有不同背景信息、不同文字大小及不同字体类型等;且总数据不少于100
万条,并且按照均等化的比例进行分配。
5.3.2.3文字背景
文字所在读物的背景信息应多样化,包括彩色和非彩色背景等。
5.3.3搜索
5.3.3.1搜索过程
利用检索模型通过采集图像检索当前的读物信息,然后结合指尖信息和读物信息做热区匹配,确定
用户指读的区域在读物中的位置信息。
5.3.3.2搜索模型
模型训练应支持各种场景的书籍,包括纯文字书
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年保密考试简答题含解析及答案
- 第12章 植物维持生物圈的稳定教学设计初中生物学苏科版2024七年级下册-苏科版2024
- 数学六年级下册4 比例3 比例的应用用比例解决问题教案设计
- 吉林省东辽县安石镇第二中学校九年级化学下册 第九单元 课题3 溶质的质量分数教学设计 新人教版
- 数学人教版(2024)8.3 实数及其简单运算第1课时教学设计
- 高一体育 促进健康保持健康教学设计
- 附录·跨学科主题活动方案示例2023-2024学年七年级下册历史同步教学设计
- 车位预售买卖合同模板
- 课文古代诗词诵读教学设计-2025-2026学年中职语文拓展模块高教版
- Unit1 starting out 教案外研版(2024)七年级英语下册
- 丁烷安全知识培训课件
- 2025年美国心脏学会(AHA)心肺复苏(CPR)和心血管急救(ECC)指南
- 白皮书《中国外贸产业带全景图鉴》
- 品牌活动策划与执行指南手册
- 数控机床操作工岗位操作安全手册
- 机动车年检免检申请委托书范本
- 2025版药典凡例培训
- 2026年一级造价师之建设工程计价考试题库500道附完整答案【名校卷】
- 十年(2016-2025)高考化学真题分类汇编:专题27 电解原理及其应用(解析版)
- 肺吸虫病教学课件
- 公文格式培训课件
评论
0/150
提交评论