DB34∕T 4555-2023 儿童智能指读技术规范_第1页
DB34∕T 4555-2023 儿童智能指读技术规范_第2页
DB34∕T 4555-2023 儿童智能指读技术规范_第3页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240.01

CCSL77

34

安徽省地方标准

DB34/T4555—2023

儿童智能指读技术规范

Specificationforintelligentfinger-pointingtechnicalofchildren

2023-10-07发布2023-11-07实施

安徽省市场监督管理局发布

DB34/T4555—2023

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由安徽淘云科技股份有限公司提出。

本文件由安徽省经济和信息化厅归口。

本文件起草单位:安徽淘云科技股份有限公司、科大讯飞股份有限公司、安徽工程大学计算机与信

息学院、合肥巴灵瑞教育科技有限公司、合肥赑歌数据科技有限公司、安徽长三角数据感知与治理研究

院、江苏理工学院、合肥师范学院、合肥智能语音创新发展有限公司。

本文件主要起草人:朱翠玲、刘庆升、王晓斐、叶娟、方明、叶剑鸣、陶皖、陈慧珺、毛四方、吕

雪、胡连峰、宋若淼、王忍宝、姜志文、孙艳、张泽之、武方芳。

I

DB34/T4555—2023

儿童智能指读技术规范

1范围

本文件规定了儿童智能指读技术的术语和定义、技术路线和要求。

本文件适用于儿童智能指读技术的应用。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T34053.3纸质印刷产品印制质量检验规范第3部分:图书期刊

GB/T34053.4纸质印刷产品印制质量检验规范第4部分:中小学教科书

GB/T34053.5纸质印刷产品印制质量检验规范第5部分:报纸

GB/T36480-2018信息技术紧缩嵌入式摄像头通用规范

3术语和定义

下列术语和定义适用于本文件。

智能指读技术Intelligentfinger-pointing

基于手指检测、图像检索、图文识别、热区匹配等技术,通过TTS或其他信息映射技术,将读物内

容输出为语音或文本的一种人机交互技术。

指向词技术Directionalwordtechnology

基于指尖检测模型对摄像头获取的图像进行处理,提取指尖位置信息,获取指尖处文字区域,经图

文识别输出数据的一种人机交互技术。

点读技术Clickreadingtechnology

基于指尖检测模型对摄像头获取的图像进行处理,提取指尖位置信息,利用检索模型检索当前读物

信息,结合指尖位置信息做热区匹配相关交互处理,输出数据的一种人机交互技术。

4技术路线

儿童智能指读技术路线见图1。

1

DB34/T4555—2023

图1儿童智能指读技术路线

5要求

图像采集

5.1.1概述

采集设备上的摄像头对放置在设备拍摄工作范围内放置的读物进行拍摄采像。

5.1.2采集读物要求

读物具体要求见表1。

表1读物要求

序号项目指向词技术点读技术

适用于满足GB/T34053.3、GB/T34053.4和适用于GB/T34053.4中规定的教材、教

1读物范围

GB/T34053.5中规定的质量要求的印刷材料辅、绘本等印刷材料

最大可以支持2号字体

2字号要求—

最小可以支持6号字体

适用字体中文包括但不限于宋体、楷体及隶书

3字体要求等,英文应包括但不限于TimesNewRoman、—

Arial及Calibri等。

4读物位置读物应置于设备的拍摄工作范围内

5.1.3采集设备要求

5.1.3.1摄像头几何失真要求

摄像头的几何失真应满足GB/T36480-2018中6.4.7几何失真的要求。

2

DB34/T4555—2023

5.1.3.2装配尺寸要求

摄像头与产品手板装配时,确保摄像头安装配合尺寸的一致性。

5.1.3.3图像质量要求

图像应满足色彩质量、清晰度和分辨率的要求,详细内容见表2。

表2色彩质量、清晰度和分辨率的要求

序号项目具体要求

1色彩质量RGB三通道数据能还原出所拍摄的拍摄对象真实色彩信息。

2清晰度在6号字,A3纸中字体轮廓清晰可见。

3分辨率在6号字,中文字符所占像素不少于50×50。

5.1.4手指要求

5.1.4.1手势要求

单手指指向读物内容。

5.1.4.2手指位置

在指向词应用场景中,手指指着读物上的内容下方;在点读应用场景中,手指指着读物上的内容。

5.1.4.3指读精度

手指检测定位精度不超过5号字一个字符的宽度。

5.1.5环境光要求

环境光亮度应满足以下要求:

——不应在拍摄对象的表面形成反光;

——环境光亮度不能太暗,导致拍摄图像不清晰。

区域判定

5.2.1概述

把摄像头拍摄的图像送入指尖检测模型进行图像处理,并在处理后的图像中提取用户手指指尖在

读物上的位置信息,并根据位置信息判定是指向词还是点读。

5.2.2图像处理

5.2.2.1对采集图像的外围区域进行切除处理,去除无效边界区域,但不能去除含有读物的图像。

5.2.2.2对采集图像进行缩放处理,以提升检测效率和指尖定位精度。

5.2.2.3对采集图像进行转码处理,以满足手指检测模型的检测需要。

5.2.3提取位置信息

5.2.3.1应包含对手指图像的稳定性检测判断,以保证手指指尖位置信息提取的准确性。

5.2.3.2通过指尖位置信息判断用户意图是使用指向词功能还是使用点读功能。

3

DB34/T4555—2023

5.2.3.3指尖检测模型的训练数据应包含儿童应用的各种场景,场景包括但不限于不同年级学生、不

同肤色手指及不同指甲颜色等。

5.2.3.4指尖检测模型的总训练数据不少于100万条,并按照均等化的比例分配在各种场景中。

识别和搜索

5.3.1概述

5.3.1.1根据位置信息判定是指向词功能,则执行识别应用功能。

5.3.1.2根据位置信息判定是点读功能,则实行搜索应用功能。

5.3.2识别

5.3.2.1识别过程

根据指尖位置信息,裁剪指尖处文字区域图片,文字区域图片要覆盖指尖处的字或词;然后使用预

训练好的识别模型对指尖处文字区域图片进行文字信息识别,获得可读文字信息。

5.3.2.2识别模型

识别模型的训练数据应含有不同背景信息、不同文字大小及不同字体类型等;且总数据不少于100

万条,并且按照均等化的比例进行分配。

5.3.2.3文字背景

文字所在读物的背景信息应多样化,包括彩色和非彩色背景等。

5.3.3搜索

5.3.3.1搜索过程

利用检索模型通过采集图像检索当前的读物信息,然后结合指尖信息和读物信息做热区匹配,确定

用户指读的区域在读物中的位置信息。

5.3.3.2搜索模型

模型训练应支持各种场景的书籍,包括纯文字书

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论