(正式版)DB34∕T 5379-2026 《面向终身学习的用户画像技术要求》_第1页
(正式版)DB34∕T 5379-2026 《面向终身学习的用户画像技术要求》_第2页
(正式版)DB34∕T 5379-2026 《面向终身学习的用户画像技术要求》_第3页
(正式版)DB34∕T 5379-2026 《面向终身学习的用户画像技术要求》_第4页
(正式版)DB34∕T 5379-2026 《面向终身学习的用户画像技术要求》_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

34DB34/T5379—2026面向终身学习的用户画像技术要求Technicalrequirementsforuserprofilinginlifelonglearning2026-01-05发布2026-02-05实施安徽省市场监督管理局发布I1GB/T35273—2020信息安全技术个GB/T37988—2019信息安全技术数据安全GB/T43782人工智能机器学注:直接使用特定自然人的个人信息,形成该自然人的特征模型,称为API:应用编程接口(ApplicationProgrammingInterCSV:逗号分隔值(Comma-SeparatJDBC:Java数据库连接(JavaDatabaseConODBC:开放数据库连接(OpenDatabaseConXML:可扩展标记语言(ExtensibleMarkup2终身学习用户画像的流程分为数据采集、数据预处理、数据分析、画像输出、验证和更新迭代。终身学习用户画像的流程见图1。验证图1终身学习用户画像流程图6要求6.1数据采集6.1.1数据采集输入数据的类型包括但不限于:a)用户注册信息:用户在平台注册时提供个人信息,包括姓名、年龄、性别、学历、联系方式等结构化数据;b)课程基本信息:用户在平台所选课程的基础信息,包括课程编号、名称、类别、所属学科、授课教师等结构化数据;c)知识点与学习资源:记录用户在课程学习过程中接触到的知识点和学习资源,包括但不限于讲义、教学视频、教学音频、练习题、自测题等非结构化数据;d)课程学习数据:1)学习时长:包括但不限于在线学习视频观看时间、在线学习页面浏览时长、作业完成时长等结构化数据;2)学习次数:记录用户在课程上学习的次数,包括但不限于登录次数、课程点击次数、视频浏览次数、页面浏览次数等结构化数据;e)学习反馈数据:1)师生互评评语:用户和教师之间的互相评价和反馈信息,包括但不限于用户学习态度评语、作业完成情况,课堂表现等半结构化数据;2)阶段测试成绩:用户在学习后进行自测的成绩,包括但不限于自测分数等结构化数据;3f)互动数据:用户在课程社区中发布的帖子数量;用户在课程发布的帖子内容,包括但不限于提出问题、讨论、笔记等文字内容;用户在课程中学习过程中产生的视频和音频数据等非结构化数据。6.1.2数据采集数据源接入的方式包括但不限于:a)数据库直连:通过JDBC、ODBC等标准协议直接访问源数据库;b)接口调用:通过调用API、WebService等数据接口以同步或异步方式获取数据;c)文件解析:支持导入并解析CSV、JSON、XML等文件;d)人工录入:提供系统界面供用户手动填写或批量导入数据。6.2数据预处理6.2.1通用预处理要求针对可直接处理的结构化数据,数据预处理的方式包括但不限于:a)数据解析:支持从原始数据中解析出目标字段或特征;b)格式标准化:统一数据格式、编码与命名规范;c)异常值处理:检测并处理数据中的异常值或无效数据;d)去重操作:识别并移除重复的数据记录或样本。6.2.2非结构化、半结构化数据预处理要求针对非结构化及半结构化数据,除满足6.2.1的通用要求外,其预处理还宜依据数据类型,分别符合下列特定要求:a)音频数据预处理宜符合下列要求:1)预处理对象:包括知识点与学习资源中的教学音频以及互动数据中的音频;2)预处理方式:采用梅尔频率倒谱系数作为主要语音特征,支持配置帧长、帧移、滤波器组数等参数;3)数据标准化:提取结果统一为定长定维格式,支持静音段剔除、幅度归一化处理。b)视频与图像数据预处理宜符合下列要求:1)预处理对象:包括知识点与学习资源中的视频以及互动数据中的视频、图像截图、学习任务截图、界面截屏等视频或图像格式数据;2)预处理方式:对视频类数据执行关键帧提取,采用内容变化检测、图像差值法等方法提取信息代表帧;3)数据标准化:对图像和视频帧进行尺寸统一、格式转换、去噪、亮度归一、色彩标准化等操作;每帧图像应保留与原始数据关联的标识信息(如帧时间戳、视频编号)。c)文本数据预处理宜符合下列要求:1)预处理对象:包括用户评论、搜索关键词、教学问答、学习笔记、对话内容等原始文本数2)预处理方式:支持分词、去停用词、词干还原、特殊字符清除、拼写纠错等基础清洗流程,并支持命名实体识别、情感分析等语义增强模块;3)数据标准化:统一编码格式,支持向量化输出形式。6.3.1数据分析方法宜包括三大类方法:统计类、算术规则类以及机器学习类。6.3.2对于学习时长、学习进度等直接画像特征,宜采用统计方法进行分析;对于个人关键词分析等4画像输出宜包含用户基本信息与学习过程成绩等特征输出展示宜支持多种终端与系统的接入需求,满足画像在不同业务系统中的可视化展示与智能调5a)输出形式:支持Web前端系统展示、移动端应用集成、第三方系统拉取等输出方式;b)数据展示适配:支持主流可视化图表库,将用户画像结果格式化为图表(如雷达图、热力图)、标签列表、指标评分等结构化展示格式;c)数据导出功能:支持将画像数据供分析或归档使用;d)调用频率控制:对不同级别用户(系统内部、第三方平台)设定日调用次数限制和访问速率上6.5验证6.5.1验证原则进行用户画像后,宜对其输出的特征模型进行验证以确保准确性与可用性。评估验证宜遵循以下原a)用户中心原则:直接或间接地以目标用户为根本依据,确保画像评估结果源于用户实际而非内b)多方印证原则:采用多种验证方法和信息来源进行交叉比对,以提高验证结果的可靠性与有效性。6.5.2验证指标6.5.2.1准确性准确性的指标计算:若一次用户画像所输出的特征模型,与用户的自我认知一致,则可判定此次用户画像是准确的。计算公式见式(1):Acc——画像准确性;M——准确画像次数;N—总画像次数。6.5.2.2可用性可用性的指标计算:若在用户画像后,基于其输出的特征模型对用户进行学习干预后,用户在同一标准测试中的成绩获得提升,则可判定此次用户画像过程是有效的。其有效性可通过用户画像价值系数衡量,计算公式见式(2):U—画

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论