GBZ 177.4-2026《人工智能终端智能化分级 第4部分:微型计算机》(纯净版)_第1页
GBZ 177.4-2026《人工智能终端智能化分级 第4部分:微型计算机》(纯净版)_第2页
GBZ 177.4-2026《人工智能终端智能化分级 第4部分:微型计算机》(纯净版)_第3页
GBZ 177.4-2026《人工智能终端智能化分级 第4部分:微型计算机》(纯净版)_第4页
GBZ 177.4-2026《人工智能终端智能化分级 第4部分:微型计算机》(纯净版)_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1人工智能终端智能化分级本文件规定了人工智能微型计算机(以下简称“微型计算机”)智能化关键能力等级划分和等级判定,描述了相应的测试方法。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。平板式微型计算机tabletmicrocomputer以触摸屏幕为主要交互方式,通常需外接键盘或鼠标等外联设备使用的微型计算机。简单指令directinstruction用户通过显式、结构化格式发出,系统未经推理即能直接解析并执行的操作指令。简单意图simpleintent用户向系统表达的单一且目标明确的、不依赖上下文的操作需求。复杂意图complexintent用户向系统表达的包含多个子目标的、需进行任务拆解的、依赖上下文的操作需求。工作流workflow为完成特定目标而编排的任务序列。24缩略语下列缩略语适用于本文件。5关键能力根据微型计算机完成功能范围内各类任务的智能化水平及用户在任务执行过程中的参与程度,将微型计算机智能化水平划分为1级(L1)~3级(L3),等级越高,表明其智能化水平越高。高等级能力涵盖全部低等级能力,如L3级微型计算机需同时涵盖L1级和L2级的所有关键能力。本文件关键能力要素参考GB/Z177.1和GB/Z177.2。a)端侧能力是指微型计算机依托自身的计算、存储和传感器等本地资源,在本地完成部分感知、认知、执行、记忆和学习的服务能力。b)端云协同能力是指微型计算机在端侧能力的基础上,结合边缘侧或云侧计算资源,通过协同调度与信息交换,完成需强认知与复杂决策处理的复合任务的能力。5.2端侧能力5.2.1L1响应级5.2.1.1.1用户信息感知用户信息感知能力应符合下列要求。a)文字感知:能够通过键盘等外联设备准确输入文字内容的能力。b)音频感知:能够通过传声器等外联设备或通过用户输入的音频文件输入音频信息。c)图片感知:能够通过摄像头等外联设备进行拍照,或通过用户输入的图片文件输入图片信息。d)视频感知:能够通过摄像头等外联设备进行录像,或通过用户输入的视频文件输入视频信息。5.2.1.1.2设备信息感知设备信息感知能力应符合下列要求。a)硬件感知:能够感知本机的硬件信息和工作状态,包括处理器、内存、硬盘、显卡或电池等。b)软件感知:能够感知本机的软件信息和工作状态,包括已安装软件列表、运行状态、操作系统信息、驱动状态、权限配置或网络连接状态等。5.2.1.1.3环境信息感知无要求。5.2.1.2.1理解简单指令:能够理解用户的简单指令,如“打开浏览器”。无要求。无要求。5.2.1.3.1工具调用调用确定性工具完成单步骤任务执行:能够调用一方或三方的应用或服务并完成单步骤任务。5.2.1.3.2内容生成无要求。跨设备控制:能够对外部设备进行控制,如外设控制、打印文档或智能家居控制等功能。5.2.1.3.4表达输出表达输出:能够通过特定的输出方式向用户反馈任务执行状态与结果。5.2.1.4记忆能力5.2.1.4.1短期记忆无要求。5.2.1.4.2长期记忆5.2.1.5.1情景适应学习无要求。5.2.1.5.2持续演进学习无要求。45.2.2L2工具级5.2.2.1.1用户信息感知a)文字感知:能够通过键盘等外联设备准确输入文字内容。b)音频感知:能够通过传声器等外联设备或通过用户输入的音频文件输入音频信息。d)视频感知:能够通过摄像头等外联设备进行录像,或通过用户输入的视频文件输入视频信息。e)至少一项下述生物特征识别感知能力:1)指纹感知:能够通过指纹传感器等外联设备感知用户指纹信息;2)人脸感知:能够通过摄像头等外联设备感知用户人脸信息;注:台式微型计算机通过外联设备满足此项能力。5.2.2.1.2设备信息感知设备信息感知能力应符合下列要求。a)硬件感知:能够感知本机的硬件信息和工作状态,包括处理器、内存、硬盘、显卡、电池等。b)软件感知:能够感知本机的软件信息和工作状态,包括已安装软件列表、运行状态、操作系统信息、驱动状态、权限配置、网络连接状态等。c)外联设备感知:能够感知外联设备信息,包括外联设备类型、运行状态等。5.2.2.1.3环境信息感知无要求。简单指令:能够理解用户的简单指令,如“打开浏览器”。5.2.2.2.3规划无要求。5.2.2.3.1工具调用调用确定性工具完成单步骤任务执行:能够调用一方或三方的应用或服务并完成单步骤任务。文本生成:能够根据输入任务指令,自动生成语义连贯、符合上下文的文本,按照GB/T45288.2—5互联协同能力应符合下列要求。b)跨设备内容迁移:能够支持跨设备的内容迁移,如文件跨屏拖拽、文件跨屏传输、投屏或剪切板等功能。5.2.2.3.4表达输出表达输出:能够通过特定的输出方式向用户反馈任务执行状态与结果。5.2.2.4.1短期记忆5.2.2.4.2长期记忆长期记忆能力应符合下列要求之一。a)会话历史记忆:能够记忆会话历史,且重启后能够继续会话任务。b)用户偏好记忆:能够记忆用户偏好。5.2.2.5.1情景适应学习无要求。5.2.2.5.2持续演进学习无要求。5.2.3L3辅助级5.2.3.1感知5.2.3.1.1用户信息感知a)文字感知:能够通过键盘等外联设备准确输入文字内容。b)音频感知:能够通过传声器等外联设备或通过用户输入的音频文件输入音频信息。c)图片感知:能够通过摄像头等外联设备进行拍照并转化为文字内容,或通过用户输入的图片文件输入图片信息并能够支持图片输入文字。d)视频感知:能够通过摄像头等外联设备进行录像,或通过用户输入的视频文件输入视频信息。e)至少一项下述生物特征识别感知能力:1)指纹感知:能够通过指纹传感器等外联设备感知用户指纹信息;65.2.3.1.2设备信息感知设备信息感知能力应符合下列要求。a)硬件感知:能够感知本机的硬件信息和工作状态,包括处理器、内存、硬盘、显卡、电池等。b)软件感知:能够感知本机的软件信息和工作状态,包括已安装软件列表、运行状态、操作系统信息、驱动状态、权限配置、网络连接状态等。c)外联设备感知:能够感知外联设备信息,包括外联设备类型、运行状态等。5.2.3.1.3环境信息感知无要求。5.2.3.2.1理解理解能力应符合下列要求。a)简单指令:能够理解用户的简单指令,如“打开浏览器”。b)复杂指令:能够理解用户的复杂指令,如“打开浏览器搜索今天的股市信息”。c)简单意图:能够理解用户的简单意图,如“我想看今天的股市情况”。无要求。5.2.3.3执行5.2.3.3.1工具调用工具调用能力应符合下列要求。a)调用确定性工具完成单步骤任务执行:能够调用一方或三方的应用或服务并完成单步骤任务。b)调用确定性组合工具完成预设且明确的多步骤任务:能够调用确定性组合工具并完成预设且明确的多步骤任务。a)对于机器翻译类任务(如中文译英文),BLEU_A值大于或等于0.6,首字延时小于或等于于4分,首字延时小于或等于10s,文字生成平均速度需大于或等于10字/s。互联协同能力应符合下列要求。a)跨设备控制:能够对外部设备进行控制,如外设控制、打印文档或智能家居控制等功能。7b)跨设备内容迁移:能够支持跨设备的内容迁移,如文件跨屏拖拽、文件跨屏传输、投屏或剪切板等功能。5.2.3.3.4表达输出5.2.3.4.1短期记忆5.2.3.4.2长期记忆长期记忆能力应符合下列要求。5.2.3.5.1情景适应学习无要求。5.2.3.5.2持续演进学习无要求。5.3端云协同能力5.3.1.1感知5.3.1.1.1用户信息感知a)文字感知:能够通过键盘等外联设备准确输入文字内容。b)音频感知:能够通过传声器等外联设备或通过用户输入的音频文件输入音频信息。c)图片感知:能够通过摄像头等外联设备进行拍照,或通过用户输入的图片文件输入图片信息。d)视频感知:能够通过摄像头等外联设备进行录像,或通过用户输入的视频文件输入视频信息。5.3.1.1.2设备信息感知设备信息感知能力应符合下列要求。a)硬件感知:能够感知本机的硬件信息和工作状态,包括处理器、内存、硬盘、显卡或电池等。b)软件感知:能够感知本机的软件信息和工作状态,包括已安装软件列表、运行状态、操作系统信息、驱动状态、权限配置或网络连接状态等。5.3.1.1.3环境信息感知环境信息感知能力应符合下列要求。8无要求。5.3.1.2.3规划无要求。5.3.1.3执行5.3.1.3.1工具调用调用确定性工具完成单步骤任务执行:能够调用一方或三方的应用或服务并完成单步骤任务。无要求。跨设备控制:能够对外部设备进行控制,如外设控制、打印文档或智能家居控制等功能。5.3.1.3.4表达输出表达输出:能够通过特定的输出方式向用户反馈任务执行状态与结果。5.3.1.4记忆5.3.1.4.1短期记忆5.3.1.4.2长期记忆5.3.1.5学习5.3.1.5.1情景适应学习无要求。5.3.1.5.2持续演进学习无要求。95.3.2L2工具级5.3.2.1.1用户信息感知用户信息感知能力应符合下列要求。a)文字感知:能够通过键盘等外联设备准确输入文字内容。b)音频感知:能够通过传声器等外联设备输入音频文件并转化为文字内容,或通过用户输入的音频文件输入音频信息并转化为文字内容。c)图片感知:能够通过摄像头等外联设备进行拍照并转化为文字内容,或通过用户输入的图片文件输入图片信息并能够支持图片输入文字。d)视频感知:能够通过摄像头等外联设备进行录像,或通过用户输入的视频文件输入视频信息。e)至少一项下述生物特征识别感知能力:1)指纹感知:能够通过指纹传感器等外联设备感知用户指纹信息;2)人脸感知:能够通过摄像头等外联设备感知用户人脸信息;3)声纹感知:能够通过传声器等外联设备感知用户声纹信息。5.3.2.1.2设备信息感知设备信息感知能力应符合下列要求。a)硬件感知:能够感知本机的硬件信息和工作状态,包括处理器、内存、硬盘、显卡、电池等。b)软件感知:能够感知本机的软件信息和工作状态,包括已安装软件列表、运行状态、操作系统信息、驱动状态、权限配置、网络连接状态等。c)外联设备感知:能够感知外联设备信息,包括外联设备类型、运行状态等。5.3.2.1.3环境信息感知环境信息感知能力应符合下列要求。理解能力应符合下列要求。b)复杂指令:能够理解用户的复杂指令,如“打开浏览器搜索今天的股市信息”。c)简单意图:能够理解用户的简单意图,如“我想看今天的股市情况”。无要求。5.3.2.3执行5.3.2.3.1工具调用工具调用能力应符合下列要求。a)调用确定性工具完成单步骤任务执行:能够调用一方或三方的应用或服务并完成单步骤任务。b)调用确定性组合工具完成预设且明确的多步骤任务:能够调用确定性组合工具并完成预设且明确的多步骤任务。5.3.2.3.2内容生成内容生成应符合下列至少一项要求。a)文本生成:能够根据输入任务指令,自动生成语义连贯、符合上下文的文本,按照大于或等于4分。c)音频生成:能够生成音频模态内容,按照GB/T45288.2—2025中A.2的相关方法,MOS得分大于或等于4分。d)视频生成:能够生成视频模态内容,按照GB/T45288.2—2025中A.2的相关方法,MOS得分大于或等于4分。互联协同能力应符合下列要求。a)跨设备控制:能够对外部设备进行控制,如外设控制、打印文档或智能家居控制等功能。b)跨设备内容迁移:能够支持跨设备的内容迁移,如文件跨屏拖拽、文件跨屏传输、投屏或剪切板等功能。5.3.2.3.4表达输出表达输出:能够通过特定的输出方式向用户反馈任务执行状态与结果。5.3.2.4.1短期记忆5.3.2.4.2长期记忆长期记忆应符合下列至少一项要求。5.3.2.5学习5.3.2.5.1情景适应学习无要求。5.3.2.5.2持续演进学习无要求。5.3.3.1感知5.3.3.1.1用户信息感知b)音频感知:能够通过传声器等外联设备输入音频文件并转化为文字内容,或通过用户输入的音频文件输入音频信息并转化为文字内容。c)图片感知:能够通过摄像头等外联设备进行拍照并转化为文字内容,或通过用户输入的图片文件输入图片信息并能够支持图片输入文字;同时能够理解图片的内容。d)视频感知:能够通过摄像头等外联设备进行录像,或通过用户输入的视频文件输入视频信息。e)至少一项下述生物特征识别感知能力:1)指纹感知:能够通过指纹传感器等外联设备感知用户指纹信息;3)声纹感知:能够通过传声器等外联设备感知用户声纹信息。5.3.3.1.2设备信息感知设备信息感知能力应符合下列要求。a)硬件感知:能够感知本机的硬件信息和工作状态,包括处理器、内存、硬盘、显卡、电池等。b)软件感知:能够感知本机的软件信息和工作状态,包括已安装软件列表、运行状态、操作系统信息、驱动状态、权限配置、网络连接状态等。c)外联设备感知:能够感知外联设备信息,包括外联设备类型、运行状态等。5.3.3.1.3环境信息感知环境信息感知能力应符合下列要求。a)时间感知:能够感知当前位置的时间信息。c)天气感知:能够感知当前位置的天气信息。理解能力应符合下列要求。a)简单指令:能够理解用户的简单指令,如“打开浏览器”。b)复杂指令:能够理解用户的复杂指令,如“打开浏览器搜索今天的股市信息”。c)简单意图:能够理解用户的简单意图,如“我想看今天的股市情况”。d)复杂意图:能够理解用户的复杂意图,如“帮我写一篇近期关于芯片的股市分析报告”。e)融合理解:能够对多种感知信息进行融合理解。f)意图澄清:当用户意图不明确时,能够通过追问或提供选项等方式进行意图澄清。推理能力应符合下列要求。b)复杂推理:能够综合不同来源和类型的信息进行复杂推理,如多重约束条件、多步骤的推理或长思维链等。5.3.3.2.3规划工作流:能够将复杂任务拆分为多个子任务,并合理编排子任务的执行序列,如能够基于用户提问拆分为多个可执行的子任务。5.3.3.3.1工具调用工具调用能力应符合下列要求。a)调用确定性工具完成单步骤任务执行:能够调用一方或三方的应用或服务并完成单步骤任务。b)调用确定性组合工具完成预设且明确的多步骤任务:能够调用确定性组合工具并完成预设且明确的多步骤任务。内容生成应符合下列至少两项要求。a)文本生成:能够根据输入任务指令,自动生成语义连贯、符合上下文的文本,按照GB/T45288.2—2025中A.2的相关方法,MOS得分大b)图片生成:能够生成图片模态内容,按照GB/T45288.2—2025中A.2的相关方法,MOS得分大于或等于4分。c)音频生成:能够生成音频模态内容,按照GB/T45288.2—2025中A.2的相关方法,MOS得分大于或等于4分。d)视频生成:能够生成视频模态内容,按照GB/T45288.2—2025中A.2的相关方法,MOS得分大于或等于4分。互联协同能力应符合下列要求。a)跨设备控制:能够对外部设备进行控制,如外设控制、打印文档或智能家居控制等。b)跨设备内容迁移:能够支持跨设备的内容迁移,如文件跨屏拖拽、文件跨屏传输、投屏或剪切板等功能。c)分布式任务协同:能够实现分布式任务协同,如微型计算机调用手机等设备的摄像头功能。5.3.3.3.4表达输出表达输出:能够通过特定的输出方式向用户反馈任务执行状态与结果。5.3.3.4.1短期记忆5.3.3.4.2长期记忆长期记忆能力应符合下列要求。5.3.3.5.1情景适应学习在单次会话内,依据上下文或用户示例,能够动态调整并优化其内容输出。5.3.3.5.2持续演进学习无要求。微型计算机的智能化等级判定按照GB/Z177.2中符合性判定法开展。依据委托方申请的目标智能化等级与本文件中对该等级所规定的关键能力,选取至少3个二级应用场景直至覆盖所有能力项,场景化测试示例见附录A,典型场景建议覆盖的能力见附录B。每个场景验证其关联的细分能力项(如L1级通用场景需验证文字感知、音频感知、图片感知、视频感知、时间感知和简单指令等),若有些能力无法覆盖,则使用对应能力的测试方法进行测试,测试方法按照附录C。(资料性)场景化测试示例表A.1列举了微型计算机的典型应用场景示例。表A.1微型计算机典型应用场景示例能力要素对应的智能化等级通用能够基于本地搜索或问题结果的搜索任务Q2的合同文件”自动解析时间范围(2025具搜索议记录”拍摄的照片”结合时间感知(上周末),找到至少一张在海边拍摄的照片当本地无PDF工具时,输入指令:“打开昨天拟的PDF版本合同”具,并打开应用管理类工软件感知生成待办列表”完成预设且明确的多步骤任务、复杂意图协同、复杂意图的简单要令:“今天的股市情况怎么样?”的涨跌情况、亮点等内容近一个月的变化曲线”数的变化折线图改成柱状图”图,且数据保持一致工具完成单步骤任务个月的A股市场情况”表A.1微型计算机典型应用场景示例(续)能力要素对应的智能化等级用户输入的简单要用PDF格式保存在桌面”此摘要的PDF文件,文件名自拟工具完成预设且明(资料性)典型场景建议覆盖的能力表B.1列举了微型计算机的典型应用场景及建议覆盖的能力。表B.1微型计算机典型应用场景及建议覆盖的能力建议覆盖的能力对应的智能化等级通用基于本地搜索工具完成用户需求本地文件或问题结果的搜索任务)感知能力:文字感知、音频感知、图片感知、视频感知、时间感知感知能力:文字感知、音频感知、图片感知、视频感知、时间感知认知能力:简单指令、复杂指令、简单意图、简单记忆能力:单个会话上下文内容记忆、多个会话上下文内容记感知能力:文字感知、音频感知、图片感知、视频感知、时间感知记忆能力:单个会话上下文内容记忆、多个会话上下文内容记学习能力:情景适应学习的简单要求和文档、PPT、图片等内容,显感知能力:文字感知、时间感知执行能力:跨设备控制认知能力:简单指令、复杂指令、简单意图、简单感知能力:文字感知、时间感知学习能力:情景适应学习根据用户输入行动计划等内感知能力:文字感知、音频感知、时间感知感知能力:文字感知、音频感知、时间感知认知能力:简单指令、复杂指令、简单意图、简单执行能力:文本生成、跨设备控制记忆能力:单个会话上下文内容记忆、多个会话上下文表B.1微型计算机典型应用场景及建议覆盖的能力(续)建议覆盖的能力对应的智能化等级行动计划等内感知能力:文字感知、音频感知、外联设备感知、时间感知执行能力:调用确定性工具完成单步骤任务执行、文本生成、跨设备控制学习能力:情景适应学习教育学习性化的学习计感知能力:文字感知、音频感知、软件感知、时间感知感知能力:文字感知、音频感知、图片感知、视频感知、时间感知认知能力:简单指令、复杂指令、简单意图、简单感知能力:文字感知、音频感知、图片感知、视频感知、软件感知、时间感知学习能力:情景适应学习据用户喜好推荐音乐和影片生活安排)感知能力:文字感知、软件感知、时间感知、时区感知、天气感知感知能力:文字感知、音频感知、软件感知、时间感知、时区感知、天气认知能力:简单指令、复杂指令、简单意图、简单感知能力:文字感知、音频感知、软件感知、时间感知、时区感知、天气表B.1微型计算机典型应用场景及建议覆盖的能力(续)建议覆盖的能力对应的智能化等级强大的硬件功更沉浸的游戏搭载个人大模|高的人机交互)感知能力:音频感知、硬件感知、时间感知感知能力:音频感知、图片感知、视频感知、硬件感知、时间感知认知能力:简单指令、复杂指令、简单意图、简单内容创作(在图的生成和后期处理方面,可据用户的提示创作)感知能力:文字感知、音频感知、图片感知、视频感知感知能力:文字感知、音频感知、图片感知、视频感知、软件感知认知能力:简单指令、复杂指令、简单意图认知能力:简单指令、复杂指令、简单意图、复杂意图、意图澄清学习能力:情景适应学习术设计等需要创造力和精细高生产力)感知能力:文字感知认知能力:简单指令、复杂指令、简单意图、简单记忆能力:单个会话上下文内容记忆、多个会话上下文内容记忆感知能力:文字感知、图片感知、硬件感知、软件感知学习能力:情景适应学习注:下划线表示在端侧能力和端云协同能力均建议覆盖,未标注下划线表示仅在端云协同能力建议覆盖。(规范性)测试方法C.1测试环境测试环境考虑如下因素:a)温度:15℃~35℃;b)相对湿度:25%~75%;C.2L1响应级C.2.1.1用户信息感知C.2.1.1.1文字感知分别在断开互联网和连接互联网的环境,通过键盘等外联设备输入文字内容,判断其能否准确输入。C.2.1.1.2音频感知分别在断开互联网和连接互联网的环境,固定噪声环境中通过传声器等外联设备输入音频内容,或通过输入音频文件输入音频内容,判断其能否准确输入。C.2.1.1.3图片感知分别在断开互联网和连接互联网的环境,通过摄像头等外联设备进行拍照,判断其能否拍摄清晰的照片,或通过输入图片文件输入图片内容,判断其能否准确输入。分别在断开互联网和连接互联网的环境,通过摄像头等外联设备进行录像,或通过输入视频文件输入视频内容,判断其能否准确输入。C.2.1.2设备信息感知C.2.1.2.1硬件感知分别在断开互联网和连接互联网的环境,读取并记录本机的硬件信息和工作状态,如处理器、内存、硬盘、显卡或电池等硬件的信息及工作状态,判断其能否准确感知相关内容。分别在断开互联网和连接互联网的环境,读取并记录本机的软件信息和工作状态,如已安装软件列表、运行状态、操作系统信息、驱动状态、权限配置或网络连接状态等,判断其能否准确感知相关内容。C.2.1.3环境信息感知C.2.1.3.1时间感知在连接互联网的环境,读取并记录当前时间信息,判断其能否准确感知当前时间。在连接互联网的环境,读取并记录当前所处位置的时区信息,判断其能否准确感知当前所处位置的时区。C.2.1.3.3天气感知在连接互联网的环境,读取并记录当前所处位置的天气信息,判断其能否准确感知当前所处位置的天气。C.2.2认知分别在断开互联网和连接互联网的环境,执行简单指令的任务集合,且简单指令数量不低于20不涉及。不涉及。C.2.3.1工具调用分别在断开互联网和连接互联网的环境,根据确定性的任务指令,自动调用一方或三方的应用或服务,并返回符合预期的结果,判断其能否正确执行所要求的任务。C.2.3.2内容生成不涉及。分别在断开互联网和连接互联网的环境,测试能否与其他设备正确建立连接,并能够根据用户指令准确完成控制操作,如外设控制、打印文档或智能家居控制等,判断其能否正确执行所要求的任务。C.2.3.4表达输出C.2.4记忆C.2.4.1短期记忆不涉及。不涉及。C.2.5.1情景适应学习不涉及。C.2.5.2持续演进学习不涉及。C.3L2工具级C.3.1.1用户信息感知C.3.1.1.1文字感知测试方法同C.2.1.1.1。在断开互联网的环境,固定噪声环境中通过传声器等外联设备输入音频内容,或通过输入音频文件输入音频内容,判断其能否准确输入;且在连接互联网的环境,固定噪声环境中通过传声器等外联设备输入音频内容并转化为文字信息,或通过输入音频文件输入音频内容并转化为文字信息,判断其能否准确输入文字信息。C.3.1.1.3图片感知C.3.1.1.4视频感知测试方法同C.2.1.1.4。C.3.1.1.5指纹感知C.3.1.1.6人脸感知分别在断开互联网和连接互联网的环境,在不同光线、角度、佩戴饰品等条件,通过摄像头等外联设C.3.1.1.7声纹感知分别在断开互联网和连接互联网的环境,固定噪声环境中通过传声器等外联设备,根据声音特征准确识别出已注册用户,记录执行结果。C.3.1.2设备信息感知C.3.1.2.1硬件感知测试方法同C.2.1.2.1。测试方法同C.2.1.2.2。C.3.1.2.3外联设备感知分别在断开互联网和连接互联网的环境,读取并记录外联设备基本信息及状态信息,如外联设备的类型、配置、开关状态、工作状态等,判断其能否准确感知对应的信息及状态。C.3.1.3环境信息感知测试方法同C.2.1.3。C.3.2认知C.3.2.1.1简单指令测试方法同C.2.2.1。C.3.2.1.2复杂指令在连接互联网的环境,调用具备推理特征的功能模块,判断其能否输出基于输入信息的合理响应。测试任务可涵盖较为简单的推理问题。不涉及。C.3.3执行C.3.3.1工具调用C.3.3.1.1调用确定性工具完成单步骤任务测试方法同C.2.3.1。C.3.3.1.2调用确定性组合工具完成预设且明确的多步骤任务在连接互联网的环境,根据确定性的任务指令,调用组合的多个一方或三方应用或服务,完成明确多步骤任务,并返回符合预期的结果,判断其能否正确执行所要求的任务。C.3.3.2.1文本生成在连接互联网的环境,根据输入任务指令,测试能否按照任务要求生成对应的图片,且按照GB/T45288.2—2025中A.2的相关方法评判MOC.3.3.2.3音频生成在连接互联网的环境,根据输入任务指令,测试能否按照任务要求生成对应的语音,且按照C.3.3.2.4视频生成在连接互联网的环境,根据输入任务指令,测试能否按照任务要求生成对应的视频,且按照C.3.3.3.1跨设备控制测试方法同C.2.3.3。C.3.3.3.2跨设备内容迁移C.3.3.4表达输出测试方法同C.2.3.4。C.3.4记忆C.3.4.1短期记忆分别在断开互联网和连接互联网的环境,执行单个会话的多轮对话(至少10轮)测试任务,输入包C.3.4.2长期记忆C.3.4.2.1会话历史记忆分别在断开互联网和连接互联网的环境,测试其能否查看会话历史记录,并在重启设备后,能够继续在选定会话中执行相关任务。分别在断开互联网和连接互联网的环境,执行包含用户偏好的测试任务,测试是否能够基于用户偏好信息做出个性化处理。C.3.5.1情景适应学习不涉及。C.3.5.2持续演进学习不涉及。C.4.1.1用户信息感知C.4.1.1.1文字感知在断开互联网的环境,通过键盘等外联设备输入文字内容,判断其能否准确输入;且在连接互联网的环境,通过键盘等外联设备输入文字内容,判断其能否准确输入,同时上传指定的文本文件,并提出针对性问题,判断其能否准确理解用户所上传的文本文件。C.4.1.1.2音频感知测试方法同C.3.1.1.2。分别在断开互联网和连接互联网的环境,通过摄像头等外联设备进行拍照,并将拍摄的图片转化为文字信息,或通过输入图片文件输入图片内容并转化为文字信息,判断其能否准确输入文字信息。同时,在连接互联网的环境,通过拍照或用户上传等方式输入图片文件,判断其能否正确理解图片的内容。C.4.1.1.4视频感知测试方法同C.2.1.1.4。C.4.1.1.5指纹感知测试方法同C.3.1.1.5。C.4.1.1.6人脸感知测试方法同C.3.1.1.6。C.4.1.1.7声纹感知测试方法同C.3.1.1.7。C.4.1.2设备信息感知测试方法同C.3.1.2。C.4.1.3环境信息感知测试方法同C.2.1.3。C.4.2认知C.4.2.1.1简单指令测试方法同C.2.2.1。C.4.2.1.2复杂指令分别在断开互联网和连接互联网的环境,执行复杂指令的任务集合,且复杂指令数量不低于10C.4.2.1.3简单意图分别在断开互联网和连接互联网的环境,执行简单意图的任务集合,且简单意图数量不低于20条,测试各意图的解析能力,记录各意图执行效果,判断其能否准确执行意图任务。C.4.2.1.4复杂意图在连接互联网的环境,执行复杂意图的任务集合,且复杂意图数量不低于10条,测试各意图的解析能力,记录各意图执行效果,判断其能否准确执行意图任务。C.4.2.1.5融合理解在连接互联网的环境,执行需结合多种感知信息处理的任务,判断其能否结合多种感知信息进行任务的处理。C.4.2.2推理C.4.2.2.1简单推理分别在断开互联网和连接互联网的环境,调用具备推理特征的功能模块,判断其能否输出基于输入信息的合理响应。测试任务可涵盖较为简单的推理问题。C.4.2.2.2复杂推理在连接互联网的环境,调用具备推理特征的功能模块,打开如深度思考等复杂推理功能,判断其能否输出基于输入信息的合理响应。测试任务可涵盖属于典型推理类型(如演绎、归纳、类比)的问题。在连接互联网的环境,执行具有显著规划特征的复杂工作任务,测试其能否在接收输入信息后,根据输出结果和思考过程,基于目标导向拆分为多个子任务,并合理编排为多个子任务的工作流。C.4.3.1工具调用C.4.3.1.1调用确定性工具完成单步骤任务测试方法同C.2.3.1。C.4.3.1.2调用确定性组合工具完成预设且明确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论