版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
DB11北京市市场监督管理局发布 本文件按照GB/T1.1—2020《标准化工作导则本文件起草单位:北京通用人工智能研究院、北京大学、电子心通智科技(北京)有限公司、阿里巴巴(上海)网络技术有本文件主要起草人:彭玉佳、张振亮、韩佳衡、程真喾、何欣怡、王愉茜、张露、谢琦、戴博、范丽凤、崔锦实、俞一鹏、董文储、尚云云、杨春龙、杨彤晖、吴剑、刘少卿、封宁、家庭环境通用人工智能视觉心智能力测试规范本文件规定了适用家庭环境的通用人工智能视觉心智能力的测试规范,描述了测试指标、本文件适用于指导通用人工智能系统开发方、用户方以及第三下列文件中的内容通过文中的规范性引用而构成本具有高效的学习和泛化能力、能够根据所处的复杂动态素的有机整体。其空间布局与物体分布需符合现实居住场景的物理逻辑与社会智能系统通过获取家庭环境视觉数据,以视觉为主的功能可供性、事件逻辑及潜在意图等的层次化理解,支持视觉任务智能系统基于环境感知与目标需求,自主或受控发起家庭环境通用人工智能视觉心智能力测试指标体系包括任务泛化能力指标以及自主生成任务法,在不同质量特性下设置具体评估指标。传统人工智能测试指标,推理时间),均可作为家庭环境通用人工智能视“任务泛化能力”指标用于评估通用人工智能系统通逻辑迁移至新任务、新场景或新对象的能力,并在动态环境中保持稳定性能,而务重新训练或人工干预。衡量通用人工智能系统在多任务场景下正确完成任务的):T=μ_y·σ……(1)其中,μ=fi,σ=(fi_μ)2τ——任务泛化能力现、定义并执行合理任务的能力。对通用人工智能自主生成任务的测试包括以下):其中,r(Ti,H)=Σ⑴n·COS(E(Ti),E(h"))h"∈H),n),nE(·)——任务文本的嵌入向量表示函数(通常使用BERT等预训练语言模型获得)total——测试中所有任务类型的集合):A——自主生成任务能力指标得分R——任务相关性家庭环境通用人工智能视觉心智测试任务维度主要分为单模态视觉理解和跨模态见图2。单模态视觉理解包括客体属性及关系理解、状态理解、视觉常识理解、事件理解、行为意图理解、情绪理解6个二级维度。跨模态视觉解););););测试客体属性及关系理解能力,指测试通用人工智能识别图像中物体的属性(状、材质)及物体间的空间、逻辑关系的能力,包含但不限于以a)属性识别:检测物体的物理或抽象特征,包含图像深度估计、空间结构理b)关系推理:判断物体间的相对位置、归属关系测试通用人工智能的状态理解能力,指测试通用人工智能识别物体或场景的瞬时状态a)物理状态判断:分析并准确判断物体的状态,如可操作性、完整性b)场景状态推断:判断环境的物理、社会属性,如整洁度测试通用人工智能的视觉常识理解能力,指测试通用人工智能基于常识对视觉内容进测试通用人工智能的事件理解能力,指测试通用人工智能识别并解析动态场景中的事测试通用人工智能的行为意图理解能力,指测试家庭环境通用人工智能推断动态场景b)群体交互行为预测:预测多个主体间彼此协同或冲突测试通用人工智能的情绪理解能力,指测试通用人工智能识别动态场景中测试视觉语言联合解译能力,指测试通用人工智能结合视觉与文本信息进行跨模态推测试通用人工智能的自然语言指令视觉响应能力,指测试通用人工智能理解自然语言7结合图像内容进行推理、操作和表达的能力,包a)指令理解与执行:根据自然语言指令在图像中进行目标定位b)图文关联推理:将自然语言与图像内容进行对应,结合上下文进行跨模态分析与c)文档视觉理解:结合自然语言信息,在图像、表格、文档类视觉c)测试结果:根据待测模型在参加所有测试的测试数据,汇总报告测试结a)合规性和隐私保护:数据收集过程遵循适用的法规和隐私保护标准,保护用户隐私;c)时效性:数据集结合开源数据集和自制数据集,定期更新d)可用性:数据集格式和接口符合广泛的标准,以便于获取和使e)多样性和代表性:涵盖不同的背景、场景、领域等,以确保数据能覆盖不同的使用情a)导入待测模型,验证模型的输入和输出数据工作正常;b)逐个开展任务测试,由测试系统根据任务要求来记录待测模型表现;c)汇总测试数据,进入测试结果分析及报a)针对表1中的部分或全部二级能力维度,选择M个测试b)依次针对M个任务类别开展测试;d)给定明确任务指令,并设定任务执行时间,在时间用尽后汇总任务完成e)统计正确完成的家庭任务数(TP)、正确忽略的家庭任务数(TNa)针对表1中的部分或全部二级能力维度,选择M个测试b)依次针对M个任务类别开展测试;d)进而为测量自主性,不设定明确任务指令,允许待测模型自主决定执行或不执行任意任务
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中八年级地理《美国与巴西》区域对比教学导学案(人教版春季学期)
- 2026年3月心理咨询师考试试题与答案
- 本土语言保护推广承诺书6篇
- 信息泄露预警企业安全团队预案
- 中成药留样观察室可行性研究报告
- 确认参加行业展览的回复函(9篇)
- 智慧制冷能效诊断项目可行性研究报告
- 文化产业创意设计与文化传播方案
- 温馨家庭和睦承诺书范文4篇
- 建筑施工企业安全施工规范手册
- 2026年安全生产月-人人讲安全、个个会应急-排查整治风险隐患
- 保山市旅游发展总体规划
- 人工智能导论知到章节答案智慧树2023年哈尔滨工程大学
- 2022年全国高考新高考I卷读后续写课件- 高三英语二轮复习
- 【超星尔雅学习通】航空与航天网课章节答案
- 考向1 化学与STSE(附答案解析)-备战高考化学一轮复习(全国通用)
- 2023年报告模版单位政治生态分析研判报告
- 青年官兵常见心理问题与预防对策,军事心理学论文
- GA 891-2010公安单警装备警用急救包
- 媒介经营与管理-课件
- 能源危机与能源安全课件
评论
0/150
提交评论