CESA-2022-029-《人工智能 智能服务 智能微服务保障技术要求》团体标准(征求意见稿)_第1页
CESA-2022-029-《人工智能 智能服务 智能微服务保障技术要求》团体标准(征求意见稿)_第2页
CESA-2022-029-《人工智能 智能服务 智能微服务保障技术要求》团体标准(征求意见稿)_第3页
CESA-2022-029-《人工智能 智能服务 智能微服务保障技术要求》团体标准(征求意见稿)_第4页
CESA-2022-029-《人工智能 智能服务 智能微服务保障技术要求》团体标准(征求意见稿)_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240

CCSL70

团体标准

T/CESAXXXX—202X

人工智能智能服务智能微服务保障技

术要求

Artificialintelligence–Intelligentservice-Technicalrequirements

forintelligentmicro-serviceguarantee

(征求意见稿)

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

已授权的专利证明材料为专利证书复印件或扉页,已公开但尚未授权的专利申请

证明材料为专利公开通知书复印件或扉页,未公开的专利申请的证明材料为专利申请

号和申请日期。

202X-XX-XX发布202X-XX-XX实施

中国电子工业标准化技术协会发布

T/CESAXXXX—202X

前言

本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规

定起草。

本文件由中国科学院软件研究所提出。

本文件由中国电子技术标准化研究院、中国电子工业标准化技术协会归口。

本文件起草单位:

本文件主要起草人:

IV

T/CESAXXXX—202X

人工智能智能服务智能微服务保障技术要求

1范围

本文件规定了智能微服务适配保障的服务监测、资源监测、保障方法和效果验证四部分的技术要求。

本文件适用于人工智能领域多种智能服务产品和应用的研发、运维和使用。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

T/CESAXXXX-202X中界定的以及下列术语和定义适用于本文件。

3.1服务适配保障serviceadaptationandguarantee

在智能微服务长期运行时,通过多种手段保障已适配服务的正常、稳定和高效运行。

3.2服务质量qualityofservice

通过每秒钟支持的用户数、每秒钟处理的用户请求数来表示的指标。

3.3启发式方法heuristics

根据历史服务保障经验,通过人工方法设置若干条服务质量保障原则。

3.4学习方法learningbasedmethod

不进行显式的服务保障原则设置,使用AI模型自主学习出特定服务质量的设置。

3.5服务负载serviceworkload

单位时间内服务的访问数量,用于评估服务适配保障后的真实可用效果。

3.6服务资源serviceresources

服务适配保障时,智能微服务所使用的各类软硬件资源。

4缩略语

下列缩略语适用于本文件。

AI:人工智能(ArtificialIntelligence)

CPU:中央处理器(CentralProcessingUnit)

GPU:图形处理器(GraphicProcessingUnit)

1

T/CESAXXXX—202X

I/O:输入/输出(Input/Output)

5智能微服务适配保障流程

智能微服务适配保障依托于智能服务适配平台(标准CESA/XXXX),在智能微服务适配演化(标准

CESA/XXXX)后的长期运维阶段,使用本适配保障流程,及时发现并解决智能微服务的相关异常,保障

智能化微服务的稳定、正常运行。智能微服务适配保障流程包含以下四个步骤:

a)服务监测:使用软件方法收集智能微服务长期运行时的服务数据,所有数据按照固定的数据格

式存储,并提供查询,检索,统计等功能,为服务保障方法提供基本的适配保障输入,主要包

括:智能微服务元数据,提供该服务的开放商和用户等信息;业务处理轨迹,给出服务代码的

运行过程和调用关系描述,以及运行过程中相应的性能数据;资源使用情况,记录一次请求服

务的资源开销;

b)资源监测:使用软件方法收集智能微服务运行所处软硬件环境的资源数据,所有数据按照固定

的数据格式存储,并提供查询,检索,统计等功能,也为服务保障方法提供基本的输入,其具

体包括:物理机、虚拟机、容器资源等,提供计算、存储、网络和I/O等方面当前可用、已用

资源信息;多种资源按照一定条件聚合后的数据,提供按照分区等条件下的整体资源使用情况

以及各部分资源使用占比等;多种资源之间的关联性数据,提供资源间之间的使用顺序和关联

关系;

c)保障方法:根据上述服务、资源监测流程中收集到的服务和软硬件监测数据,保障方法配置相

关的保障规则和学习模型,能够得到满足一定负载需求的智能微服务以及其需要的资源配置,

其通过基于特定的规则和学习的两类保障方法实现:基于规则的保障方法包括是否类、数值类、

阈值类和自定义规则,用于明确是否强制使用某些资源以及使用资源的具体容量;基于学习的

保障方法包括待学习数据、参数、模型和输出结果,用于满足学习方法正常运行所需的的所有

要素;

d)效果验证:根据保障方法的具体选型,效果验证能够运行智能微服务,并将保障方法作用于服

务运行,其提供监测数据的收集和日志导出能力,用于验证服务运行时的监测结果是否符合保

障方法的要求,并验证是否达到相应服务质量的需求。

2

T/CESAXXXX—202X

服务监测

服务自身元数据

服务请求业务处理轨迹

保障方法效果验证

服务资源使用变化度量

是否类规则待学习数据

负载发生

监测数据数值类规则学习参数

方法监测收集服务运行

资源监测阈值类规则学习模型试用

物理机资源使用监测日志导出

自定义规则学习输出

虚拟机/容器资源监测

异构资源聚合监测

异构资源关联性监测

图1智能微服务适配保障

6功能要求

6.1服务、资源监测要求

服务、资源监测包含但不限于以下要求:

a)应支持智能微服务的可用资源、已用资源等的数值类型符合Bool、Float32、Float64,Int32,

Int64,Double32、Double64、TimeStamp、Blob这几种,与主流数据库数据类型相符;

b)应支持智能微服务运行时主流的软件平台的资源监测,包括容器(Docker、Containerd等),

虚拟机等软件的运行资源监测;

c)应支持智能微服务运行所需的硬件资源监测,包括CPU、GPU等计算资源,以及磁盘、网络、

I/O等资源;

d)应支持智能服务运行时业务处理轨迹的监测,包括调用关系,执行时间以及调用是否成功等信

息;

e)应支持服务调用轨迹等非数值型监测数据以Json、Yaml格式保存,包括前驱、后继节点、边

连通性、时间权重等信息;

f)应支持服务监测数据的查询,检索以及分析的功能,包括数据聚合,平均,计算极值和方差等

统计功能;

g)应支持资源监测的整个过程以非侵入的探针、钩子函数或数据推送方式实现,避免与原有服务

或相关治理框架的冲突;

h)应支持监测时间间隔、监测协议、监测数据存放等监测配置项提取为独立的配置文件,提升监

测的适用范围;

i)应支持监测结果的存放、可视化展示、安装等环节符合云原生要求,保障监测框架能快速与已

有监测框架的快速整合。

6.2保障方法要求

3

T/CESAXXXX—202X

保障方法的要求包含但不限于以下要求:

a)应支持来自主流AI框架(Tensorflow、Pytorch、Onnx)的AI模型作为保障方法中的学习模

型,其使用的算子、控制语句等具有一定的通用性;

b)应支持保障方法中的数据集符合一般的数据集规范,形成相关说明文档,包括数据量大小、单

条监测数据的格式、数据集标准等;

c)应支持保障方法中的保障规则以是否、数值、阈值或其他自定义形式来准确描述服务保障的行

为、使用条件和预期效果;

d)应支持保障规则中的自定义形式符合一定的规范,形成相关的说明文档,包括规则的数据输入,

输出以及可用的范例等。

e)应支持某一特定的保障方法以虚拟机容器镜像方法进行封装,可独立运行;

j)应支持保障方法以非侵入的方式实现,对智能微服务和异构资源管控时避免与原有服务和其他

治理框架的冲突。

f)应支持某一特定的保障方法遵循通用的监测协议和配置生效方式,支持Http、Https,TCP/UDP

等几种主流的配置方式;

g)应支持服务保障方法明确对智能微服务的管控能力边界,如增加、减少资源使用,迁移分配异

构资源等;

h)应支持服务保障方法明确对异构资源的管控能力边界,如CPU、GPU的容量、线程分配,异构

资源的更新、删除,资源间的动态拓扑关系等。

6.3效果验证要求

效果验证的要求包含但不限于以下要求:

a)应支持效果验证关键功能组件不少于负载发生、服务运行、日志导出和监测收集四项,以保证

验证效果真实可信;

b)应支持监测收集支持标签或注解机制,以区分服务保障的测试或真实运行环境;

c)应支持日志导出环节包含对保障效果的总结性评价:在使用多少资源时能对多少服务负载达到

多少的吞吐量,以量化保障后的服务质量。

d)应支持服务运行环节的启动指定与Kubernetes、VMware、KVM启动兼容的启动脚本,避免和特

定研发语言、业务的耦合。

e)应支持负载发生支持泊松分布、随机分布等若干种特定的负载特点,以模拟真实智能微服务的

使用场景。

4

T/CESAXXXX—202X

目次

前言.................................................................错误!未定义书签。

1范围................................................................................1

2规范性引用文件......................................................................1

3术语和定义..........................................................................1

4缩略语..............................................................................1

5智能微服务适配保障流程..............................................................2

6功能要求............................................................................3

6.1服务、资源监测要求..............................................错误!未定义书签。

6.2保障方法要求....................................................错误!未定义书签。

6.3效果验证要求....................................................................4

III

T/CESAXXXX—202X

人工智能智能服务智能微服务保障技术要求

1范围

本文件规定了智能微服务适配保障的服务监测、资源监测、保障方法和效果验证四部分的技术要求。

本文件适用于人工智能领域多种智能服务产品和应用的研发、运维和使用。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

T/CESAXXXX-202X中界定的以及下列术语和定义适用于本文件。

3.1服务适配保障serviceadaptationandguarantee

在智能微服务长期运行时,通过多种手段保障已适配服务的正常、稳定和高效运行。

3.2服务质量qualityofservice

通过每秒钟支持的用户数、每秒钟处理的用户请求数来表示的指标。

3.3启发式方法heuristics

根据历史服务保障经验,通过人工方法设置若干条服务质量保障原则。

3.4学习方法learningbasedmethod

不进行显式的服务保障原则设置,使用AI模型自主学习出特定服务质量的设置。

3.5服务负载serviceworkload

单位时间内服务的访问数量,用于评估服务适配保障后的真实可用效果。

3.6服务资源serviceresources

服务适配保障时,智能微服务所使用的各类软硬件资源。

4缩略语

下列缩略语适用于本文件。

AI:人工智能(ArtificialIntelligence)

CPU:中央处理器(CentralProcessingUnit)

GPU:图形处理器(GraphicProcessingUnit)

1

T/CESAXXXX—202X

I/O:输入/输出(Input/Output)

5智能微服务适配保障流程

智能微服务适配保障依托于智能服务适配平台(标准CESA/XXXX),在智能微服务适配演化(标准

CESA/XXXX)后的长期运维阶段,使用本适配保障流程,及时发现并解决智能微服务的相关异常,保障

智能化微服务的稳定、正常运行。智能微服务适配保障流程包含以下四个步骤:

a)服务监测:使用软件方法收集智能微服务长期运行时的服务数据,所有数据按照固定的数据格

式存储,并提供查询,检索,统计等功能,为服务保障方法提供基本的适配保障输入,主要包

括:智能微服务元数据,提供该服务的开放商和用户等信息;业务处理轨迹,给出服务代码的

运行过程和调用关系描述,以及运行过程中相应的性能数据;资源使用情况,记录一次请求服

务的资源开销;

b)资源监测:使用软件方法收集智能微服务运行所处软硬件环境的资源数据,所有数据按照固定

的数据格式存储,并提供查询,检索,统计等功能,也为服务保障方法提供基本的输入,其具

体包括:物理机、虚拟机、容器资源等,提供计算、存储、网络和I/O等方面当前可用、已用

资源信息;多种资源按照一定条件聚合后的数据,提供按照分区等条件下的整体资源使用情况

以及各部分资源使用占比等;多种资源之间的关联性数据,提供资源间之间的使用顺序和关联

关系;

c)保障方法:根据上述服务、资源监测流程中收集到的服务和软硬件监测数据,保障方法配置相

关的保障规则和学习模型,能够得到满足一定负载需求的智能微服务以及其需要的资源配置,

其通过基于特定的规则和学习的两类保障方法实现:基于规则的保障方法包括是否类、数值类、

阈值类和自定义规则,用于明确是否强制使用某些资源以及使用资源的具体容量;基于学习的

保障方法包括待学习数据、参数、模型和输出结果,用于满足学习方法正常运行所需的的所有

要素;

d)效果验证:根据保障方法的具体选型,效果验证能够运行智能微服务,并将保障方法作用于服

务运行,其提供监测数据的收集和日志导出能力,用于验证服务运行时的监测结果是否符合保

障方法的要求,并验证是否达到相应服务质量的需求。

2

T/CESAXXXX—202X

服务监测

服务自身元数据

服务请求业务处理轨迹

保障方法效果验证

服务资源使用变化度量

是否类规则待学习数据

负载发生

监测数据数值类规则学习参数

方法监测收集服务运行

资源监测阈值类规则学习模型试用

物理机资源使用监测日志导出

自定义规则学习输出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论