糖尿病人工智能模型评测规范(征求意见稿)_第1页
糖尿病人工智能模型评测规范(征求意见稿)_第2页
糖尿病人工智能模型评测规范(征求意见稿)_第3页
糖尿病人工智能模型评测规范(征求意见稿)_第4页
糖尿病人工智能模型评测规范(征求意见稿)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

T/NTMIA

团体标准

T/XXXX00X-2021

糖尿病人工智能预测模型评测规范

应用技术标准

AssessmentSpecificationsforArtificial

IntelligentPredictionModelof

Diabetes

(征求意见稿)

(征求意见稿)

2021-XX-XX发布2021-XX-XX实施

南通市医学信息学会发布

T/XXXX00X—2021

前言

糖尿病是一种以持续性血糖升高为特征的慢性代谢性疾病,2020年最新流行

病学调查结果显示,其患病率在中国成年人群中达11.2%。庞大的人口基数与漫

长的糖尿病病程制约着医疗资源的分配,目前我国糖尿病的知晓率、治疗率及控

制率均未超过50%,在糖尿病的预防和管理中我们仍需面对医疗资源短缺的难

题。人工智能技术作为一种智能的辅助诊断及治疗工具,正逐渐进入糖尿病领

域,近年来关于“糖尿病人工智能预测模型”的研究与日俱增,其中有基于临床队

列研究数据和统计学方法构建的糖尿病的风险预测模型,以及应用深度神经网

络、超限学习机方法、支持向量机方法及自然语言处理等机器学习模型,这些模

型可以通过无创手段预测糖尿病发病风险,从而为缓解紧张的医疗资源并提供个

体化的医疗支持。

本标准的主要技术内容是:1.总则;2.规范性引用文件;3.术语、定义和符

号;4.糖尿病人工智能模型测评流程与规范;5.参考文献。

本标准由南通市医学信息学会负责管理和具体技术内容的解释。本标准在

执行过程中,如发现需修改和补充之处,请将意见和有关资料寄送南通市医学

信息学会(江苏省南通市崇川区启秀路19号图书馆楼315,邮编226001)

本标准主编单位:南通大学医学院

本标准参编单位:南通大学附属医院、南通静远医药科技有限公司

本规范主要起草人员:XXXX。

本标准为首次制定。

T/XXXX00X—2021

糖尿病人工智能预测模型评测规范

1总则

1为贯彻落实国家“健康中国2030”与国务院办公厅发布《关于促进“互联网+医疗

健康”发展的意见》等政策,推动智慧医疗在糖尿病等慢病管理中的应用可持

续发展,特制定本标准。

2本标准明确糖尿病人工智能预测模型评测规范,规定糖尿病人工智能模型中相关技

术要求。

3本标准适用于糖尿病的人工智能预测模型的测试评估,其它相关技术条件相

同时在符合国家现行有关标准的规定时也可参考执行。

2规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日

期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修

改单)适用于本文件。

GB/T5271.31—2006信息技术词汇第31部分:人工智能机器学习

GB/T29836.1—2013系统与软件易用性第1部分:指标体系

GB/T29836.2—2013系统与软件易用性第2部分:度量方法

WS/T303-2009卫生信息数据集元数据规范

WS/T449—2014慢性病监测信息系统基本功能规范

WS/T483.13—2016健康档案共享文档规范第13部分:2型糖尿病患者随访

服务

T/CHAA007-2019慢性病健康管理规范

T/XXXX00X—2021

3术语和定义

下列术语和定义适用于本文件

3.1糖尿病diabetes

糖尿病是一种由于胰岛素分泌缺陷或胰岛素作用障碍所致的以高血糖为特征

的代谢性疾病,临床上可分为1型糖尿病、2型糖尿病、妊娠糖尿病和特殊型的糖

尿病。

3.2人工智能artificialintelligence

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术

及应用系统的一门新的技术科学。

3.3临床预测模型clinicalpredictionmodel

临床预测模型(又称临床预测规则、预测模型或者风险评分):指利用统计

学或机器学习方法估算患有某病的概率或者将来某结局发生的概率的算法,可分

为诊断模型(Diagnosticmodels)和预后模型(PrognosticModels)。

3.4最小纳入特征集minimumfeatureset

该特征集的特点为临床获取方便,敏感性和特异性均可接受,成本效益好,

是便于不同技术水平的医疗机构获取的最小特征集。模型在最小纳入特征集上的

表现为基线表现,体现该模型的适用性和可推广性。基于特殊人群(如老年人、

手术患者、重症患者、1型糖尿病等)的模型可不参考。

3.5长期静坐longsedentarytime

静坐指安静地坐位工作、学习、阅读、看电视、用电脑、休息等静态行为

(不包括睡觉时间)累计时间。长期静坐指一周静坐时间超过5天,大于8小时/

天,或持续2小时没有起身活动和改变坐姿。

3.6空腹血浆葡萄糖fastingplasmaglucose

即空腹时的血糖值,空腹状态指至少8小时没有进食热量。

3.7口服葡萄糖耐量试验oralglucosetolerancetest

糖耐量试验,检测患者口服75g葡萄糖后,分别于30分钟、60分钟、120分钟

及180分钟时抽取静脉血,检测每个时间段的血糖值,其中75gOGTT2h血浆葡萄糖

即为2hPG。

T/XXXX00X—2021

3.8事件变量比eventspervariable

即总样本数与候选预测特征的比值。候选预测特征即最初采集的预测特征,

并非最终纳入模型的特征。

3.9数据集dataset

用于训练模型的每条数据,称为一个记录。记录的集和称为数据集,其中每

条记录是关于一个事件或对象的描述,称为样本。

3.10训练集trainingset

指训练样本的集和,算法从训练集中分析数据、学习规律、得到模型的过程

称为机器学习。

3.11验证集validationset

指验证样本的集和,不作为调参、选择特征等算法相关的选择的依据。规范的建

模流程应包括验证集的建立和使用,该数据集可体现模型的泛化能力,提示模型是否

满足临床需要。验证集可分为内部验证集和外部验证集:内部验证集和训练集来自同

一个数据集,通常有着相同的特征分布情况;外部验证集则有着未知的特征分布。

3.12标签label

人工智能模型所要预测的目标称为结局指标,其取值称为标签。

3.13C指数concordanceindex

可用于描述模型的区分正负样本的能力,有几种不同的计算方法和名称,如

Harrell’sC、C-statisticbyBegg、C-statisticbyUno等,其中Harrell’s

concordanceindex为最常用的C-index指标。

3.14受试者操作特性曲线receiveroperatingcharacteristiccurve

以假阳性率(1-特异度)为横坐标,真阴性率(敏感度)为纵坐标,其曲线

下面积Aeraunderreceiveroperatingcharacteristiccurve(AUC)可以体现模型的分

类能力。当AUC=1时,说明分类器能够正确区分所有的正样本和负样本。

3.15校准度calibration

反映了模型预测值与观察结果的拟合程度。

3.16区分度discrimination

反映了预测模型区分有结局指标和无结局指标个体的能力。

3.17预测能力predictionperformance

反映了模型的预测准确性。

3.18临床使用价值clinicalusefulness

包括三个方面:建模方法,即数据采集和建模流程是否规范;预测能力,即

效果参数的选取是否合理、得分是否达标;适用性,即模型是否能满足特定临床

需要。

4糖尿病人工智能模型测评流程与规范

4.1评测建模过程

4.1.1数据采集规范

4.1.1.1数据来源

设计良好的队列研究(如随机对照研究或合理的注册表数据),巢式病例对

照研究,常规病例对照研究或横断面研究是较好的数据来源;明确研究的日期信

息,包括开始时间、结束时间和随访时间(若有随访),时间跨度的设定应考虑

实际的研究目的;以现有队列研究或常规医疗记录为数据源可能会引入偏倚,因

为该数据不是为当前临床问题设计的,后续对数据的质量检查和基线调整可以减

少偏倚风险。

4.1.1.2研究对象

明确研究对象的关键信息(如初级医疗保健、二级医疗保健或普通人群等)和研究

中心的数量和位置。对研究对象进行合理的纳入排除,如排除已经有明确结果的参与

者,纳入疑似人群或有风险人群可以减少模型的偏倚风险。排除某个亚组则可能影响模

型对目标人群的预测效果,增加偏倚风险。

4.1.1.3最小纳入特征集

4.1.1.3.1糖尿病筛查模型变量

(1)年龄(≥40岁为高危);

(2)糖尿病前期史(有糖耐量异常或空腹血糖受损史为高危);

(3)肥胖情况(体重指数≥24kg/m²为超重,体重指数≥28kg/m²为肥胖,男性腰围

≥90cm或女性腰围≥85cm为向心性肥胖,均为高危);

(4)静坐生活方式(长期静坐为高危);

(5)一级亲属的2型糖尿病家族史;

(6)妊娠糖尿病史;

(7)高血压(收缩压≥140mmHg(1mmHg=0.133kPa)和/或舒张压≥90mmHg,

或正在接受降压治疗为高危);

(8)血脂异常(高密度脂蛋白胆固醇(HDL‐C)≤0.91mmol/L和/或甘油三酯

T/XXXX00X—2021

(TG)≥2.22mmol/L,或正在接受调脂治疗为高危);

(9)动脉粥样硬化性心血管疾病;

(10)一过性类固醇糖尿病病史;

(11)多囊卵巢综合征或伴有与胰岛素抵抗相关的临床状态(如黑棘皮征等);

(12)长期的抗精神病药物,抗抑郁药物治疗史和他汀类药物治疗史。

4.1.1.3.2糖尿病预后模型变量

(1)患病年龄;

(2)糖尿病类型;

(3)目前年龄;

(4)糖尿病家族史;

(5)血脂情况(胆固醇、高密度脂胆固醇、甘油三酯、低密度脂蛋白胆固醇)

(6)血压情况;

(7)血糖控制情况;

(8)心功能;

(9)体重指数;

(10)生活方式(饮食类型、方式与量、运动类型与运动量)。

4.1.1.4指标测量

4.1.1.4.1候选预测指标测量

对所有参与者使用一致的数据采集方式,对同一个指标使用相同的测量方式和诊

断标准。在收集数据时采取盲法,避免结局指标的差异影响特征收集和测量。保证所

有收集的特征在模型使用时都是可以得到的。

4.1.1.4.2结局指标测量

结局指标须有明确定义,并对所有参与者使用一致的测量方式和诊断标准。药物

和干预措施的结局指标可选择不良反应、感染情况等。就筛查而言,目前我国糖尿病

的诊断采用世界卫生组织(WHO)1999年标准:

(1)具有典型糖尿病症状(烦渴多饮、多尿、多食、不明原因的体重下降)且随

机静脉血浆葡萄糖≥11.1mmol/L或

(2)空腹血浆血糖(FPG)≥7.0mmol/L或

(3)口服葡萄糖耐量试验(OGTT)2h血浆葡萄糖≥11.1mmol/L;理想情况时同

时检查FPG及2hPG,单独使用FPG会增加漏诊率,也可使用糖化血红蛋白评估糖尿病

长期控制情况

孕期糖尿病包括妊娠期糖尿病(gestationaldiabetesmellitus,GDM)、妊娠期显性

糖尿病(overtdiabetesmellitus,ODM)及孕前糖尿病(pre‐gestationaldiabetes

mellitus,PGDM),其中GDM是指妊娠期间发生的不同程度的糖代谢异常,但血糖未

达到显性糖尿病的水平,诊断标准为孕期任何时间行75gOGTT,FPG

5.1~<7.0mmol/L,OGTT1hPG≥10mmol/L,OGTT2hPG8.5~<11.1mmol/L,上述血糖值

之一达标即诊断GDM。ODM指孕期任何时间被发现且达到非孕人群糖尿病诊断标准

(见上文)。PGDM指孕前确诊的1型、2型或特殊类型糖尿病。

建立预后研究模型时,应根据目的定期监测患者结局指标的变化,来说明所研究

的干预措施/指标变化与结局的关联,否则指标代表性变差。结局指标与预测指标的采

集应互相独立。在诊断模型中,预测指标和结局指标应在同一时间段进行采集,特别

是糖尿病急性并发症。但建立预测模型、预后研究及慢性并发症研究时,结果的判断

通常需要长期随访,采集间隔不会太过影响模型价值。

4.1.4.3建模数据量

一般情况下EPV≤10为数据量过小,EPV≥20为数据量可接受,EPV≥200为数据量合

适。同时应参考结局指标发生率,模型总体效果,预测指标分布等决定数据量,特殊

情况(目标事件发生率低)下可以接受相对较小的数据量。另外易产生过拟合的模型

(如决策树模型)应额外增大样本量,或优化模型构造。

4.1.2数据处理规范

4.1.2.1缺失值

说明数据缺失情况(样本缺失情况和特征缺失情况)和处理方法,包括删除、保

留和插补。删除缺失值通常会被表述为“使用可用数据/使用完整数据”,应甄别是数据

无缺失还是删除了缺失值。删除有两种情况:删除包含空缺值的样本和删除包含空缺

值的指标;一些机器学习算法支持保留缺失值,如随机森林模型、XGBoost模型、贝叶

斯模型、神经网络模型等;插补缺失值的方法有:人工填写;均值填充(平均数、中

位数、众数);就近补齐(就近的上一个或下一个数据);K近邻法(首先确定距缺失

样本最近的K个样本,利用加权平均来估计样本的缺失数据);回归(基于完整的数据

集建立回归方程,将包含空值的对象的其它已知属性代入方程);期望最大化(不断

迭代两个步骤直到参数小于预先给定的阈值:计算完全数据对应的对数似然函数的条

件期望,用极大化对数似然函数以确定参数的值);多重插补(为空值估计出几个插

T/XXXX00X—2021

补值,对插补后的数据集进行统计分析,综合推断最终插补值);C4.5方法(寻找属

性间的关系,利用代理属性决定原始属性中的缺失值)

组合多种方法优于单一方法,如删除一部分缺失度较大、相关度较小的指标,然

后对剩余指标进行多种方式的插补,并根据数据特点选择合适的模型。

4.1.2.2异常值

说明异常值的判断和处理方法。可通过人工判断(数据前后矛盾、明显错误)、

数据类型判断、重复数据检测、离群值检测(箱型图、数据正常值范围)等,异常值

可选的处理方法有直接删除、插补或替换,均可参考缺失值处理,另外也可将连续数

据离散化,消除极值影响。

4.1.2.3数据平衡性

说明数据中阴性/阳性(或多标签)的比例并进行处理。可选方法有上采样,即利

用随机采样扩充少数样本,SMOTE(扩充所有少数样本数据)、Borderline-SMOTE

(扩充边界少数样本数据)和ADASYN(根据不同的少数样本扩充,根据最终的平衡

程度选择最优结果)为改进的过采样方法,利用聚类方法增加样本,减少数据重叠;

下采样(欠采样),即在多数样本中随机抽样,EasyEnsemble(多次过采样)、

BalanceCascade(训练一个分类器,对于那些分类正确的多数类样本不放回,以此类

推)与NearMiss(保留最具代表性的多数样本)为改进的下采样方法,减少随机抽样

中造成的信息丢失;组合使用会比单一方法效果更好,可根据模型的评价指标确认处

理效果。另外也可以为不同的样本点赋予不同的权重来处理不平衡数据。

4.1.2.4离散化和编码

保留连续数值或离散化为4组以上类别。若仅作二分类,应选择广泛被接受的数据

分割点(如临床认可的指标分级点),而不是数据的中值点(中位数,平均数,四分

位数等)。对数据进行离散化和编码时应给出理论依据(如为何将3分类变量编码为2

分类变量)。

4.1.2.5训练集和验证集

随机划分训练集和内部验证集,描述数据特征分布情况,保证两个数据集的基线

可比性。7:3/6:4/5:5都是较常见的训练集/内部验证集比例,当样本量非常大的时候,验

证集的比例则可以更小。训练模型时应避免将内部验证集的信息带入,直到测试模型

时再将训练集上得到的预处理操作运用到内部验证集上。规范的建模流程建议应额外

设立外部验证集,以评价模型在特征分布情况未知的数据集上的表现。

4.1.2.6统计学处理

若数据来自病例对照研究或嵌套病例对照设计时,应考虑抽样误差和抽样比。如

以抽样比的倒数作为权重调整逻辑回归系数。合理的调整可以帮助减少5.1.1.1中提到的

风险;若为长期预后模型,则应将所有随访患者纳入时间-事件分析(如Cox回归),

而不是在逻辑回归中排除不完全随访的患者;若存在明显的竞争风险,即存在多个事

件终点,一般考虑使用竞争风险模型;若每个人有一个以上事件终点时,应选择多水

平或随机效应模型。

4.1.3建模方法

4.1.3.1特征筛选

首先减少特征数量(如主成分分析),然后结合先验知识和当前算法结果,依据

可靠性、一致性、适用性和成本筛选预测候选值(无论有无统计学意义),预测模型

中应包括模型认可的指标(帮助模型得到更高精度)和临床认可的指标(提高模型可

解释性)。不应该只参考单变量分析结果和统计学结果。

具体算法包括:过滤式(如卡方检验、信息增益、相关系数),即赋予特征不同

的权重,然后依据权重打分;包裹式(如支持向量机、回归模型),即生成不同的子

集组合,在机器学习过程中不断寻找最优组合;嵌入式,即模型生成的过程本身就对

特征进行了排序,如Lasso回归、岭回归、树模型等。

4.1.3.2模型建立

说明模型选择的原因(如基于数据特点、基于模型表现、基于成本效益等),最

好进行多模型的结果比较。并描述模型使用的优化方法、拟合参数和训练次数,如基

于梯度的优化算法、基于深度学习的优化等。

4.1.4基金、资助

基金和资助情况是否影响了数据收集、模型建立和模型推广。

4.2评测模型表现

4.2.1基线表现

糖尿病早期筛查系统应首先在最小纳入特征集上测试模型,然后再以其它感兴趣

特征训练和测试模型。

4.2.2验证集选择

应进行内部验证和/或外部验证。其中内部验证可以选择简单交叉验证、k折交叉验

证和留一法,外部验证可选择与训练数据类似的外部样本,数据量至少为100例样本

T/XXXX00X—2021

(少见病种则根据实际情况选择尽可能多的外部验证集)。用训练集数据验证模型、

或用内部验证的结果代替外部验证是错误的。若验证模型中缺少某个预测指标,也会

影响验证结果的真实性。

4.2.3验证过程效果与评价指标

应基于待验证的模型参数,计算出验证集中所有患者的得分,并与实际标签比

较。而不是用相同的算法对验证集进行建模(这样仅能说明某些变量在其它数据集中

也与结局指标有关,但不能证明原模型的预测能力)。另外应避免利用验证集不断优

化模型,避免验证集信息过多泄露。

4.2.3.1校准度

推荐以Hosmer–Lemeshow拟合优度测试进行校准评估,但该测试对组数和样本量

敏感,小样本集的结果参考性较低。另外可通过校准曲线观察,校准曲线越靠近对角

线说明校准效果越好,或以表格比较预测和观察结果频率。

4.2.3.2区分度

对逻辑回归模型和生存模型而言,可使用C指数(C-index),相当于ROC的曲线

下面积。C-index=0.5时说明无区分;C-index在0.5-0.7之间说明区分度低;C-index在

0.7-0.9之间说明区分度中等;C-index>0.9时说明区分度高。在二分类模型中,一致性

指数可以被AUC代替。另外重分类指标NRI(Netreclassificationimprovement)和IDI

(integrateddiscriminationimprovement)也是度量指标之一。

4.2.3.3预测能力

可选指标有AUC、敏感度、特异度、诊断准确率(诊断准确率=诊断准确的例数/

同期人工智能辅助诊断技术总例数*100%)、模型精度等。模型得到的预测概率通常会

根据阈值转化为二分类结果,导致信息的丢失,因此单独使用预测能力指标不能很好

的说明模型表现,需要结合校准度评估结果。

4.2.3.4信息采集准确率

指采集的信息样本能满足人工智能辅助诊断技术需要。

信息采集准确率=信息采集准确的样本数/同期采集的信息样本总数*100%

4.2.3.5人工智能辅助诊断平均时间

从下达人工智能辅助诊断医嘱到发出诊断报告的平均时间(以分钟计)

人工智能辅助诊断平均时间=人工智能辅助诊断时间总和/同期采用人工智能辅助

诊断技术总例数*100%

4.2.3.6诊断准确率增益率

反映人工智能辅助诊断技术的效率(单位时间、单位人员条件下)。

诊断准确率增益率=(人工智能辅助诊断准确率-人工诊断准确率)/人工智能辅助

诊断准确率和人工诊断准确率中的高值*100%

4.2.3.7日人均诊断量增益率

反映人工智能辅助诊断技术的效率(单位时间、单位人员条件下)。

日人均诊断量增益率=日人均人工智能辅助诊断量-日人均人工诊断量)/日人均人

工智能辅助诊断量和日人均人工诊断量中的高值*100%

4.2.3.8诊断平均时间增益率

反映人工智能辅助诊断技术的效率(单位时间、单位人员条件下)。

诊断平均时间增益率=(人工智能辅助诊断平均时间-人工诊断平均时间)/人工智

能辅助诊断平均时间和人工诊断平均时间中的高值*100%

4.3评测模型适用性

4.3.1人群适用性

以统计学方法和特征散点图详细说明数据的特征分布情况,确保模型的目标人群

与拟解决的特定临床问题类似。另外基于随机试验数据的模型通常有严格的纳入排除

标准,相比基于常规护理和卫生保健登记数据的模型,其适用性会降低。

4.3.2指标适用性

预测指标应设计合理,能够在特定临床环境中方便地获取(如新技术采集的生化

指标可能难以在医疗技术落后的地区得到)。有一定的临床可解释性,能够被使用者

(如临床医师)理解和认同;模型使用的结局指标可以很好的代表拟解决问题。

4.3.3易用性

提供完整的预测模型(如回归系数、模型常数项、某时点的基线生存情况等),

或以网页服务、应用软件、临床辅助系统等形式呈现,操作易上手,界面合理,并提

供有效的帮助服务和后续技术支持。模型能够快速给出结果,参考指标:人工智能辅

助诊断平均时间=人工智能辅助诊断时间总和/同期采用人工智能辅助诊断技术总例数。

4.3.4模型分析

说明模型的局限性,并与类似研究进行比较分析,方便使用者选择更适合特定临

床问题的模型系统。

5参考文献

T/XXXX00X—2021

[1]中华医学会糖尿病学分会,国家基层糖尿病防治管理办公室.国家基层糖尿病防治管

理手册.中华内科杂志,2019,58(10):713-735

[2]WolffRF,MoonsKGM,RileyRD,etal.PROBAST:ATooltoAssesstheRiskofBias

andApplicabilityofPredictionModelStudies[J].Annalsofinternalmedicine,2019,

170(1):W1-W33.

[3]CollinsGS,ReitsmaJB,AltmanDG,etal.Transparentreportingofamultivariable

predictionmodelforindividualprognosisordiagnosis(TRIPOD):theTRIPODstatement[J].

BMJ,2015;350:g7594.

[4]LiuX,RiveraSC,MoherD,etal.Reportingguidelinesforclinicaltrialreportsfor

interventionsinvolvingartificialintelligence:theCONSORT-AIextension.TheLancet

DigitalHealth,2020,2(10):e537-e548.

[5]卫生部办公厅.人工智能辅助诊断技术管理规范(试行)[J].中国药房,2010,

021(016):1531-1531.

[6]人工智能辅助诊断技术临床应用质量控制指标(2017版).国家卫计委2017-02-14颁布

《糖尿病人工智能预测模型评测规范》编写大纲征求意见表

提出意见单位联系人

电话

依据及理由:

T/NTMIA00X-2021

目次

前言

1总则

2规范性引用文件

3术语和定义

3.1糖尿病diabetes

3.2人工智能artificialintelligence

3.3临床预测模型clinicalpredictionmodel

3.4事件变量比eventspervariable

3.5最小纳入特征集minimumfeatureset

3.6空腹血浆葡萄糖fastingplasmaglucose

3.7口服葡萄糖耐量试验oralglucosetolerancetest

3.8C指数concordanceindex

3.9受试者操作特性曲线receivercharacteristicoperatorcurve

3.10校准calibration

3.11区分discrimination

3.12预测能力predictionperformance

3.13临床使用价值clinicalusefulness

3.14长期静坐longsedentarytime

3.15训练集trainingdataset

3.16验证集validationdataset

4糖尿病人工智能模型测评流程与规范

4.1评测建模过程

4.2基线表现

4.3评测模型适用性

5参考文献

T/XXXX00X—2021

前言

糖尿病是一种以持续性血糖升高为特征的慢性代谢性疾病,2020年最新流行

病学调查结果显示,其患病率在中国成年人群中达11.2%。庞大的人口基数与漫

长的糖尿病病程制约着医疗资源的分配,目前我国糖尿病的知晓率、治疗率及控

制率均未超过50%,在糖尿病的预防和管理中我们仍需面对医疗资源短缺的难

题。人工智能技术作为一种智能的辅助诊断及治疗工具,正逐渐进入糖尿病领

域,近年来关于“糖尿病人工智能预测模型”的研究与日俱增,其中有基于临床队

列研究数据和统计学方法构建的糖尿病的风险预测模型,以及应用深度神经网

络、超限学习机方法、支持向量机方法及自然语言处理等机器学习模型,这些模

型可以通过无创手段预测糖尿病发病风险,从而为缓解紧张的医疗资源并提供个

体化的医疗支持。

本标准的主要技术内容是:1.总则;2.规范性引用文件;3.术语、定义和符

号;4.糖尿病人工智能模型测评流程与规范;5.参考文献。

本标准由南通市医学信息学会负责管理和具体技术内容的解释。本标准在

执行过程中,如发现需修改和补充之处,请将意见和有关资料寄送南通市医学

信息学会(江苏省南通市崇川区启秀路19号图书馆楼315,邮编226001)

本标准主编单位:南通大学医学院

本标准参编单位:南通大学附属医院、南通静远医药科技有限公司

本规范主要起草人员:XXXX。

本标准为首次制定。

T/XXXX00X—2021

糖尿病人工智能预测模型评测规范

1总则

1为贯彻落实国家“健康中国2030”与国务院办公厅发布《关于促进“互联网+医疗

健康”发展的意见》等政

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论