版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
脉卫2023年9月MEDVISION脉卫01ChatGPT与医疗领域大语言模型02医疗行业应用:辅助医疗健康服务03医疗行业应用:辅助医药研发与生命科学04ChatGPT医疗行业应用展望2大语言模型三三ChatGPT是由OpenAl开发的一种大型语言模型(LLM),它的设计目标是理解和生成人类语言,从而脉卫能够进行自然、有深度和有价值的对话。基于强大的GPT技术架构,ChatGPT已经展现出在语言理解、文本生成、情感识别等多方面的强大能力,并且在教育、医疗、客服等领域得到了广泛的应用。时间发布产品/模型重要创新点GPT-3模型文本生成:GPT-3生成的文本质量非常高,接近人类水平;代码生成:已经具备了代码生成的能力;对话模型:ChatGPT基于GPT-3.5的对话模型,内容生成:更长篇的内容输出;GPT-4模型高级推理:数据推理、图表分析、角色扮演,各项专业测试得分大幅提升(医疗/司法考试、各类学科考试);复杂指令:支持输入的文本长度提升;4(/MEDVISION脉卫大语言模型LLM智能交互能力法难以解决的问题,比如·1)复杂问题的理解、分析;·2)接近人类对话方式的语言交互;2019年OpenAl发布GPT-2,谷歌推出BERT模型2022年OpenAl推出ChatGPT55MEDVISION脉卫ChatGPT作为大语言模型的代表性产品,在医疗领域,它能理解医示例:医学实体识别(病案信息处理等)斤以上示例仅展示ChatGPT在医疗行业的技术能力、应用案例,并不代表实际应用或对特定情况的准确解决方案。6实际应用中,应考虑法律、伦理和医学专业人士的意见,并遵守适用的法律和规定。6示例:诊中临床病例整理MEDVISION脉卫77示例:健康管理咨询(过敏饮食问题)示例:诊后随访(虚拟家庭医生)示例:健康管理咨询(过敏饮食问题)MEDVISION脉卫881.3医疗领域大语言模型概览MEDVISION脉卫自2022年以来,医疗领域大语言模型的研发进入了爆发期。这一趋势的背后,是人工智能技术的快模型名称发布时间2022年Stanford和MosaicML2022年2022年10月StanfordUniversity等2022年11月2023年3月2023年3月2023年5月Google和Nvidia等ChatGPT)和医疗领域专用模型(如PubMedGPT、Med-的优势在于其广泛的应用范围和强大的泛化能力,而医疗领种产学研一体化的合作模式,经成为Al领域的一个重要研究9MEDVISION脉卫技术架构·底层算法:基于HuggingFaceGPT模型进行训练的。定位与特色·PubMedGPT是一个专门为生物医学文本设计的大型语言模型。PubMedGPT在PubMed摘要和PubMedCentral的Pile数据集上进行了训练。这个数据集涵盖了1600万篇摘要和500万篇全文文章。性能测评·在MedQA-USMLE(美国医学执照考试的问题和答案对)上,PubMedGPT超过了DRAGON(一种先进的生物医学语言模型),并设立了新的最高标准,在PubMedQA和BioASQ的其他两个QA任务上匹配了DRAGON的表现。应用场景·PubMedGPT在生物医学领域有广泛应用,特别是在医学问题回答方面表现出色,为医生和研究者提供强大的辅助工具。10数据来源:/stanford-crfm/BioMedLM1.3医疗大语言模型案例:谷歌Med-PaLMMEDVISION脉卫技术架构·底层算法:基于Transformer的大型语言模型。定位与特色·Med-PaLM是一个专门为医疗问题设计的大型语言模型,能够提供高质量的医疗问题答案。利用了Google大型语言模型的能力,将其对齐到医疗领域,以更准确和安全地回答医疗问题。性能测评·Med-PaLM2在USMLE问题上的准确率达到85.4%,与“专家”考试者的表现相当。应用场景·Med-PaLM可用于解答用户的健康问题1.3医疗大语言模型案例:谷歌Med-PaLM脉卫USMLE测试得分医师回答vsMed-PaLM回医师回答vsMed-PaLM回答treatment.KnowledgeGraphPretraining)模型,由StanfordUniversity等机构研发,是一种采用自监督的预训练方法,从大规模的文本和知识图谱中预训练深度联合语言-知识基础模型。技术架构数据进行预训练,包括两种自监督推理任务(掩码语言建模和知识图谱链接预测)。定位与特色模的数据上进行预训练,从而获得深度联合的文本和知识图谱表性能测评·DRAGON在包括一般和生物医学领域的问题回答等多种下游任务上超越了现有的语言模型和语言模型+知识图谱模型。·DRAGON在涉及长上下文或多步推理的复杂推理以及低资源QA上表现出显著的性能,并在各种BioNLP任务上获得了新的最先进的应用场景·可以用于各种下游任务,包括一般和生物医学领域的问题回答,以及复杂的推理任务。数据来源:/michiyasunaga/dragon技术架构定位与特色·Hippocratic的使命是开发最安全的人工健康普适智能,以高医疗保健的可接近性和健康结果。Hippocratic的模型不专注于诊断,而是专注于解释福利和账单、提供饮食建议和药物提醒、回答术前问题、接纳病人和传递“阴性”测试结果(即没有问题的结果)。性能测评·HippocraticAl的Al在超过100个医疗认证上表现优于包括GPT-4和Claude在内的领先语言模型,包括护理的NCLEX-RN,美国泌尿科委员会考试和注册营养师考试。·该模型在床边礼仪表现较好,比如“显示同情心”和“对病人的生活产生个人兴趣”,Hippocratic的模型在所有类别中得分最高,包括GPT-4。该模型在涵盖医疗账单和编码知识的认证专业编码员考试上得分为71%,在医院安全培训合规测验上得分为72.7%。应用场景·Hippocratic的模型被用于解释福利和账单,提供饮食建议和药提醒,回答术前问题,接纳病人以及传递医学检测结果。14数据来源:官网()MEDVISION脉卫专业的医学问答(QA)数据集是评估医疗大语言模型(LLM)性能的重要标准。通过这些数据集,我们可以客观地评估模型在理解和生成医学知识方面的能力,比如诊断推理、疾病理解、医疗知识的获取等。在医疗领域大语言模型快速发展趋势下,借鉴国际优质医学QA数据集,中国亦亟需推动建立标准化医学QA数据集,推动医疗大语言模型产业发展:1)推动医疗大语言模型国际对标·高质量的医学QA数据集有助于中国Al模型研发水平与国际顶级水平进行对·通过标准化测评,帮助研发爱团队明确当前技术水平,找出改进优化的方向。2)解决中国特色医疗数据问题·结合中国医疗管理体系术语(医院管理术语、医保术语)。·中国特色医学数据:中医、民族医学等等。MEDVISION脉卫megaloblasticanemiaandearlysignsofneurologicalabnormality.Thedrugmostprobablyrequiredisc)ErythropoietinMEDVISION脉卫·MedQA-USMLE是一个基于美国医疗执照考试(USMLE)的多项选择问题回答数据集。·数据来自专业医疗委员会的考试,涵盖了各种医疗领域的问题。monthhistoryofrightupperandlowHenoticedtheweaknesswhenhestartedfallingfarmorefrequentlywhilerunningerrands.Sincethen,hehashadmedicalhistoryissignificantonlyforwell-controlledpatientssymptoms?(答案为A)数据提供者·TongjiMedicalCollege,HUST(华中科技大学同济医学数据规模/构成数据集QA包含三种语言:·英语:12723个·简体中文:34251个·繁体中文:14123个数据维度·Question:问题描述·Options:选项与正确答案·Evidence:依据与解释·该数据集的多语言特性(包括中文和英文),有助于中国医疗大模型研发与全球水平的对标评估。MEDVISION脉卫·PubMedQA是一个生物医学问题回答(QA)数据集,该数据集从PubMed摘要中收集。任务定义是使用相应的摘要回答研究问题,这些问题的答案可以是yes/no/maybe·例如:术前使用他汀类药物能否减少冠状动脉旁路移植术后的心房颤动?(Results)TheoverallincidenceofpostoperativeAFwas26%.PostoperativeAFwassignificantlylowerintheStatingroupcomparedwiththeNonstatin数据规模QA数据包含:·1k专家注释数据·61.2k未标记数据·211.3k人工生成数据数据维度·Question:问题描述·Context:上下文,即问题相关的摘要,但不包括结论·LongAnswer:长答案,即摘要的结论·Answer:对结论的总结,是yes/no/maybe的形式MEDVISION脉卫数据集定义·MedMCQA是一个大规模的、多主题的、多选择题的医学领域问题回答数据集,旨在解决真实世界的医学入学考试问题。canleadtothefollowingchangeinkidneyparenchyma?hyperophy,tumors,normalpregnancy[..]数据提供者数据规模/构成·包含了194,267个问题;·覆盖了2,400个医疗主题和21个医学科目。数据维度·Question:问题·Options:选项·CorrectAnswer:正确答案(选项)·Explanation:详细解释19数据来源:https://huggingface.co/datasets/medmcqa数据集定义(MCQA)数据集。·来自法国药学专业医学专业文凭真实考试的问题组成,混合了单一和多个答案。数据提供者数据规模/构成数据集由3,105个问题组成:·训练集包含2171个问题(70%)·验证集包含312个问题(10%)·测试集包含622个问题(20%)数据维度·answers:从A到E的5个选项列表·correctanswers:正确的选项(问题的一个或多个答案)MEDVISION脉卫·数据集的问题来源于真实的法国药学专业医学专业文凭考试,聚焦药学领域。20httpspaperswithcodecomdatasetfrenc医疗行业应用:辅助医疗健康服务2.1ChatGPT辅助医疗健康服务:诊前、诊中MEDVISION脉卫临床笔记与EHR:ChatGPT辅助整理保险事务处理:辅助医生起草、撰写前访谈,帮助医生生成病情摘要、医生与患者问诊咨询记录,形成临床面向保险公司的医保申诉邮件(美国笔记,集成到HER(电子病例系统)。商业医保场景)。疾病早期筛查(*):使用ChatGPT诊断结果解释(*):使用ChatGPT结自动化随访(*):使用ChatGPT定期结合患者的健康数据和风险因素,合患者病例档案信息、医学知识库,自动与患者随访对话,询问患者的恢提供个性化的筛查建议、方案;辅助提供更精准的诊断解释参考;复情况,监测可能的并发症症状。将大幅减低医疗人员的工作负担;22注:*表示潜在的应用场景(暂无落地案例覆盖)MEDVISION脉卫Kahun集成ChatGPT软件(测试版):contraceptives,anti-coagulants,aspirin,period.MEDVISION脉卫Nuance是一家美国的技术公司,成立于宣布将GPT-4集成到其临床笔记软件DAX中。·场景描述:医院(诊所)的急诊、护理场景。人工质量控制审查环节(完全由GPT-4)处理,节省了数小时的延迟。MEDVISION脉卫Nabla是一家位于法国巴黎的公司,成立于2018之之记每天节省医生时每天节省医生时间(小时)平均每天增加接待患者数MEDVISION脉卫Hello,Doctor.27数据来源:截图来自软件试用,指标数据来自官网()MEDVISION脉卫公司,专门从事医疗保健软件的开发。主要产品MEDVISION脉卫99网站操作示例Asherhealthcareprovider,westronglyrecommendthat[PatientName]continueonMounjarotohelp网站操作示例herbloodDocsGPT,医生只需简述患者情况和申30数据来源:DoCsGPT网站(www.DocsGPT.com)MEDVISION脉卫医疗行业应用:辅助医药研发与生命科学MEDVISION脉卫数据请求用户问题数据请求专业回答数据返回专业回答MEDVISION脉卫场景biomarkersfrompublic&private..详细描述临床试验信息根据条件搜索特定的临床试验,得到试验的基本信息如研究设计、目标、病人群体等。临床试验资格获取某种疾病或医疗状况的临床试验资格,即能否参与相关试验,可以结合摘要获取病人群体信息。组织信息临床试验组织搜索功能,根据组织信息筛选临床试验结果。疾病信息疾病信息搜索功能,根据疾病信息筛选临床试验结果。生物标志物信息生物标志物搜索功能,根据生物标志物筛选临床试验结果。ID查询临床试验信息使用特定的试验ID来获取相应的临床试验详情,包括研究设计、目标、病人群体(该试验治疗的疾病)、终点、修改和研究重点等信息。临床试验地点通过试验ID,获取该试验的实施地点信息。临床试验分组和结果通过试验ID,获取该试验的各个试验分组的信息以及相关的结果和测量数据。临床试验资格通过试验ID,获取该试验的资格要求,包括参与的包括和排除条件。MEDVISION1)按疾病、区域查询临床试验信息(eg美国乳腺癌临床试验查询) 用表格整理以上查询结果:脉卫以下是关于BTLA的临床试验的信息:试验名称2数据表整理输出LymphocyteAttenuatorSafety,TolerabilityMonoclonalAntibody(S0脉卫3)按资助方查询临床试验(egPfrize相关临床试验)试验名称试验名称COVID-Patient-ReportedHealth-RelatedQualityofLifeAssociatedWithCOVID-19:AProspectiveSurveyStudyonSymptomaticCOVID-PfizerBioNTechCOVIDBVaccineEffectivenessStudy-KaiserPer-manenteSouthernCaliforniaCOVID-SAFETY,PHASE2/3,DOUBLE-BLIND,2NONHOSPITALIZEDSYMPTOMATADULTPARTICIPANTSWITHCOVIDCOVID-试验名称试验名称SafetyandEfficacyFromLargeEtanerceptinJapanALONG-TERMPROSPECTIVEPOSTAIITHORISATIONSAFMEDVISION脉卫22MEDVISIONWhataretheapprovedKRASG12Cdrugsfornon-smallcelllungcancer(NSCLC)?HereismyplantoansweryourquestionTheapprovedKRASG12Cdrugsfornon-smallcelllungcancer(NSCLC)are:1)分析步骤0691e68ef8c12)数据源查询·KRAZATIQ1sales:S6.3millionofnetrevenue,achievedapproximatelyone-thirdofnewTheapprovedKRASG12Cdrugsfornon-smallcelllungcancer(NSCLC)areKRAZATl(genericname:partiallyoffsetbylowernetsellingprice,declinedQ-on-QintheUSby$14millionor23%drivenby40%volumegrowthpartiallyoffsetbylowernetsellingprice.LUMAKRAShasbeenlowerthanQ42022approvedin50countriesandisactivelylaunchingoutsidetheUS.DatawillbepresentedfromstudiesofLUMAKRASincombinationwithstandardofcarechemotherapyandnon-smallcelltungcancerandWhataretherecentcompetitiveinsightsforKRAZATlandLUMAKRASintheNSCLCmarketfromincombinationwithVectibixandstandardofcarechemotherapyincolorertalcanceratASCO41数据来源:官网(www.www.ferma.ai)MEDVISION脉卫DESTINY-Breast⁰4trialwas23.9monthswithT-Dxd,whichisagainofover6months行业背景ChatGPT局限性脉卫1.Metastaticcolorectalcancer2.Non-smallcelllungcancer3.Glioblastoma(atypeofbraincancer)4.Metastaticrenalcellcarcinoma(kidneycancer)peritonealcancer1.Metastaticcolorectalcancermetastaticnonsquamousnonsmallcellungcancer3.Recurrentglioblastomainadults4.MetastaticrenalcellcarcinomaEpthelialovarfanfaloplantubeorSourcehttpswwwgenecomdownavastinprescrbingpdfChatGPT局限性LLM的响应的准确性和相关性,从而实现模型性能的持续改进。将反馈纳入其中,可以防
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司员工满意度调查方案
- 暖通空调设计施工方案
- 2025浙江绍兴市国控集团有限公司高层次人才招聘总及人员笔试历年常考点试题专练附带答案详解
- 2025浙江温州市供销集团有限公司招聘工作人员1人笔试历年备考题库附带答案详解
- 公司营销渠道开发方案
- 公司会议管理流程优化方案
- 2026西安市灞桥区文化馆就业见习岗位招聘考试参考题库及答案解析
- 2025江苏海州港务股份有限公司招聘工作人员笔试笔试历年典型考点题库附带答案详解
- 2026中国铁路投资集团有限公司应届高校毕业生招聘25人笔试参考题库及答案解析
- 2025山东潍坊市安丘农业发展投资集团有限公司招聘延长笔试历年备考题库附带答案详解
- 2026湖南衡阳市招聘衡东县政务服务中心综窗工作人员3人笔试备考试题及答案解析
- 2026年宁夏石嘴山市单招职业适应性测试题库及答案详解一套
- 2026届河南省濮阳市下学期高中三年级第一次模拟考试英语试卷(试卷+解析)
- 2026年春青岛版二年级数学下册两位数加减两位数的口算教学课件
- 2026年山东春季高考车辆维修类专业知识(理论)模拟试题
- 未来两年就业趋势
- 2026年包头铁道职业技术学院单招职业技能测试题库带答案详解(b卷)
- 湖南长郡中学等校2026届高三上学期“耕梦计划”语文试题(含答案)(一)(含解析)
- 2026年内蒙古兴安盟单招职业适应性测试题库带答案详解(a卷)
- 2025年武汉铁路桥梁职业学院单招职业适应性考试题库及答案
- 2026年国际关系理论与实践外交政策研究探讨考试题目
评论
0/150
提交评论