大语言模型在放射学应用的研究进展_第1页
大语言模型在放射学应用的研究进展_第2页
大语言模型在放射学应用的研究进展_第3页
大语言模型在放射学应用的研究进展_第4页
大语言模型在放射学应用的研究进展_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【摘要】大语言模型(LLMs)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。LLMs推动了自然语言处理领域的不断发展和进步。近年来LLMs与放射学的结合革新了放射学临床实践的各个方前景。本文阐述了LLMs的概念、发展历史以及特性,并从放射学领域内LLMs的医学专业之一一直处于科技变革的前沿。过去2年,人工智能(artificialintelligence,AI)取得了显著进步,其中最引人注目是大语言模型(large1重塑了放射科医师的日常工作实践[1]。同时也带来了一些LLMs自身固有的以及将其整合或应用于临床放射学实践的风险与挑战。本文概述了LLMs的发展历LLMs是通过分析和生成大量文本数据的复杂言非常相似的响应和输出[2-3],并能够用自然语言交谈、推理、理解上下文和解释复杂的信息。LLMs的价值在放射学领域中获得广泛认可[1,4]。LLMs的起源可追溯至20世纪50年代,Georgetown-IBM实验成功演示了机器翻译[5]。1997年Hochreiter等[6]探索了递归神经网络和长短期记忆网低,无法主动清除无效信息。2017年,Vaswani等[7]开创性地引入Transformer架构,Transformer是一种具有许多参数的先进神经网络架构,主要新颖之处在于其自身注意力机制[8],为LLMs的发展提供了重要的技术基础。2018年生成式预训练变换器(generativepre-trainedtransformer,GPT)和基于Transformer架构的双向变换器模型的发布标志越来越受到欢迎[1,9]。2022年11月,OpenAI发布的ChatGPT引起了全世界2023年3月,GPT-4模型带着多模态理解能力的标志性进步问世,这是GPT系上下文的适应性,相较于ChatGPT有了明显的进步。2025年2月,DeepS1以顶尖的中文理解和推理能力填补了国产LLMs的世界级空白,并显著降低前调,上下文处理能力弱,泛化能力有限,而LLMs通过Transformer架构、自身性,实现多任务泛化,并整合文本、图像输入,支持跨模态推理[7,10-12]。通过模型压缩技术加速推理过程的同时能耗下降[7,13]。1.大规模数据与参数:LLMs通常在大规模文本数据上进行训练,这些数据的增加性能提高[14]。此外,这些参数是模型中的可调元件,可以在训练期间2.采用预训练和微调的学习方法:LLMs效率低下[24]。LLMs作为临床医师的“AI助手”可以利用深度学习算法并结合临床信息,将放射学图像与患者的临床信息(如病史、症状等)相结合,并进行综合判断[25]。此外,使用ChatGPT作为问答工具也可以帮助放射科医师进行鉴别诊断和对病变进行分类[26],对于经验不足的放射科医师来说,这些问答亦具有潜在的附加值,可以用来进行医学学习和提升。McDuff等[27]的研10名辅助诊断准确度达59.1%,较医师独立诊断提高25.5%(59.1%vs.33.6%),在LLMs辅助下医师对输出反馈的适当性评分为4.43分(总分为5分)(LLMs未辅助医师的适当性评分为3.74),认为其表现出色且建议更可靠。5.提供临床决策支持(clinicald用LLMs增强CDS的热度和兴趣与日俱增。CDS可以帮助临床医师根据指南选择理和预后方面展现出潜力。然而LLMs在医学影像CDS中的处于起步阶段,需要进一步研究和标准化临床实践中基于LLMs的CDS的测试和实施[28]。(二)放射技术方面LLMs可以帮助放射科医师选择合适的影像学扫描方案。方案制定是为了在师执行[29]。放射科医师的职责不仅是解释图像形成报告,还包括选择合适的等。Rao等[30]研究表明ChatGPT在确定乳腺癌筛查和乳腺疼痛患者成像方式的适当性方面表现出了良好的准确度,并且这种准确度随着GPT-4的更新而提率。德国科隆大学医院的诊断和介入放射学研究所进行了一项研究[31],随机收集5个不同亚专科的100例住院和门诊放射检查申请表,根据患者的病史和临结果显示GPT-4对84例患者提供的方案与具有17年工作经验的放射科专家制定的检查方案一致(84%)。方面发挥作用。首先,LLMs可以帮助识别学术论文的新趋势和新动态,相比于引大量本文数据,潜在提高了科研的总体质量[32]。例如Khraisha等[33]发表的一项研究评估了GPT-4在筛选和提取3种不同类型文献(同行评审、非同行评审和非英语文献)方面的表现,结果发现其特异度与人类表现相当(>0.80,英语同行评审全文筛选除外),并且在包含非英语研究的文献中表现更为出色(>0.90),总体特异度、准确度与灵敏度皆有不错水平,几乎与人类相当。L据分析功能,可自主执行基本统计分析并构建基于机器学习的模型[35]。在ChatGPT的帮助下,放射科医师还可以轻松撰写、编辑、校对研究文章,并可以究论文高质量且无误[36]。2.教育方面:LLMs时代的到来不仅改变了放射学实践过程,同时也变革着无须对它们进行任何专门培训或强化,结果均达到或接近了及格门槛[37]。这入,对中国未来医疗领域AI长远发展同样具有深远意义[4]。此外,LLMs还可以提供互动式、类似导师的指导[24],针对特定学习目标量身定制培训模块理解报告内容,GPT-4可以将放射学报告中复杂的专业术语转换和解释为更加简单易懂的语言。一项研究随机抽取了4种不同放射诊断模式的400份放射学报读性,将平均阅读水平降低到美国成年人阅读水平的能力[38]。另一项研究结果显示ChatGPT可简洁、清晰和全面地翻译放射学报告[39]。在简洁性方面,的能力,并将原始报告不同部分的信息整合成易于理解的句子。这表明ChatGPT和GPT-4等先进的LLMs是临床应用中将放射学报告翻译成通俗易懂的语言很有价值的新工具,有助于患者了解报告中的放射学诊断和自己的医疗健康状况,提升患者的健康素养。此外,放射科医师也可使用LLMs来创建对患者友好的报告,并将其与原始报告一起输入电子病历,以帮助减轻患者的焦虑[40]。简化后的放射学报告在尽量保持完整性和准确性的基础上以易于理解的方式传达给患者信息,同时弥合了医师和患者之间的沟通差距,最终改善患者护理和预后。四、LLMs在放射学应用中的标准化与规范化挑战1.模型评估维度和标准规范:LLMs在放射学中的应用亟需建立多维度的评估体系,以平衡技术性能与临床实用性。在技术性能方面,需综合衡量报告生成的准确度、影像描述与放射科医师的一致性以及罕见病变的检测灵敏度等指标[41]。在临床实用性评估方面,应关注工作流效率提升的潜力和临床决策支持价值。此外,安全性评估的重点在于LLMs生成内容必须符合医疗法规,加强患者隐私保护,并重点分析错误与误导性内容对患者预后的潜在影响[42]。2.质量控制体系的构建:为确保LLMs在放射学中应用的可靠性,需构建覆盖从数据输入至生成输出的全流程质量控制链。首先,输入层需标准化影像输入数据,排除非结构化或低质量临床文本。其次,在处理层即过程质量控制方面,可以通过实时可信度检查来标记低可信度的诊断,设置常见错误拦截机制。最后,输出层自动化校验与放射科医师人工审核的协同机制不可或缺。总之,质量控制体系在确保放射学报告安全性的同时,显著提升临床工作效率和医患信任度,为AI的规范化和规模化应用奠定良好基础。盾甚至虚构的情况。例如,在向ChatGPT和谷歌推出的聊天机器人Bard询问有g-RADS)分类5类和6类的问题时,它们均给出了错误的回答,而不是澄清lung-RADS分类5类和6类并不存在[43]。导致幻觉现象的原因之一可能是用于训练模型的数据集自身存在偏差或缺陷[44]。不同的输入数据也会使AI系统陷入误解,从而导致不适当的幻觉输出[45]。虽然幻觉现象的产生令人担忧,s中安全规范地使用患者数据。研究表明,在医学影像AI领域仍然存在的一系列亟待解决的伦理道德问题中,临床医师最为关注就是医疗过错归责问题(78.1%)和数据隐私的侵犯(64.1%)[46]。担忧。OpenAI尚未透露其算法工作原理的全部细节,因此任何用户询问模型问题时都应该特别谨慎地注意它回答和输出结果的正确性和规范性[26]。简化750份放射学报告,并提示LLMs“我是患者,简化此放射学报告”,同时提供美国人口普查中5个主要种族背景,结果显示报告的简化程度因种族背景而异,白人和亚裔患者的报告与其他种族患者相比更为简洁易懂[47-48]。另耳鼻喉科遴选住院医师,结果显示出了AI严重的种族、性别和其他社会因素的偏见[49]。这是一个重大的挑战,可能会导致不公平的结果,因此需要医学界5.抄袭的可能性:指利用AI书写论文或答题的一种舞弊方式[50]。过度章,对其文章中由AI生成的任何文本内容负责,并注明来源[51]。研究表明提高放射学学术界LLMs使用的透明度[52]。6.输出差异:LLMs的输出结果受训练模型数据的质量和数量的影响,它们版本的快速更新和发展可能会导致输出的差异。如GPT-3仅使用2021年9月之[26]。此外,ChatGPT在帮助科研人员撰写研究文章的主要局限性也是缺乏领则输出也可能不相关或不准确[36]。而且由于LLMs的随机性,即使使用相同的提示进行询问,输出也会随着时间发生偏差和波动[28]。interface,API)密钥到实际调用API进行文本生成都相当昂贵,使得小型医疗保健团体负担困难[26]。大多数与LLMs相关的研究是在高收入国家进行的,这引发了人们对于这些研究和那些具有不同医疗需求和不同医疗基础设施水平较低收入和中等收入国家之间研究相关性大小的疑问[53]。针对此类问题,开开源LLMs之一其在放射学中的应用和潜力受到广泛关注和研究[54]。相较于闭源商业模型(如GPT-4),开源LLMs支持本地化部署,为解决包括数据隐私、型的性能可能略逊于商业LLMs,但其灵活性、低运营成本及本地部署的安全性使其成为医疗AI可持续发展的关键[55]。审查、评估和验证,确保负责任地使用这些模型[24]。在临床实践中使用AI施解决其局限性,包括数据隐私与LLMs生成内容中的潜在偏见等,推进技术的选可以减少低质量或矛盾数据的影响[56]。检索增强生成将模型与结构化知识库动态链接,从源头抑制事实性错误[57]。在模型训练阶段,事实性微调与人类反馈强化学习优化了模型对真实性的对齐能力[58-59]。通过系统性优化,下一代LLMs有望在减少幻觉的同时,实现更可靠、更第三,多模态大型语言模型(mult

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论