医疗医疗健康实习报告_第1页
医疗医疗健康实习报告_第2页
医疗医疗健康实习报告_第3页
医疗医疗健康实习报告_第4页
医疗医疗健康实习报告_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医疗医疗健康实习报告一、摘要2023年6月5日至8月22日,我在XX医疗科技公司担任数据分析师实习生。核心工作成果包括完成300份电子病历数据清洗,构建3个患者满意度预测模型,准确率达82%;协助团队分析500组临床试验数据,提炼出5个关键风险因子,为产品迭代提供依据。期间应用Python进行数据清洗,使用Tableau生成20份可视化报告,将数据解读效率提升40%。提炼出“分层抽样+交叉验证”的模型优化方法论,适用于小样本量数据场景。二、实习内容及过程1实习目的去的地方主要是想看看真实环境里健康数据怎么玩,能不能把学校学的统计和编程用上点啥。想体验下从零到一搞个东西是啥感觉,顺便了解下行业里都在关心哪些事儿。2实习单位简介我去的这家公司做智能诊断相关的,主要是拿AI分析医学影像。团队不大,但挺拼的,天天加班加点调模型是常态。他们那套系统主要是做眼底照片的早期筛查,说是能帮基层医院减少人手压力。3实习内容与过程我来了之后先跟着师傅跑了一周流程,了解下数据从医院传过来是啥样。他们用的医院接口挺乱的,有的还用ftp,有的要填一堆表单。第一个任务就是整理这些数据,发现3000份眼底照片里居然有1200份是模糊的,还有一堆格式不对的。我就用Python写了个脚本,自动过滤这些,还顺便统计了不同医院上传的比例,最后生成了一份报告。师傅看了挺满意,说比我预想的靠谱多了。后来参与了个新项目,主要是做模型验证。他们最近在测试一个基于深度学习的算法,我在医院收集了500组样本,一半是正常眼底,一半是糖尿病视网膜病变早期。我先用ROC曲线看了下模型区分度,AUC值做到0.87,不算特别理想。后来发现样本里老年性黄斑变性的数据太少了,就又跑了几家医院补了200个样本,重新跑了一遍,最后AUC提升到了0.92。这个过程中我才知道啥叫过拟合,啥叫交叉验证,以前在学校做作业哪有这么多弯弯绕绕。4实习成果与收获最后那500个样本里,模型对非糖尿病性黄斑变性的识别率提高了15%,这让我挺意外的,毕竟这病在临床上挺难早期发现的。我还学会了怎么用kaggle上的公开数据练手,以前总觉得那些数据不靠谱,现在发现真是个宝库。最大的收获是明白了一件事:数据清洗比调模型更磨人,但做好了直接决定结果准不准。5问题与建议有个事儿挺烦的,他们那套内部系统太老了,跑个东西要等半小时,有时候想跑个实验得排队等俩小时。我提过用redis缓存点结果,但没人理我,说等版本更新。另一个是培训太少了,就给我发了三份内部文档,很多坑都是自己踩出来的。建议他们搞个新员工知识库,搞个每周技术分享会,哪怕每周就一小时。三、总结与体会1实习价值闭环这八周,从刚去时连医院HIS系统都不太熟,到现在能独立跑通一个眼底病变的模型验证流程,确实走了不少弯路。记得7月15号那天,为了调试一个数据接口花了整整一天,最后发现是个小数点问题,当时就觉得挺崩溃的。但第二天跟师傅沟通后,用Python写了个自动化测试脚本,后面再遇到类似问题就快多了。这种从无到有、不断试错再修正的过程,比单纯在学校做作业收获大多了。3000份数据的清洗、500组样本的标注复核,这些看似重复的工作,最后都成了我理解临床需求、掌握数据质量的基石。最让我觉得值的是,我参与优化的那个模型,在补充了200个老年黄斑变性样本后,AUC从0.87提升到0.92,虽然只是个实验数据,但想到这可能关系到将来医生的诊断效率,心里就觉得沉甸甸的。这让我明白,实习不是简单完成任务,而是真正把知识和现实场景结合起来,这种“学以致用”的感觉太棒了。2职业规划联结这次经历让我更确定未来想往健康数据分析方向发展了。以前觉得统计建模挺好玩的,但这次看到AI算法怎么一步步落地,从医院数据到模型部署,才觉得这事儿真有挑战性。8月20号的时候,我还主动跟导师聊了聊,计划下学期考个CPH证书,先把临床知识补上。另外,他们用的那个深度学习框架我也在自学,现在能跑通简单的UNet了,虽然离他们那水平还差得远,但至少入门了。感觉这次实习就像给我打开了一扇门,里面全是新东西,现在就是想一头扎进去多学点。3行业趋势展望在这儿我明显感觉到,现在医疗健康行业最火的就是AI+影像这块,但要说完全智能还差得远。8月15号那天,我们讨论一个新项目时发现,很多算法在胶片质量不好的情况下表现就特别差,这时候医生的经验反而更重要。这让我觉得,未来技术肯定要和临床紧密结合,不能光埋头做模型。另外,数据隐私这块也给我很大触动,他们系统里有个字段叫“患者知情同意状态”,每次导入数据前都要确认,现在各地政策又不一样,这事儿比想象中复杂多了。我觉得以后做健康数据,光懂技术不够,还得懂政策、懂临床,这可能是未来人才的关键竞争力。4心态转变最明显的变化是抗压能力。刚去那会儿,遇到点bug就想跑路,现在能连续几天对着屏幕调试,也不容易烦躁了。记得7月底有个模型效果突然下降,师傅让我分析原因,我硬是花了两天把数据管路、标注质量、甚至服务器负载都排查了一遍,最后发现是某个医院传来的标签错误比例超了15%。当时汇报的时候手心都出汗,但结束后师傅夸我能沉住气,这让我挺受鼓舞的。现在想想,职场跟学校不一样,没人会手把手教你,很多问题都得自己扛,这种成长挺快的。四、致谢1这8周在实习单位的经历,对我帮助特别大。谢谢导师在我刚来时带我熟悉环境,后来遇到问题也总能给我指条明路。还有那些一起工作的同事,虽然大家挺忙的,但碰到我卡壳的时候都会停下来帮忙看看,特别是那个负责后端接口的小哥,教了我不少Python调试技巧。没有他们的帮助,我可能没法按时完成那些数据清洗和模型验证的任务。2也要谢谢学校指导老师

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论