




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、药物分析信息学 及 基于大数据技术的药物分析,大数据时代:,背景,随着计算、存储资源的容量、速度、智能化程度的迅速提高和价格的大幅下降,以及物联网、移动互联网、云计算等技术的迅速发展和大规模应用,数据量出现了爆发式增长。,特点,数据容量(Volume)大、数据产生速度(Velocity)快和数据 多样性(Variety)高,制药行业数据的不断积累和生命科学及健康领域数据的蓬勃发展!,大数据技术:,定义,一代全新的数据科学领域的技术架构或模式,对数据量大、类型复杂、需要即时处理和提纯的各类数据,综合运用新的数据感知、采集、存储、处理、分析和可视化等技术,提取数据价值,从数据中获得对自然界和人类社
2、会规律深刻全面的知识和洞察力。 大数据技术涉及到数据的感知、采集、存储、处理(管理)、分析、可视化呈现等诸多环节,各环节采用的技术手段也层出不穷。,药物分析信息学 研究对象:药物复杂体系 方法:化学计量学和统计学,对分析仪器提供的 信息进行变换、解析、挖掘、分类 目的:对复杂体系定性定量分析,化学计量学:chemometrics 产生:1974年,由美国的BRKowalski和瑞典的SWold等发起,在美国华盛顿大学成立了国际化学计量学学会 背景:数据处理与信息提取和计算机科学的发展 概念:应用数学、统计学与计算机科学的方法, 来设计或选择最优的化学实验方法,并从测量数据 中最大限度地获取化学
3、及相关信息。,化学计量学:chemometrics 基本内容,目录,最新应用,智能型分析仪器,信息解析与挖掘,快速、简便、经济,光谱分析法(一维数据),在每个检测波长(或波数)处可得到一个响应值,这样的数据又称矢量型数据。,光谱分析法(一维数据),常用的数据处理方法,偏最小二乘法(PLS):已被用作近红外光谱仪的定量分析方法,应用于原料药分析 和复方制剂分析 缺点:PLS要求体系组成已知,而且各组分的信号应具有加和性,这些限制使得PLS只适用于组分已知且含量与信号响应值符合线性的体系。,混合线性分析法(HLA):该法结合了多种多元校正方法的优势,其结果优于PLS法。由于其只需要已知待测组分的纯
4、色谱峰及其在校正谱中的浓度,因此还被用于某些含未知干扰组分的体系的分析。,光谱分析法(一维数据),数学修饰方法数学探针法,数学探针法通过对复杂混合物体系的光谱进行 “原位”数学修饰,“创造”背景干扰的最大吸收点,从 而可以“创造”背景干扰被消除的条件。 具体原理为:在合适的波长位置,向待测混合体系的光谱中添 加“数学探针”(如高斯函数等),可随意改变和调动 可能的背景干扰,从而使干扰在指定位置成峰,产生 极大值;然后通过求导消除干扰,并求出待测组分的 含量。本课题组曾采用数学探针法测定了安钠咖注 射液中苯甲酸钠和咖啡因的含量,通过考查数学探 针的峰高、峰位和半峰宽与结果的关系,确定数学探 针的
5、参数值,并将由此探针产生的“新化合物”仿真 添加在待测液中,从而使待测组分的紫外光谱图出 现了“吸收峰”,即得到了“数学修饰”,然后在修饰得 到的“吸收峰”处求导就可将干扰组分的影响去除, 从而可对待测组分进行含量测定。数学探针法通过 “仿真”地向待测体系中添加“新化合物”(数学探 针),以“创造”干扰被消除的条件,从而可以对复杂 体系中感兴趣的组分直接定量。“数学探针法”及化 学信息修饰思想的提出,为复杂体系的快速分析提 供了一种全新途径。,兼具色谱良好的分离特性和光谱灵敏的定性功能,从色谱、光谱两个角度提供与物质性质密切相关的大量信息,色谱分析法(二维数据),在每一个保留时间点上都对应着一
6、条光谱,而在每个检测波长处都得到一条色谱,这样的数据又称“二维”数据或矩阵型数据。,兼具色谱良好的分离特性和光谱灵敏的定性功能,从色谱、光谱两个角度提供与物质性质密切相关的大量信息,色谱分析法(二维数据),在每一个保留时间点上都对应着一条光谱,而在每个检测波长处都得到一条色谱,这样的数据又称“二维”数据或矩阵型数据。,1.小波变换近红外光谱仪,肺癌患者 危重症病人,慢性呼吸疾病导致生活不能自理的病人,无人照料 老人,01,02,03,:主要针对中老年患者,1.小波变换近红外光谱仪,肺癌患者 危重症病人,慢性呼吸疾病导致生活不能自理的病人,无人照料 老人,01,02,03,:主要针对中老年患者,
7、1.小波变换近红外光谱仪,肺癌患者 危重症病人,慢性呼吸疾病导致生活不能自理的病人,无人照料 老人,01,02,03,:主要针对中老年患者,主要应用于复方制剂、中药成分分析、代谢组学、中药打假,01,在代谢组学中的应用,代谢组学:代谢组学是对某一生物或细胞,在一特定生理时期内所有低分子量代谢产物,同时进行定性和定量分析的一门新学科。它是以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标的系统生物学的一个分支。,01,在代谢组学中的应用,NMR、LC-MS、GC-MS,获得的数据非常复杂,数据处理,原始数据前处理,信息挖掘,降维,揭示出反映样品内在机理的、整体性差异的
8、关键性生物标记物,目的,01,在代谢组学中的应用,李晶:代谢组学研究中数据处理新方法的应用,用稳健主成分分析(PCA)进行离群样品点的诊断,三种数据预处理方法的应用,会明显改善代谢组学生物信息学分析中聚类分析的结果和生物标志物识别的准确性及全面性,用变量的类内差异和类间差异的比较,来判断非保守性代谢组分,用尺度同一化的方法进行数据预处理来消除数据的尺度差异,01,在代谢组学中的应用,冒海蕾:正交信号校正在正常成人血清,H NMR谱的代谢组分析中的滤噪作用评价,采用OSC滤噪后,PLSDA能够完全区分不同性别的血清氢谱,其判别能力优于PCA和SIMCA。,研究了正交信号校正(OSC)在78例正常
9、成人血清1 HNMR谱的代谢组分析中的滤噪作用,分别采用主成分分析、偏最小二乘法判别分析(PLS-DA)及簇类的独立软模式法(SIMCA)对氢谱进行模式识别分析,01,在代谢组学中的应用,沈朋:乳腺癌代谢物组模式特征发现方法及HPLCMSMS分析,留一法交叉验证和独立验证结果均表明,该模型预测准确率达到90以上。,提出一种基于单独最优特征组合和BP神经网络的代谢物组模式特征发现方法,并用其寻找到尿样中与乳腺癌最为相关的4种核苷,将这4种核苷作为输入变量,用BP神经网络建立了乳腺癌诊断模型。,在中药掺伪鉴别中的应用,基于待检中药与怀疑掺化学药物的一维红外光谱,不经提取分离,无需建立模型的两种分析
10、方法,02,局部直线筛选法,基于对原始光谱特征的认知,即原始光谱上任意连续3点组成的形状可能为凸曲线、近直线和凹曲线,它们的直线回归系数的绝对值分别为o99或0991。化学药物的掺入显然会改变这些局部谱段原有的形状。沿着这个思路,对局部直线谱段进行差减,从而预测其中化学药物的掺杂量。由大量样品验证,该法的检测限可达到01。 采用该法对15个不同种类的中药样品进行了分析,结果只漏判了一个样品。,在中药掺伪鉴别中的应用,02,褶合差谱分析法,基于对原始光谱的褶合变换,提取3点窗口下的二次正交多项式系数作为解析对象。通过对纯中药光谱以及化学药物光谱的考察,发现两者在3点窗口下经褶合变换得到的二次项系数,存在至少一个甚至几个数量级的差别,因此当掺伪中药光谱的二次项系数抽提至最小时,对应的含量因子即代表真
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 弹簧研发助理岗位面试问题及答案
- 餐饮储备干部岗位面试问题及答案
- 江苏省宿迁市宿迁中学2025届化学高一下期末学业质量监测模拟试题含解析
- 大连育明中学2025年化学高一下期末统考试题含解析
- 河南省南阳市第三高级中学校2025年高二下化学期末监测试题含解析
- 河北省衡水市深州贾城西中学2025届高一化学第二学期期末复习检测试题含解析
- 国企采购成本管理办法
- 国农以工代赈管理办法
- 河南永州河道管理办法
- 河堤流动摊贩管理办法
- 人民调解文书规范制作
- 教育督导考试试题及答案
- 红十字救护员培训
- 肩颈腰椎护理
- 2025-2030中国手工皂行业市场发展趋势与前景展望战略研究报告
- 眼科医院感染制度与规程
- 透析病人营养不良的护理
- T-CPUMT 025-2024 工业互联网平台 服务通.用要求
- 2025年度地质勘探监理服务合同范本
- 2025年上半年北京市西城区教委事业单位公开招聘考试笔试易考易错模拟试题(共500题)试卷后附参考答案
- RoHS知识培训课件
评论
0/150
提交评论