已阅读5页,还剩56页未读, 继续免费阅读
(机械电子工程专业论文)质谱信号数据的处理与光谱仪的设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 农药检测主要是使用色谱质谱仪来进行的,在精密的检测中使用的是大量 的国外设备,但是由于分析仪器处理软件价格昂贵、技术保密,现有分析软件 处理数据的效果远不及使用相同设备的国外专家得到的效果。因此对大量质谱 信号数据的后续处理,进而得到更为精确的结果就成了当前要解决的问题,本 课题旨在使用m a t l a b 的数据处理系统处理质谱数据。另外,光谱仪器在农 药检测方面发挥越来越重要的作用,当前国内主要都是引进国外昂贵的高档设 备,本课题为了在光谱仪国产化方面做一些工作,设计了简易光谱仪。 本课题设计了基于v c 平台的数据提取系统,实现了从设备文件数据到可 读应用数据的解析,从中提取出需要的质谱数据;同时使用m a t l a b 可视化 软件生成三维质谱图,针对质谱图进行图形信息提取和对质谱数据进行归一化 处理;在光谱仪设计中,搭建了基于t c d l 2 0 9 d 光电传感器为光电探测器,以 m a x 7 0 0 0 s 系列c p l d 和c 8 0 5 1 f 3 4 0 为核心控制系统,以u s b 为传输方式的光谱 仪系统平台,在h o s tp c 主机环境下,用l a b v i e w 软件设计通过配置n i - v i s a 实现u s b 与上位机通信。 通过验证表明,基于v c 和m a t l a b 的数据处理系统进行质谱数据处理是 可行的;光谱仪系统的设计方案,具有可行性。 关键词m a t l a b ;质谱;数据处理;光谱仪 a b s t r a c t a b s t r a c t t h ei n s t r u m e n t su s e df o rd e t e c t i n gp e s t i c i d er e s i d u ea r et h em a s ss p e c t r o g r a p h i na c c u r a t ed e t e c t i o n , m a n yi m p o r ti n s t r u m e n t sa r eu s e d ,b u tb e c a u s eo ft h ec o s t l y a n ds u r r e p t i t i o u sd a t ap r o c e s s i n gs o f t w a r e , t h er e s u l to f p r o c e s s i n gi sn o tf l sw a l la s 廿l a tp r o c e s s e db yt h eo v e r s e a ss p e c i a l i s t s t h e r e f o r e ,t h ep r o b l e mt h a tf a c e da n dt o b es o l v e di sh o wt op r o c e s sm a s ss p e c t r o m e t r i cd a t a ;o n ea i mo ft h ep a p e ri st o p r o c e s sm a s ss p e c t r o m e t r i cd a t au s i n gm a t l a bd a t ap r o c e s s i n gs o f t w a r e i nt h e m e a n t i m e ,s p e c t r o g r a p hh a sp l a y e dam o r ea n dm o r ei m p o r t a n tr o l ei nd e t e c t i n go f p e s t i c i d er e s i d u e i m p o r ts p e c t r o g r a p h sh a v et a k e nab i gm a r k e ts h a r e , b u t l e y 砒e e x p e n s i v ea n ds l a p u p i ti sa l w a y saw a s t eo f m o n e ya n dr e s o u r c e si na p p l i c a t i o n i n o r d e rt od o s o m e t h i n gf o rt h e l o c a l i z a t i o no fs p e c t r o g r a p h , as i m p l e - 加i n i s p e c t r o g r a p hh a sb e e nd e s i g n e d t h ep a p e rc o n t a i n st w op a r t s ,i nt h em a s ss p e c t r o m e t r i cd a t ap r o c e s s i n g ;a n a n a l y s i ss y s t e mf o rm a s ss p e c t r o m e t r i cd a t aw a sd e s i g n e db a s i n go nv cp l a t f o r m , m a k i n gt h ed a t as a v e di ni n s t r u m e n tf i l e st r a n s f e rt od a t ar e a d a b l ei n t or e a l i t y t h e d a t aa n a l y z e dt h e nw a sm a d ei n t o3 一dg r a p hu s i n gm a t l a b ,t h eg r a p ha n dt h e n w a sp r o c e s s e d ,s u c ha sg r a p he x t r a c t i o na n d q u a l i t a t i v ea n a l y s i s ;t h eo t h e rp a r ti st o d e s i g nas p e c t r o g r a p h , w h i c hu s e dt h et c d 12 0 9 da si t sp h o t od e v i c e ,m a x 7 0 0 0 s s e r i e sc p l da n dc 8 0 51f 3 4 0a si t sc e n t r a lc o n t r o l l e r s ,u s bp r o t o c o la si t s t r a n s m i s s i o nm o d e i nt h eh o s td e v i c e ,l a b v i e ww a su s e df o ru s bd i s p l a yv i a c o n f i g u r i n gn i v i s a t h em a s ss p e c t r o m e t r i cd a t ap r o c e s s i n gs o f t w a r es y s t e mb a s i n go nv ca n d m a t l a bi sf e a s i b l e ;t h ed e s i g no ft h es p e c t r o g r a p hi sf e a s i b l e k e yw o r d m a t l a b ;m a s ss p e c t r a ;d a t ap r o c e s s i n g ;s p e c t r o g r a p h i i i 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特, j j n 以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 ,一, 签名氇磷日期:掣_ 7 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名:一弛导师签名:互邂日期:掣 钙1 幸绪论 1 1 课题研究的意义 第1 章绪论 如今食品安全问题已经被国家提上日程,国务院也下达了文件加大农药残 留的检测力度。农药残留主要是通过质谱仪器来检测的,在精密的测量中使用 的是大量的国外设备,但是我们后续处理数据的却不及使用相同设备的国外专 家得到的效果。因此对大量分析仪器数据的后续处理,进而得到更为精确的结 果,以得到农药检测更为精确的结果,就成了当前要解决的问题;光谱仪器在 农药检测方面发挥了越来越重要的作用,而当前国内主要都是引进国外昂贵的 高档设备,体积大,并且价格昂贵,而生产中低档仪器的厂家很少。研制微型 光谱仪器,不仅能满足项目的需要,还能填补国内此类产品的紧缺。正是为了 解决大量分析数据的处理问题、满足项目需要和为光谱仪国产化作些工作,本 课题旨在使用m a t l a b 数据处理系统处理质谱信号数据,同时设计了微型光谱 仪。 1 1 1 分析数据处理软件的研究现状 分析仪器由软件和硬件两部分组成,软件在分析仪器中的作用己越来越重 要,单纯以硬件为基础的传统分析仪器已经很难满足科技创新的需要。我国分 析仪器的软件研发比较落后,如我国引进的某些分析仪器至今还采用几年甚至 十几年前的软件,虽然仪器的硬件设备还可以继续使用,但仪器的软件已经不 能满足仪器用户分析和处理数据的需要。对于那些不能满足要求的工作站软件, 有必要重新研究分析数据处理的方法。 仪器生成的数据其存储格式通常都是未公开的、保密的,不同种类、不同 厂商的仪器产生的数据文件其存储格式各不相同,某种仪器产生的数据文件往 往只有在仪器工作站软件上才能打开和使用,没有工作站软件,仪器产生的数 据就不能被识别,这在很大程度上限制了分析仪器的共享。随着我国知识产 权保护法的不断完善,分析仪器软件的价值也逐步得到体现,使用正版仪器软 件将是社会发展的趋势。为此,有必要开发具有自主知识产权的分析仪器数据 处理系统,以方便用户在没有工作站软件或工作站软件不能满足要求时分析和 处理仪器产生的数据,促进分析仪器资源的共享。 国外在质谱数据处理方面面的研究始于上世纪9 0 年代。例如c h e m s w 公司 开发了专门用于色谱和质谱数据处理c h r o m v i e w 软件,该软件能够打开多种不 北京t 业人学t 学硕i j 学位论文 同格式的色谱和质谱类仪器数据文件瞳1 。a c d l a b s 公司开发了a c d s p e cm a n a g e 软件,该软件能打开数十种色谱、质谱、核磁、红外等不同分析仪器产生的数 据文件,并能进行各种数据处理以及红外、核磁、质谱等谱库检索口1 。在这方 面做的最好的是美国热电公司,该公司已经开发出能打开一百多种不同格式分 析仪器数据文件的商用软件g i 洲s a i ,该软件可以对不同格式的分析仪器数据 进行处理以及谱库检索,包括红外、核磁、质谱等谱图数据的检索。但令人遗 憾的是,g c m sv i e w ,a c d s p e cm a n a g e r 和g r a ms h i 都是商业软件,价格昂 贵,实现技术也保密。 国内目前还没有见过关于通用质谱仪器数据处理系统研究的报道,文献上 报道的分析仪器数据处理系统通常都只支持一种或几种分析仪器数据格式。如 北京科技大学的陈海勇等人实现了对t v 5 - 2 2 0 0 红外热像仪图像数据格式的解 析,并在此基础之上开发了能直接打开和处理该仪器产生的图像数据文件的软 件。南京理工大学的董海波等人实现了对v e c t o r 3 2 型f t i r 光谱仪图像数据的 解析,并在此基础之上开发了能直接打开和处理该仪器产生的图像数据文件的 软件。中国农业大学的王一鸣等人开发了近红外光谱品质检测软件系统,该系 统支持三种红外光谱文件格式,分别是美国热电公司的s p c 格式、北京第二光 学仪器厂w q f - 4 0 0 n 型f ,r i r 光谱仪的a s f 格式以及日本j a s c o 公司f 1 i r 4 7 0 p l u s 型光谱仪的文本格式“1 。这种只针对某一具体仪器的应用情况而临时开 发的软件,随着仪器的不断更新,原有支持软件只好作废而重新开发,而目软 件没有标准通用的接口,无法在不同类型仪器这问共享数据和共享运算和管理 工作软件,低水平重复工作耗费了大量人力物力资源。 由于整个软件平台各个程序的关联部分都是分析仪器数据文件,并且在提 取色谱峰质谱图,以及实现的一系列分析算法都与数据文件密切相关。可以说 分析仪器数据文件是质谱数据分析处理的根基,因此数据文件格式的解析和后 续处理就显得至关重要。 1 1 2 光谱技术及光谱仪器发展的历史背景及趋势 光谱技术是现代获取物质信息的重要手段,己经广泛应用于航空航天、遥 感遥测、生物医学、环境生态、军事科技、以及日常生活和工业控制领域中。 光谱仪是光学仪器的重要组成部分,是用来研究物质特征光谱的仪器,所 谓特征光谱就是在光的作用下物质的分子或原子内部能级发生变化,产生反映 物质特性的光谱,利用这些光谱可以用来测定物质的组成和结构,对物质成分 进行定性和定量分析。光谱仪器主要有测量发射光谱的摄谱仪、光电直读光谱 仪:测量吸收光谱的紫外可见分,光光度计、红外分光光度计等。 弼1 辛绪论 光谱仪器是分析物质化学组成的重要分析仪器。自1 8 5 9 年制成了世界上第 一台结构完整的光谱仪器以来,光谱技术和仪器在全世界一直得到广泛重视和 迅速发展嵋1 。科学家们在研究中发现,各种物质在一定条件下都有自己的特征 光谱,从此建立了光谱分析的基础。很快,光谱分析便成了物理学、化学、生 物学和医学等学科中的重要手段。早期的光谱技术和仪器主要应用在天文学以 及对自然界的物质元素的发现上,证明了在地球以外星体上的物质和地球组成 物质一样,都是由相同化学元素组成的,从而为我们人类进一步探索太空中的 生命形式提供了坚实的理论基础。光谱仪器最早的成就是促使人们发现了许多 新的元素。从此以后,科学工作者对光谱分析方法愈来愈感兴趣,一方面他们 大量地系统地开展光谱实验研究工作:另一方面,他们为了应用的需要,不断地 改进光谱仪器。在二十世纪6 0 年代,光谱技术和光谱仪器得到了比较完善的发 展和应用,从各方面来讲,似乎都满足了当时的科技和产业发展的要求,从真 空到紫外,都建立了相当完善的光谱定性、定量分析方法以及整套光谱线图、 谱图,和与之相应的各波段光谱仪器。 目前所广泛使用的光谱仪虽然具有较高精度,但普遍存在体积大、价格昂 贵、安装调试困难、使用条件苛刻等不足。随着现代科学技术的飞速发展,许 多研究、应用领域对光谱仪器又提出了更高要求。特别是随着航天遥感遥测、 地质矿藏勘探、环境监测等众多研究、应用领域的发展,迫切需要一种小型化、 微型化、集成化、智能化、抗振动干扰能力强、性能稳定可靠、功耗小、电压 低、使用方便灵活、性能价格比高,且能快速、实时、直观地获取光谱信号的 微型光谱仪。 因此,研制一种既能在性能上满足应用要求,又能达到光谱仪器的小型化、 微型化、集成化目的的微型光谱仪便成了当前此领域中的一个新的研究热点, 也是目前光谱仪器发展的重要趋势之一。 1 1 3 小型化、现场应用的光谱仪的研究意义 光谱仪器主要是由三部分组成的:光源和照明系统、准直系统、色散( 分光) 系统以及接收、检测显示系统随1 。光谱仪器的具体结构如图1 - 1 所示,其中分 光系统是光谱仪器的核心部分,它是一个能够使复色光分解的系统,由狭缝、 准直镜、色散元件和成像物镜所组成。光源0 照明位于准直镜l 1 焦点上的入射 狭缝s 1 ,从狭缝上每一点射出的光经过准直镜后成为平行光,光束经过色散元 件产生色散,使不同波长的光以不同的角度分开,然后经过成像物镜l 2 ,将色 散后的光束分别聚焦于焦面f f 上,形成入射狭缝的一系列单色像s 1 ,s 2 ,s 3 。 这些按波长顺序排列的单色像总和就称为光谱。如果在成像焦面上放置出射狭 北京t 业人学t 学硕l j 学位论文 缝或摄谱底版、光电接收系统,便可进行记录,组成不同类型的光谱仪器盯1 。 图1 - 1 光谱仪器光学示意图 f i g 1 - 1o p t i c a ls t r u c t u r eo fs p e c t r o g r a p h 传统光谱仪的分光器件一般由棱镜或光栅等光学元件组成,在光谱的焦平 面上开一道狭缝让某一波长的光通过,利用步进电机驱动光栅,使得不同波长 的光依次通过狭缝,在狭缝后用光电探测器件将所接收的光能量转换成电能量, 通过对电信号的处理得到整个波段的光谱功率分布。整个系统的驱动扫描机构 复杂,而且每次只能测量单个波长的光谱能量,因此,测量时间较长,不能满 足现场、实时光谱测量的需要哺1 。 采用微型的光谱仪与传统的光谱仪相比,有很多优越之处,每次能测量很 多非连续或连续波段的光谱,并能读出各光谱的波长值和相对光谱能量值,而 且,由于不需要步进马达带动做机械扫描,所以光谱仪的体积大大减小,测量 时间的减少使得工作效率也大大得到了提高。虽然曾经作为光谱仪主要探测器 沿用了数十年的光电倍增管,具有很高的灵敏度和宽的光谱响应范围,但是单 个光电倍增管不具备多通道同时检测信号的能力,因而不能一次同时获得整个 光谱。而多通道探测器如电荷藕合器件c c d ( c h a r g ec o u p l e dd e v i c e ) ,自扫描 光电二极管阵s s p d ( s e l fs c a n n e dp h o t o d i o d ea r r a y ) 等线阵或者面阵的图像 传感器可以同时获得整个光谱,大大的提高了检测效率,如果再将计算机连到 i n t e r n e t 网络,还可以实现远程通信,远程控制,远程故障诊断和资源信息共 享。因此,多通道光谱仪正在拉曼光谱、激光光谱、激光医学、大气光学、海 洋光学、可调谐激光的研究中起着重要的作用,特别是用该光谱仪对水环境和 大气环境的污染以及其它恶劣工作条件环境进行遥感测量,这为无人检测提供 了一种新方法,从而大大的减少了测量人员和研究人员的危险性,进一步推动 环保事业和科学事业的发展。 4 筇1 幸绪论 1 2 本课题主要的研究工作 本课题的研究工作主要包括两个方面:质谱信号数据的处理和光谱仪的设 计。 在质谱信号数据处理这部分主要的研究工作如下: ( 1 ) 分析数据文件格式转换。 ( 2 ) 分析仪器数据格式解析。 ( 3 ) 从分析仪器数据文件中提取需要的质谱数据信息。 ( 4 ) 生成三维的质谱信息图,提取需要的谱图信息。 ( 5 ) 归一化处理。 光谱仪器的设计是结合现代光学仪器而进行的新型数据采集接口技术的研 究,涉及领域为c c d 技术、模数转换技术,c p l d 、单片机、u s b 接口等嵌入式 技术等。这部分的设计主要分为以下两个部分: ( 1 ) 系统的硬件设计:在光学系统的设计中,包括了光源供电系统设计、光栅以 及后端的c c d 器件;在电路设计中包括,光电转换电路、a d 转换和信号处理 电路、c p l d 时序驱动电路、单片机采集和u s b 接口电路。 ( 2 ) 系统的软件设计:软件部分的主要功能是提供c c d 光电器件驱动时序、提供 a d 转换芯片工作的时序以及主控单片机的存储与u s b 数据传输程序以完成各种 操作,同时进行u s b 底层驱动程序开发,m c u 通过u s b 与p c 机上的l a b v i e w 通 信程序。 筇2 章质常数据处理系统软f ,i 几汁 第2 章质谱数据处理系统软件设计 2 1 软件系统总体设计 气相色谱质谱联队仪器的工作原理是色谱法和质谱法的结合。色谱法是 利用混合物不同组分在固定相和流动相中分配系数( 或吸附系数、渗透性等) 的 差异,使不同组分在作相对运动的两相中进行反复分配,实现分离的分析方法。 质谱法是依据带电粒子在磁场或电场中的运动规律,按其质荷比( 质量和电荷的 比) 实现分离,测定离子质量数及其强度分布。 本课题要处理的数据是气相色谱质谱联动仪器自动保存的数据文件,这 些数据文件中存在着很多没有用的仪器生成的格式符,并且不能用常用的软件 打开,因此难以还原数据原本信息,现有的工作站不能满足分析要求,由于色 谱数据较质谱数据量少很多,现有的分析也很成熟,所以本课题主要针对质谱 数据进行分析。主要的任务流程图如图2 - 1 所示: ( ,开始、 l 丫 文件转换 j 打开文件 1 l r i 提取乒谱信息 1 l r 生成质谱图 1 i r 数据信息提取 1 l r l 数据归一化处理 上 r 结束、 图2 - 1 木e l u 数据处理流程图 f i g 2 1c h a r tf l o wo f * e l ud a t ap r o c e s s i n g - 7 - 北京t 业人学t 学硕i j 学位论文 本课题旨在以v c 和m a t l a b 为数据处理软件,进行质谱数据处理。因此本 课题的主要任务是将分析数据文件转换成可以用平时常用软件打开的文件,基 于v c 平台进行质谱信息数据的提取,使用m t a l a b 做出三维质谱图,并且基于 此平台针对质谱图进行信息提取和归一化等处理,为进行化合物的成分分析提 供基础。 分析仪器数据文件的存储格式通常是保密的,某种仪器产生的数据文件往 往只有在仪器工作站软件上才能打开和使用,离开了工作站软件就不能被识别, 这在很大程度上限制了仪器数据的共享与使用。想要增加一些复杂的数据处理 功能,或在没有工作站软件时分析处理仪器数据,就必须知道仪器的数据格式。 为此,许多国外的公司、企业和研究机构等都相继加入到分析仪器数据格式解 析和转换中来,并制定了分析仪器数据交换标准,将解析出来的文件格式转换 成标准格式,以达到在不同系统间共享数据的目的m 。美国热电公司开发的 g t l a m s a i 软件就是用这种方法来处理数据,该软件首先将不同格式的分析仪 器数据文件转换成某种标准,然后再对这种标准进行数据处理。然而,由于专 利和垄断等因素,该技术的实现是保密的。 所以在对数据进行分析前,首先要对文件进行格式转换,变成我们平时可 以阅读的文件;然后再对文件进行操作,提取出我们需要的数据信息,这就是 数据的解析;而后对数据进行生成质谱图、数据信息提取和归一化处理,为最 后就对这些数据进行化合物成分的分析作基础。 2 2 文件转换 每种仪器自动保存的数据格式不是统一的,很多格式是保密的,不能用平 时常用的阅读软件打开。而且仪器自动保存数据时往往产生大量不需要的格式 符。数据处理的第一步在于如何把国外的数据报告用我们常用的阅读软件打 开。略去不需要的格式字符,得到需要的数据格式,对数据格式进行分析、提 取出我们需要的数据,能够正确解析出数据是后续处理的基础和关键。只有获 得解析后的数据,后续的处理才能成为可能。 本课题需要处理的数据是仪器完成分析后自动保存在宰e l u 文件中的,通 过使用文件转换软件得到了我们可以用常用阅读软件打开的文本文件,并去略 去一些不需要的数据格式,还原了数据的存储格式。 木e l u 文件中的数据存储了以“n a m e ”为开头的成百甚至上千个数据块, 每个数据块对应着一个化合物的信息,在每个数据块中又分为三部分以组为单 位的数据存储,不同的数据组又分别描述了化合物的不同信息。 数据的基本结构如图2 2 所示: 8 筇2 幸匝带数据处砰系统软件设计 n a m e : o 二f i s c 4 1 9c n i 旧卜m o d n :1 5 5 ( 8 0 8 ) a m 3 5 0 4 p c 3 2s n l 0 l i 化合物的i li w d 4 0 i t a 0 7 i t r o 3 l f r 4 1 0 - 4 2 2 l r t 9 2 2 9 4 i m n 6 7 i r a 0 ;花否垂描述信息蠢0 0 0 1 7 6i s l 8 9 6 8 x n 2 3 1 9 3 m 0 1 :1 5 5 e w l - 0 i f g o 5 1 0 i t n l ;物对f ls 7 7 1 0 r 1 险i t o l 应数萝;化合物色l i - r e l 据信重谱峰信息l i 2 8 004 2 24 7 48 8 1 0 2 6 2 0 4 2 3 8 0 74 4 6 53 7 2 8 1 7 1 9 i 白;誊:i n u mp e a k s :】5 i 曼”j ll 化合物的 | ( 1 5 5 , 9 9 9 ) ( 1 7 0 , 5 7 7 ) ( 5 5 ,1 6 3 ) ( 1 0 5 ,1 7 7 ) ( 1 1 5 ,1 3 ) ( 11 9 ,8 l | 质谱信息ll6 ) ( 1 4 5 ,8 0 ) ( 1 5 3 ,2 3 6 ) ( 1 5 6 ,1 0 7 ) ( 1 7 7 ,8 9 ) ( 1 9 7 ,7 6 ) :;“, 图2 - 2 木e l u 数据的基本结构 f i g 2 - 2d a t as t r u c t u r eo ff i l e e l u 第一组数据由“i 符号为间隔的字符串组成,每个字符串对应化合物的一 个描述信息,如表2 - 1 所示。在这些字符串数据中主要提取三条数据信息存贮 于主数据库中,分别为s c l 4 9 0 :r t l 6 6 8 0 3 :m p t i c - m o d n :1 2 1 ( 9 7 8 ) 。对于字符 串s c l 4 9 0 ,此条信息记录了该组数据对应化合物的扫描数值,s c 只作为扫描时 识别代码,数字部分存储于数据库中,当计算机读取该数据组遇到字符s c 时, 便将其后面的数据存入到主数据库定义的地址中。r t l 6 6 8 0 3 代表该组数据所 对应化合物的保留时间,r t 部分起到识别代码的作用。m p t i c m o d n :1 2 1 ( 9 7 8 ) 为模型离子信息描述,m p 后的数据说明a m d i s 对于此条数据采用的m o d e l 离子 模式,1 2 1 代表m o d e l 离子的质量数。 表2 - i 木e l u 中部分数据的解释信息 t a b l e 2 - 1h l t e r p r e m f i o no fd a t ap a r t l yi n * e l u 字符串转译信息 s c 6 4 3 m p l 一m o d n :2 1 9 ( 9 6 5 ) p c 4 5 s n 8 1 w d = 4 0 t a1 3 f r 6 3 8 - 6 4 7 r t l 7 7 5 2 s c a nn u m b e r = 6 4 3 m o d e li o n = 2 1 9 ( 9 6 5 ) p u r l t y = 4 5 s n = 8 1 w i d t h = 4 0s c a n t a i l i n g = 1 3 r a n g e = 6 3 8 6 4 7 r e t e n t i o nt i m e1 7 7 5 2 北京t 业人学t 学颂i :学位论义 第二组数据是以r e 开头,其后为一系列的十进制的数字,对应化合物每个 数据采集点模型离子的响应值。这一组数据以r e 作为扫描识别代码,其后的数 据一并被存储到主数据库中,用于绘制对应化合物的色谱图。 第三组数据为化合物质谱图的数据信息,以括号为一个数据单元,分别描 述了碎片离子及其丰度数值,例如:( 5 6 ,9 9 9 ) ,其中5 6 代表质量数,9 9 9 代表 该离子的丰度。此组数据以n u mp e a k s 为识别代码,其后的数据一并被存储于 主数据库中用于后续质谱图的绘制。 在得到数据的存储格式后,要对所得到的数据格式进行解析,即分解出我 们所需要的数据。在本课题中,要做的就是解析出第三部分的数据,也就是质 谱数据信息。 2 3 数据解析 分析仪器数据格式解析是一项基础性研究工作,是为数据的再处理作铺 垫,在没有工作站软件或工作站软件不能满足要求的情况下,想要对分析仪器 产生的数据进行处理,就必须知道仪器的数据格式。分析仪器数据格式解析涉 及到的知识面包括分析化学、仪器科学和计算机科学等领域,在解析时并不需 要很深的理论推导,但需要理解数据产生的简单机理,合理的算法是解析成功 的关键。 所谓质谱数据,就是采用质谱仪器生成的数据。质谱,是一种分析方法, 原理就是让带电原子、分子或分子碎片按质荷比的大小顺序排列,打出相应的 谱线。 待分析的样品分子在离子源中离化成具有不同质量的单电行分子离子和碎 片离子,这些单电荷离子在加速电场中获得相同的动能并形成一束离子,进入 由电场和磁场组成的分析器中:其中离子束中速度较慢的离子通过电场后编转 大,速度快的偏转小;在磁场中离子发生角速度矢量相反的偏转,即速度慢的 离子依然偏转大,速度快的偏转小;当两个场的偏转作用彼此补偿时,它们的 轨道便相交于一点u 0 1 。 与此同时,在磁场中还能发生质量的分离,这样就使具有同一质荷比而速 度不同的离子聚焦在同一点上,不同质荷比的离子聚焦在不同的点上,其焦面 接近于平面,在此处用检测系统进行检测即可得到不同质荷比的谱线,即质谱。 质谱仪最重要的应用是分离同位素并测定它们的原子质量及相对丰度。测 定原子质量的精度超过化学测量方法,大约2 3 以上的原子的精确质量是用 质谱方法测定的。由于质量和能量的当量关系,由此可得到有关核结构与核结 合能的知识。对于可通过矿石中提取的放射性衰变产物元素的分析测量,可确 币2 干质浒数据处砰系统鞭什几! r 定矿石的地质年代。质谱方法还可用于有机化学分析,特别是微量杂质分析, 测量分子的分子量,为确定化合物的分子式和分子结构提供可靠的依据。由于 化合物有着像指纹一样的独特质谱,质谱仪在工业生产中也得到广泛应用。 一般的质谱数据包含离子质荷比信息和仪器观测到的强度信息,数据用二 维向量来表示就是( x ,y ) ,其中x 代表质量数,y 代表谱峰强度。x 分量反映 的是离子的电荷数,分量y 则反映了离子的丰度。有了这两个信息就可以对照 质谱库进行化合物质量的分析了,所以质谱法是化合物定量、定性的重要方法。 质谱数据通常用图的形式来表现,称为质谱图,即以质荷比为横坐标,强 度为纵坐标构成,每一个数据对应图上的一个峰。从质谱图上可以直观的观察 分子的质谱全貌。所以正确的从分析文件中解析出质谱信息对后续的化合物鉴 定有重要意义。 从图2 - 2 文件的结构图中可以看出,第三部分的数据都是以括号形式存储 的。括号中的第一项不是按照质量数的大4 , j 顸序排列的,同时质量数也缺失了 很多数据。按照项目要求我们需要实现的是把缺失的质量数补上( 从1 补到 5 0 0 ) ,并认为与之相对应的丰度值是o ,而且让全部质量数按顺序排列。在此 文件中,共有几百甚至上千段这样的质谱数据,我们需要把这几百甚至上千段 数据都按照以上要求,完成数据的提取、添加和排序,因为每段数据的扫描时 间点不同,如果以时间作为第三维数据信息,那么就可以得到三维质谱信息数 据。实现此部分功能的程序的流程图如图2 - 3 所示: 北京t 业人学t 学硕l j 学位论文 图2 - 3 数据解析流程图 f i g 2 3c h a r tf l o wo f d a t aa n a l y s i s 1 2 - 哪! 币质一数点处t 卫系统软什以汁 在实际的程序设计中,采用c 语言编写,以v c 为编译平台。c 语言在很多 方面应用广泛,具有完备的数据类型,可以方便的进行数据的各种操作,而且 使用于很多操作系统,具有良好的可移植性。在用c 语言实现数据解析的过程, 为了算法简化及修改方便,本设计分两部分来实现,第一部分实现质谱数据的 提取和排序,第二部分进行第三维数据的插入。 首先进行声明: # d e f i n ef a l s e0 # d e f i n et r u e1 # d e f i n en4 0 0 # d e f i n ep a r a n u m3 8 0 c h a r * n e w p a r a = 。n a m e ” t y p e d e fi n t ( * p a r r a y ) n 2 : 声明的主要作用是定义该文件可能含有的最大数据段数、开始每个数据段 的关键字符串、定义一个2 维的数组,用来存放提取出来的质量数和丰度信息。 课题中以存储3 8 0 段数据的文件为例,对其他文件可以根据实际情况可以在程 序中加以改动,就可以应用到新文件的解析中。 进行声明的定义后,打开数据文件,查找关键字“n a m e ,查找标志字符( , 取出( 的下一个字符,放在数组的第一行第一列,再取出接下来的字符,放 在数组的第一行第- - n ,继续寻找标志符( ,继续将取出的字符分别放入数 组的第二行第一列和第二行第- - n ,以此类推,直到查找结束。再继续寻找下 一个关键字“n a m e ,开始新的循环。当所有数据都放在数组中时,对每部分的 数组进行排序。 c 语言中排序的方法有很多,插入排序、快速排序、冒泡排序、归并排序 和二叉树排序,程序设计中,考虑到程序的稳定性和时间复杂度,最终选用的 是快速排序法。快速排序( q u i c ks o r t ) 是一种有效的排序算法。虽然算法 在最坏的情况下运行时间为0 ( n 2 ) ,但由于平均运行时间为0 ( n l g n ) ,并 且在内存使用、程序实现复杂性上表现优秀,尤其是对快速排序算法进行 随机化的可能,使得快速排序在一般情况下是最实用的排序方法之一。 本设计中采用c 标准库s t d l i b h 中提供的快速排序函数: q s o r t ( ( v o id 宰) ( * a r r a y b ) 1 ,( s iz e t ) ( * a r r a y b ) 0 0 , s i z e o f ( i n t ) 木2 ,c o m p a r e ) : 具体参数如下: * b a s e :待排序的元素( 数组,下标0 起) 。 n u m : 元素的数量。 w i d t h :每个元素的内存空间大小( 以字节为单位) ,可用s i z e o f 0 算得。 北京t 业人学t 学坝1 j 学位论义 在调用q s o r t 时要首先定义c o m p a r e 函数: i n tc o m p a r e ( c o n s tv o i d * a r g l ,c o n s tv o i d * a r 9 2 ) r e t u r n 木( i n t * ) a r g l 一,l c ( i n t * ) a r 9 2 : 具体用法如下:首先定义一个比较函数,* a r g l ,* a r 9 2 指向待比较的 数据。返回值是i n t 类型,其值取决于a r g l 与a r 9 2 的相对位置。a r g l 在 a r 9 2 右侧返回正数,a r g l 在a r 9 2 左侧返回负数。控制返回值可以确定升 序降序。如果a r g l 比a r 9 2 大,并且返回正值,则就是升序排序,本设 计中采用的就是升序排序。 经过排序后,质量数按从小到大的关系排列。此时质谱数据的存在格式如 图2 4 所示: d a t a1 5 1 ,1 5 6 5 2 ,2 5 3 5 3 ,5 6 0 5 4 ,3 8 9 5 5 ,5 8 7 5 7 ,3 2 8 5 8 ,1 9 8 5 9 4 4 6 0 , 2 9 6 1 , 2 5 d a t a3 8 0 图2 - 4 二维质谱数据 f i g 2 _ 42 一dm 鹪ss p c c f f o m e c d cd a m 上图是将质量数和丰度提取出来,按列保存在文件中的3 8 0 段质谱数据。 在完成排序后,就要将质量数中缺少的数值插入到质量数的序列中,与之对应 的丰度值设为0 。调整插入过程中,一定要保证的就是原来存在的质量数对应 的丰度值不能够变化,也就是说,在调整质量数的过程中,与质量数相对应的 丰度值也要同质量数一起变动。 要插入的第三维信息是时间信息,因为文件中保存的数据就是每个扫描时 间点仪器记录的数据,每段时间内数据对应的时间值都是相同的,为了作图便 利,把时间量进行归一化,以时间段的序号作为该段数据第三维的时间值。插 入数据部分的流程图如图2 - 5 所示: 第2 辛质讲数据处卯系统软什设计 图2 - 5 数据插入输出流程图 f i g 2 - 5c h a r tf l o w o fd a t ai i 塔e r ta n do u t p u t 在以上流程图中,a t x t 是执行完数据解析后提取出的质谱数据信息保存 的文件,其中存放的是如图2 - 4 的二维质谱数据文件,b t x t 是就是将提取出 的质谱信息进行数据插入、排序后的写入的三维质谱数据信息文件。 数据以分列输出的形式保存在文本文件中,这样是为了便于使用作图软件 读取文本文件,并且做出我们需要的三维图形。提取出来的信息中,质量数、 丰度和时间信息构成了图形的三维信息。经过数据输出后的文件保存格式如图 2 6 所示: 北京t 业人学t 学硕l j 学位论文 d a t a1 1 ,0 , 1 2 ,0 , i 3 ,0 , 1 4 ,0 , 1 5 ,0 , 1 6 ,0 , 1 7 ,0 , i 8 ,0 , 1 9 ,0 , 1 1 0 ,0 , 1 1 1 ,0 , 1 d a t a3 8 0 : : 图2 - 6 三维质谱数据 f i g 2 - 63 - dm a s ss p e c t r o m e t r i cd a t a 2 4 生成质谱图 2 4 1 数据绘图及处理软件选择 目前应用的作图软件很多,本课题在选择作图软件时也曾经做过多次尝试, 试用过l a b v i e w 、o r i g i n 和m a t l a b 。 l a b v i e w 是美国国家仪器公司( n a t i o n a li n s t r u m e n t s ,n i ) 推出的虚拟 仪器,其优点是图形化编程,使用户从烦琐的程序设计中解放出来,l a b v i e w 更多的是面向硬件平台,对于本课题中的数据,可以读取,但是对于做出3 8 0 个数据点的图形还有很多困难;o r i g i n 是o r i g i n l a b 公司推出的流行的专业 函数绘图软件,可以满足函数拟合、高级数据分析的需要。使用o r i g i n 就像使用e x c e l 、w o r d 一样简单,但是o r i g i n 自身程序编制略显不便, 对于本课题中的数据也不能满足一次读取生成图形的要求。在使用m a t l a b 时,最终选定了m a t l a b 作为质谱数据处理系统的软件。 现在很多领域都使用m a t l a b 工具软件,m a t l a b 是美国m a t h w o r k s 公司出 品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高 级技术计算语言和交互式环境。m a t l a b 是矩阵实验室( m a t r i xl a b o r a t o r y ) 珥:辛质泖致据处邢系统5 = = 什设汁 的简称,和m a t h e m a t i c a 、m a p l e 并称为三大数学软件。它在数学类科技应用软 件中在数值计算方面首屈一指。m a t l a b 可以进行矩阵运算、绘制函数和数据、 实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、 控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领 域。 与其他软件相比,m a t l a b 的优势有如下几点: ( 1 ) 友好的工作平台和编程环境 m a t l a b 由一系列工具组成。这些工具方便用户使用m a t l a b 的函数和 文件,其中许多工具采用的是图形用户界面。 ( 2 ) 简单易用的程序语言 m a t l a b 一个高级的矩阵阵列语言,它包含控制语句、函数、数据结 构、输入和输出和面向对象编程特点。用户可以在命令窗口中将输入语句 与执行命令同步,也可以先编写好一个较大的复杂的应用程序( m 文件) 后再一起运行。新版本的m a t l a b 语言是基于最为流行的c + + 语言基础上 的,因此语法特征与c + + 语言极为相似,而且更加简单,更加符合科技 人员对数学表达式的书写格式。 ( 3 ) 强大的科学计算机数据处理能力 m a t l a b 的这些函数集包括从最简单最基本的函数到诸如矩阵,特征向 量、快速傅立叶变换的复杂函数。函数所能解决的问题其大致包括矩阵运 算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、 傅立叶变换和数据的统计分析、工程中的优化问题。 ( 4 ) 出色的图形处理功能 m a t l a b 自产生之日起就具有方便的数据可视化功能,以将向量和矩 阵用图形表现出来,并且可以对图形进行标注和打印。高层次的作图包括 二维和三维的可视化、图象处理、动画和表达式作图。可用于科学计算和 工程绘图。 ( 5 ) 应用广泛的模块集合工具箱 目前,m a t l a b 已经把工具箱延伸到了科学研究和工程应用的诸多领 域,诸如数据采集、数据库接口、概率统计、样条拟合、优化算法、偏微 分方程求解、神经网络、小波分析、信号处理、图像处理、非线性控制设 计、嵌入式系统开发等方面。 基于m a t l a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 5月证券从业资格考试《投资分析》试题
- 《2025年税务师考试涉税服务实务真题及解析》
- 习题系统训练公务员考试国考笔试考题350题含答案
- 全国职业能力测评《电子商务师》考试题
- 2025年广东省惠州市保安员理论考试题库及答案
- 妇幼保健学出生缺陷预防真题及答案
- 2025年广东申论真题(乡镇卷)及答案
- 2025年安全生产风险辨识与管理培训考核卷
- 1、有限空间考试试卷-答案
- 一级计算机练习题计算机基础知识分类-1
- 普通高中英语课程标准(2020版vs2025日常修订版)核心变化对照表
- 桥架安装施工方案设计规范要求
- 2025辽宁朝阳市公安机关招聘警务辅助人员301人笔试考试备考试题及答案解析
- 三级安全教育旋挖钻机试题及答案
- 《小学生鲁迅读本》
- 开票税点自动计算器
- 作业中断管理规定
- GB/T 23261-2009石材用建筑密封胶
- 活动项目执行流程图经典
- 免费求职简历模板下载word格式
- 制造业企业各部门职能职责分工案例
评论
0/150
提交评论