(环境工程专业论文)因子分析和化学质量平衡模型在大气颗粒物来源解析的联合应用研究.pdf_第1页
(环境工程专业论文)因子分析和化学质量平衡模型在大气颗粒物来源解析的联合应用研究.pdf_第2页
(环境工程专业论文)因子分析和化学质量平衡模型在大气颗粒物来源解析的联合应用研究.pdf_第3页
(环境工程专业论文)因子分析和化学质量平衡模型在大气颗粒物来源解析的联合应用研究.pdf_第4页
(环境工程专业论文)因子分析和化学质量平衡模型在大气颗粒物来源解析的联合应用研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(环境工程专业论文)因子分析和化学质量平衡模型在大气颗粒物来源解析的联合应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ab s t r a c t ab s t r a c t wi t h t h e d e v e l o p m e n t o f t h e a i r s o u r c e a p p o i n t m e n t , s e v e r a l r e c e p t o r m o d e l s h a v e b e e n d e v e l o p e d . t h e s e r e c e p t o r m o d e l s i n c l u d e t w o t y p e s r e c e p t o r m o d e l s m a i n l y : s o u r ce k n o w n t y p e ( s u 比 a s c h e m i c a l m a s s b a l a n ce m o d e l ) ; s o u r ce u n k n o w n t y p e ( s u c h a s p r i n c i p a l c o m p o n e n t a n a l y s i s / m u l t i p l e l i n e a r r e g r e s s i o n m o d e l a n d p o s i t i v e m a t r i x f a ct o r i z a t i o n m o d e l ) . e a c h o f t h e r e c e p to r m o d e l s u s e d h a s i t s o w n s e t o f a d v a n t a g e s a n d d is a d v a n t a g e s w h e n u s e d i n d i v id u a l l y . f o r s o u r ce u n k n o w n t y p e r e c e p t o r m o d e l , t h e i n f o r m a t i o n o f t h e s o u r ces i s n o t n e e d e d . t h e t y p e s a n d n u m b e r c a n b e e x t r a ct e d , 勿 a n a l y s i s t h e d a t a s e t . h o w e v e r , p c a - ml r a n d p mf m a y c o n c l u d e t h a t a l l s o u r ces h a v e b e e n i d e n t i fi e d wh e n i n f a c t s o me s o u r ces h a v e n o t b e e n e x t r a c t e d . f o r s o u r ce k n o w n t y p e r e c e p t o r m o d e l , t h e s o u r ce p r o f i l e s a n d n u m b e r s h o u l d b e u s e d f o r f i tt i n g . i n a d d i t i o n , c m b m a y m i s s p e c i f y s o u r ce s o r e x h i b i t c o l l i n e a r i t y p r o b l e m s . wh a t s m o r e , f o r o n e s e t o f s o u r ce a n d r e cep t o r p r o fi l e s , c mb m o d e l m a y g e t s e v e r a l r e s u l t s . s o , c h o o s i n g t h e b e s t r e s u l t i s a n o t h e r p r o b l e m . i n t h i s s t u d y , t h e s e r e c e p t o r s w e r e c o m b i n e d u s e d f o r s o u r ce a p p o i n t m e n t , a s f o l l o w i n g : f i r s t l y , t h e p c a w a s c o m b i n e d w i t h o t h e r m u l t i v a r i a t e s t a t i s t ic s m e t h o d s , f o r i d e n t i f y i n g t h e s o u r ce t y p e s o f t h e a m b i e n t s a m p l e s . n e x t , a s y n t h e t i c d a t a s e t w a s u s e d f i r s t t o e v a l u a t e t h e a c c u r a c y o f t h e r e cep t o r m o d e l s f o r s o u r ce a p p o r t i o n m e n t ( p c a m o d e l , p mf m o d e l a n d c mb m o d e l ) . f i n a l l y , t h e s e r e c e p t o r m o d e l s w e r e u s e d t o s t u d y t h e a m b i e n t s a m p l e s fr o m z h e n g z h o u . a f t e r a n a l y z e , th e s o u r c e c o n t r i b u t i o n s t o z h e n g h o u p mt o s a m p l e s w e r e c a l n i t a t e a . k e y wo r d s : f a ct o r a n a l y s i s , p r i n c i p a l m o d e l , p o s i t i v e m a t r i x f a ct o r i z a t io n s t a t i s t i c s m e t h o d s , s y n t h e t i c d a t a s e t c o m p o n e n t a n a l y s i s / m u l t i p l e l i n e a r r e g r e s s i o n m o d e l , c h e m i c a l m a s s b a l a n ce, mu l t i v a r i a t e 1 1 专业名词说明 专业名词说明 c h e m ic a l m a s s b a l a n ce m o d e l ( c mb ) :化学质量平衡模型 c o e f f i c i e n t o f d i v e r g e n c e ( c d ) :分歧系数 d i a g n o s t i c r a t i o s :元素比 值法 f a c t o r a n a l y s i s :因 子 分 析 h i e r a r c h ic a l c lu s t e r i n g a n a 妙 s i s ( h c a ) :等 级聚类分 析 m a s s f r a c t i o n d i a g r a m :质 量百 分对角图 m u l ti v a r i a t e s t a t i s t i c s m e t h o d . 二 多样统计学方法 p o s it i v e m a t r ix f a c to r iz a ti o n m o d e l ( p m 研:矩阵正 值因子 化分 解模型 p r i n c ip a l c o m p o n e n t a n a ly s is - m u l t i p l e li n e a r r e g r e s s i o n m o d e l ( p c a - mf . r ) :主成分分析 一多元线性回归模型 r e c e p t o r m o d e l :受体模型 s o u r ce a p p o i n t m e n t :源解析 s o u r c e ( m o w n t y p e re c e p t o r m o d e l :已 知源 受 体 模型 s o u rc e u n kn o w n t y p e re c e p t o r m o d e l :未知 源 受 体 模 型 s o u rc e p rof i l e :源成分谱 s v n t h e t i c d a t a s e t :模拟数据 南开大学学位论文版权使用授权书 本人完全了 解南开大学关于收集、保存、使用学位论文的 规定, 同意如下各项内容:按照学校要求提交学位论文的印 刷本和电子版 本;学校有权保存学位论文的印 刷本和电 子版, 并采用影印、 缩印、 扫描、 数字化或其它手段保存论文; 学校有权提供目 录检索以 及提供 本学位论文全文或者部分的阅览服务; 学校有权按有关规定向国家有 关部门或者机构送交论文的复印 件和电子版; 在不以赢利为目 的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学 位 论 文 作 者 签 名 : 丈 习 良 z -u7 年 月 雌 日 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: 史 园 炙 解密时间: 年月日 各密级的最长保密年限及书写格式规定如下: 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作 所取得的成果。除文中已 经注明引用的内容外, 本学位论文的研究成果不包含 任何他人创作的、已 公开发表或者没有公开发表的作品的内 容。对本论文所涉 及的研究工作做出贡献的其他个人和集体,均己在文中以明 确方式标明。 本学 位论文原创性声明的法律责任由 本人承担。 学 位 论 文 作 者 签 名 : 史 f 良 加 门年s月2 气 日 第一章引言 第一章引言 第一节选题背景 1 . 1 . 1 大气颖粒源解析技术的产生与发展 源 解析 技术( s o u r c e a p p o in t m e n t ) , 是 指 对 大 气颗粒 物的 来 源进 行定 性 或定 量研究的 技 术【 1 -3 1 . 其 发 展是与以 排放量为 基础的 扩散 模型( d i ff u s i o n m o d e l ) . 扩散模型可以很好的建立起有组织排放的烟尘源和工业粉尘源与大气环境质量 之间的定量关系,从而为治理有组织排放源提供了科学依据。应用扩散模型需 要跟踪污染物从源排放到受体所经历的主要迁移转化过程,包括:大气扩散、 干湿沉降、生物降解、气固液三相分离等。而这些过程与排放条件、地理地形、 气象及物质本身性质密切相关。但是扩散模型无法应用于源强难于确定的源类 如开放源等。因 此, 随 着源解析技术的 发展, 现在又出 现了 受体模型 ( r e c e p t o r m o d e l ) 技 术。 受体模型是通过受体和污染源样品的化学和显微分析来确定污染源对受体 的贡献值。其不需要知道源强,不依赖于气象资料,解决了扩散模型难于解决 的问题,因此, 受体 模型自7 0 年代问 世以 后, 得到了 迅速的发展,已 形成了大 气颗粒物源解析研究体系。 受体模型的 种类很多, 但主要分为两大类,一类受体模型需要知道源的信 息( s o u r c e s k n o w n ) , 另 一 类受体 模型不需 要知道 源的 信息( s o u r c e s u n k n o w n ) 14 1 e 前者主要有化学质量平衡法 ( c m b ) ,偏最小二乘法 ( p i s ) 等;后者主要有主 成分分析一多元线形回归法 ( p c a -ml r ) ,目 标转化因子分析法 ( ttf a) . u n mi x , p m f 等. 其中,c m b模型是美国e p a现行使用的模型, 而u n m i x 和p m f 模型是两种较新发展的模型【 气 1 . 1 . 2 不同类型大气源解析模型的特点 由 上面内容可知, 大气颗粒物源解析受体模型主要分成两个大类,前者需 要知道源的信息, 称为己知源受体模型 ( s o u r c e s k n o w n ) ;后者不需要知道源的 信息, 称为未知源受体模型 ( s o u r c e s u n k n o w n ) . 第一章引言 这两种源解析受体模型有各自的特点,同时两者也有各自的优点和缺点。 1 . 1 . 2 . 1 已知源受体模型 ( s o u r c e s k n o w n )的优缺点 对于己知源受体模型( s o u r c e s k n o w n ) 来说, 它需要事先知道污染源的信息。 这包括所调查区域污染源的种类、主要污染源源类的数量、主要污染源源成分 谱的信息等等。然后将这些信息和受体信息同时纳入受体模型进行拟合计算, 最终得到结果。通常污染源的信息是通过对检测调查区域进行现场调查和对当 地的污染物排放清单进行研究,得到污染源的详细信息。因此,对于已知源受 体模型来说,因为它很清楚的知道源的信息 ( 如果得到的源的信息准确) ,通常 得到的拟合计算结果比较准确。然而,如果得到的源的信息不准确 ( 比如纳入 模型的主要污染源的类型不对,或测量到的源成分谱不准确) ,那么最终模型拟 合得到的结果就会有较大的误差。另外, 对于化学质量平衡法 ( c mb )模型来 说,它还有着结果的不确定性。即对于一套源和受体的信息,会得到多样的结 果,而最终对最优结果的选择,也是需要进行一系列复杂的比较工作。而且, 如果所纳入模型的源成分谱之间有共线性存在的话,c mb模型通常也不能通过 直 接 计 算 得 到 理 想的 结 果 5 1 1 . 1 . 2 . 2 未知源受体模型 ( s o u r c e s u n k n o w n )的优缺点 对于未知源受体模型( s o u r c e s u n k n o w n ) 来说, 它不需要预先知道污染源的 信息。比如对因子分析来说,它从受体出 发,通过对受体的数据进行主成分分 析,可以 分析出主要的污染源。通常因子分析计算得到的源解析结果相对比较 单一 ( 主要污染源贡献值的大小排序相对比较固定) ,这可以为已知源受体模型 ( 如 c m b模型)的结果提供参考。 然而,未知源受体模型如 p c a -ml r( 因 子分析的 一种)也有其自 身局限 性, 它需要大量的数据 ( 通常要大于3 0 -5 0 个 样品) ,样品越多越稳定。如果样品量较少,则不能充分提取出污染源的类型。 另外, 对于未知源受体模型来说,通过数学计算所提取出的污染源的信息 ( 如 污染源的种类和源成分谱)还必须符合现实的物理意义,如果没有符合现实中 的 物 理 意 义, 那 么结 果很 难被 接受 5 k 1 . 1 . 2 . 3 两类受休模型的联合应用 因此,将已知源受体模型 ( 本研究以化学质量平衡模型为主) 和未知源受 体模型 ( 本研究以基于因子分析原理的p c a -ml r模型和p m f模型为主)相 第一章引言 结合, 通过因子分析定义出 一些主要的源类, 为c m b的源类识别提供信息, 并 且先通过用因子分析模型进行一定程度的定量解析, 为c mb模型的进一步进行 精确解析提供了比较依据。 第一章引言 第二节 研究的目的和意义 本研究针对未知源受体模型和已知源受体模型这两类污染源受体模型各自 的缺点和不足之处,利用各自的优点为之服务。 对于每一种受体模型而言, 在进行源解析处理时,都会表现它的优点或缺 点。而不同类型的 受体模型的优缺点不同。 本文正是通过利用一种类型的受体 模型的 优点,来弥补另一种类型的受体模型的 缺点. 将不同受体模型联合应用, 分析得到最优解析结果,具有一定创新性和重要意义。 第一章引言 第三节 研究的内容与方法 ( 1 )学习各种统计学方法和各种受体模型的原理。 ( 2 ) 运用各种统计学方法和其他分析方法对不同城市的受体样品数据进行分 析,初步尝试研究主要污染源的判断和确定。 ( 3 ) 创造模拟数据,运用不同受体模型进行解析。比 较拟合的结果与预先模拟 数据的结果之间的差异性,判断拟合结果的准确度。 ( 4 ) 用不同的受体模型对实测样品数据进行来源解析,综合比较不同受体模型 的拟合结果,得出最优的源解析结果。 第一章引言 1 . 5 研究的技术路线 ( 1 ) 运用各种统计学方法和其他分析方法定性判断大气污染物的主要污染源。 ( 2 ) 运用多种受体模型联合解析模拟受体样品数据 ( 3 )运用多种受体模型联合解析城市受体样品数据 第一章引言 第二章多种大气源解析技术的原理 第二章多种大气源解析技术的原理 在大气颗粒物源解技术的发展过程中,出 现了多种技术方法。主要包括主 成分分析/ 多元线性回归模型、化学质量平衡模型、矩阵正值因子分解模型等一 些受体模型,以及主成分分析、等级聚类分析、元素比值法,分歧系数法等一 些统计学方法。 第一节统计学方法的原理和用法 2 . 1 . 1 主成分分析 ( p r i n c i p a l c o m p o n e n t a n a l y s i s ) 主 成分 分 析( p r i n c i p a l c o m p o n e n t a n a ly s is : p c a ) 是 一 种统计 学 方 法, 它 的目的是在所提供的原始数据中提取较小数目 的主成分,从而减小数据变量的 维数。它从相关矩阵或协方差矩阵出发, 对高维变量数据进行最佳的综合与简 化。提取出的因子相互彼此正交,且所提取出的第一个主成分的方差最大,随 后的主成分的方差逐渐减小。这里提到的主成分分析法和后面提到的主成分分 析/ 多元线性回归模型不同,前者是讲所分析的受体样品进行分类的定量分析, 而后者是对受体进行 定 量的 污染 源贡献值的 解析计算6 ,7 1 主成分分析进行数据的重构,并得到互不相关的新变量,主成分的确定是 基于最大方差判据。 数据的方差大部分包含于第一个主成分中, 第二个主成分 比第三个主成分所包含的信息多,等等。最后,根据所有主成分所包含的方差 百分数,可计算出所有需要的主成分。 主成分分析的关键思想是根据下列公式采用两个小的矩阵 ( 得分与载荷矩 阵)对原始数据矩阵x进行近似: x= t l ( 2 . 1 ) 这里,x是原是数据矩阵; t为得分矩阵, l为载荷矩阵; t表示矩阵的转置。 主成分分析结果通常采用对各成分得分和载荷的图型来分析。有时数据可通过 一个得分得到解释。然后将载荷图型和得分图型进行联合分析,可以对结果进 行判断。通常是对受体样品数据在载荷图型和得分图型的相对位置进行分析, 第二章多种大气源解析技术的原理 进行归类,或判断其主要污染源。 2 . 1 . 2 等级聚类分 析 ( h i e r a r c h i c a l c l u s t e r i n g a n a l y s i s : h c a ) 等级聚类分析可以将对象根据他们的相似性逐步聚集到一起, 从而形成由级 别排列的类簇。在聚类分析中,常用距离量度判定对象的相似性,对象间的距 离 越短 相似 性越大. 在多 数情况下使 用欧式 距离 (% 7 1 将对象按照一定的级别进行分级聚类是聚类分析的一种可行性方法,分析 对象根据它们之间的距离或相似性聚集到一起。我们需要把聚集过程和分解过 程进行区分,分解过程将对象整体分解成单个类,而更加常用的聚集过程则是 将每个对象逐步聚集到一起,开始对每个对象作为一类,随着聚集的进展逐步 形成更大的对象群体。同一个聚类中的对象具有相似的性质。 对于两个样品点 ( 1 和2 ) ,其欧式距离的计算公式如下: d i e 二 ( a r a 2 ) 2 + ( y i - y 2 ) 2 + ( z ; 一) 2 1 im ( 2 .2 ) 这里, z , y , - z 分别是样品点1 或2 所 对应的n 维空间 上的坐 标, n 是这两 个样品点在空间上的维度。 如果两个样品点的成分谱所计算得到的欧式空间距离值较小,那么就说明 从数学计算上来说,这两个样品点的成分谱较为相近,很有可能归为一类。 等级聚类就是将所有的样品点作为计算起始点,两两计算其欧式空间,再 将其相近的两个样品点的欧式空间值作为新的计算起始点,继续计算其新的距 离,最后将所有的样品点进行等级分类,得到等级分类树状图。由此将样品点 归类。 2 . 1 . 3 元 紊比 值法分 析 ( d i a g n o s t i c r a t i o a n a l y s i s ) 许多研究表明, 将受体样品中所测定的一些组分的浓度进行比值计算,可 以 判断 其大 致主要的 污染来源8 - 13 1 。 比 如对 于多 环芳 烃来说, 一些组分的比 值诸 如b e p / ( b e p + b a p ) . f l u / ( f i u + p y ) , b a p / ( b a p + c h r ) 等, 它 们的比 值 范围 可以 大致 判断其主要污染物来源如燃煤源,机动车源等。 第二章多种大气源解析技术的原理 2 . 1 . 4 分 歧系数 ( c o e f fi c i e n t o f d i v e r g e n c e : c d ) 在 大 气 源 解 析 科学 中 , 分歧系数可以用来从数学上来分析所考察两个对象 ( 样 品) 的内 在 差异性1 1 4 ,15 1 . c d 值是 一 个可以自 身 标准化的 参数,由以 下公式计 算 得到: c d 二 i ( 2 . 3 ) x , + x lj 这里, x , 是 在 第f 个 采样点 所测样品的 第i 个组 分的 浓度; f 和1 代表了两个 采 样点。 p 是化学组分的数量. 如果这两个采样点所受污染源的性质比 较相似, 那 么c d值趋近于0 , 如果这两个采样点的性质很不相似, 那么c d值就趋近于t o c d值可以 用一个短期的检测值或长期的检测值来计算, 即x 值即可以是在这个 采样点上得到的一个测量值,也可以是在这个采样点上多个测量值的平均值。 通常, 在c d的计算过程中, 用化学组分的百分含量来代替化学组分的浓度 值来进行计算,这可能更接近于将样品的成分谱来进行比较。化学组分的百分 含量计算如下: 。 一 x ,/ - 一 ( 2 . 4 ) x r 是 第i 个化学 组分的 浓度值, p 是 这个样品 化学组 分的数量。 通常, c d 值 会 联 合质 量 组 分 对 角图( m a s s fr a c t i o n d i a g ra m s ) 一 起分 析. 质量组分对角图是一个对数一 对数散点图。散点图的两个坐标轴分别是两个采样 点组分浓度或百分比的对数值。 第二章 多种大气源解析技术的原理 第二节受体模型的原理和用法 2 . 2 . 1 已知源受休模型 c mb受体模型 ( c h e m i c a l m a s s b a l a n c e : c mb ) 是已 知源受体模型的重 要代表模型之一 1 6 ,1 7 。 现在发 展起来的 还有 基于c m b模型的 二 重源解析技术 1 8 .1 9 。 本节的已 知 源受 体模型就以 介绍c ju 1模型 和二重源解析为主。 2 . 2 . 1 . 1 c mb模型的原理 c u 1i受体模型 是 基于以 下假设, 根据 质量平衡原 理建 立起来 【2 0 1 假设 存在对受体中 的大气颗粒物 有贡献的若干源类 ( 】 ) , 且 ( 1 ) 各源类排 放的颗粒物的化学组成有明显差别;( 2 )各源类所排放的颗粒物的化学组成相 对稳定;( 3 )各源类所排放的颗粒物之间没有相互作用,在传输过程中的变化 可以被忽略。( 4 ) 所有污染源成分谱是线形无关的;( 5 )污染源种类低于或等 于化学组分种类:( 6 ) 测量的不确定度是随机的、符合正态分布。那么受体上 测量的重物质浓度c就是每一源类贡献浓度值的线性加和。 j ( 2 . 5 ) 其中 ,c :受 体 大 气 颗粒 物 的 总 质 量 浓 度, 留 ,m 3 s i :每 种 源 类 贡 献 的 质 量 浓 度 , , 9 /- 3 + j :源类的 数目 , j = 1 , 2 . 3 . 。 如果受体颗粒物上的化学组分i 的浓度为q , 那么公式可以写成: j c 二 馨 f u s j,二 1, 2.1. j = 1. 2.j. (2.6) 其中 ,g : 受体 大 气 颗 粒 物中 化 学 组 分i 的 浓 度 测 量 值,p fj m 3 ; f ij : 第j 类源的 颗粒物中 化学 组 分i 的 含量 测量值, 吮; s i : 第 j 类 源 贡 献 的 浓 度 计 算 值 , , g / m 3 . j :源类的 数目 , j = 1 2 . 3 . . . . . . . j ; 第二章多种大气源解析技术的原理 i :化学组分的数目,i = 1 , 2 , 3 , . . . . . . i . 当且仅当i j 时, 方程解为正解, 源类j 的分担率为: r = s , / c xl o o % 口- 乃 2 . 2 . 1 . 2 c mb模型的计算方法 c m b 方 程组得 算法主要 有以 下几 种 1 .2 1 礼 示踪化学组分法( t r a c e r s o l u t i o n ) , 线形程 序法( l i n e a r p r o gr a m m i n g s o l u t i o n ) , 普 通加权最小二乘法( o r d i n a r y w e i g h t e d l e a s t s q u a r e s s o l u t i o n ) , 岭回归 加 权最小 二乘 法 ( r i d g e r e gr e s s i o n w e i g h t e d l e a s t s q u a r e s s o l u t i o n ) , 神经网 络法( n e u r a l n e tw o r k s s o l u t i o n ) 有效方差最小二乘法( e ff e c t i v e v a r i a n c e l e a s t s q u a r e s s o l u t i o n ) . 目 前c m b模型最常采用的是有效方差最小二乘法, 该方法使加权的元素测量值 与计算值之差的平方和最小,即使 1 m 2 _ r 一全 里 f,j .竺 i v e x ( 2 . 8 ) 最小, . 其中 j , = s 2c, + 馨 2s fy s 2j ( 2 . 9 ) 是有效方差,其中, 受 体 大 气 颗 粒 物 的 元 素 测 量 值q的 标 准 偏 差, g/ m 3 ; 排放 源的 元 素测量值f ii 的 标准偏差, % ; 2 . 2 . 1 . 3 c m b模型的 诊断 技术 c mb模型是线形回归模型。 在线性回归 模型的实际应用中 一般需要考虑以 下5 个参数判断解析结果的可靠性 1 .2 1 i , 第二章多种大气源解析技术的原理 j ( c , 一 vf ; . s , ) 2 - - -一 -二 .,i r ,一 4 - _ _ _ ( 1 ) 残差半万和 x ( c h i )值 ( c h i - x - ,) ,即 , 一 r , 付与 1 受体各化学组分浓度实测值与测量值差值平方和与分析不确定度的比 值。理想情况下,x 2 = 0 :当x % 2时,解析结果可以接受:x m 时,说 明至少有一种组分的解析结果不可以接受。 ( 2 ) 回归系数 r 2 ( r 2 一 1 - (i - j )g 2 ) , ; c ,2 / v , 即受体个化学组分计算值的方差与 测量值的方差的比 值,越接近 1 说明 解析结果越可靠,r 2 0 . 8时定义为 拟合不好: ( 3 百 分 质 量 pm ( p m - 1 0 0 乏 “ , , 即 受 体 化 学 组 分 的 计 算 总 值 与 测 量 总 值的比值, 越接近于 1 说明解析结果越可靠,在 0 . 8 - 1 . 2 之间是可以接 受的,如果该值 0 . 8 ,说明有可能是丢失了某个源的贡献; ( 4 )灵敏度矩阵 m p i n ( m p i n二 f ( v e ) 一 , f 一 ,( v e ) 一 ,/ 2 ) ,即反映参加拟合的成 分对相应的排放源贡献值及其标准偏差影响的程度,矩阵中的数值在一 1 - + 1 范围内, 绝对值在0 . 5 -1 之间的数值所对应的物质称为影响最大 的成分, 绝对值 0 . 3 说明该物质对污染源无影响, 绝对值在0 . 3 -0 . 5 之 间,说明该物质的影响不明确,但通常认为无影响; ( 5 ) t 检验值 t s t a t ( t s t a t二s , /s 2 s , ), 即源贡献计算值和其标准偏差的比 如果t 1 的主成分通常被提取出来) ,所提取出的主成分数目就是 所 解 析 出 的 源 的 数目 12 1 , 2 4 , 2 5 1 2 . 2 . 2 . 1 . 2 p c a -n l r 模型的算法 p c a -m l r 模型的第一步是将所测量得到的原始数据进行标准化处理 ( n o r m a l i z a t i o n ) , 使得所有的元素处于同一水平下: 7r。 二 (c ik - c n ) 吕 i 口. 1 1 ) 这里,i 二 1 , 2 , . . . . . . n ,样品中的总化学成分的数目; k =i , 2 . . . . . . . m,所测量的样品数目; z ,k: 第k 个样品中 第i 个化学成分的 标准化数值。 通过标准化, z .k 有正有 负,符合正态分布.对于任一化学成分i 的m个标准化数值来说, 其平均 值为 0 ,且方差为1 ; q : 所 测 量 得 到 的 第 k 个 样 品 中 第 i 个 化 学 成 分的 浓 度, ,. g /m , ., 嘶 : 所 有 这 些 m 个 样品 的 第 i个 化 学 成 分 的 浓 度 平 均 值, f , p/ m s ; s i :所有这些m 个样品的第i 个化学成分的浓度标准偏差。 由于主成分分析一多元线性回归模型需要充分的自由度, 因此这些数据需要 第二章多种大气源解析技术的原理 使样品 的 数量比 化学 成份的 数目 要大, 即 m n , 且 m 越大模型越稳定i2 1 1 然后,再将得到的标准化数据进行主成分分析。通常在进行主成分分析过 程中采用最大正交旋转 ( v a r i m a x r o t a t i o n ) ,因为在使用最大正交旋转后的到主 成分结果对于个别潜在源的变异性更具有代表性。在进行最大正交旋转主成分 分析之后,可以确定因子载荷和因子得分: 7 4 、 二 11 4 p p p k ( 2 . 1 2 ) 这里, i +p 是 经过 最 大 正交 旋 转后得 到的 主 成分 载荷, 根 据主 成分 载荷中各 种化 学成分的 权重 ( w e i g h t i n g ) , 可以 估计出 源的 类型( 通常 特征元素的 载荷值应当 较高) ; p p k 是 经 过 最 大 正 交 旋转 后得 到的 因 子 得 分, 利用因 子的 分 可以 计算出 绝 对主成分得分 ( a b s o l u t e p c s c o r e s : a p c s ) ,再将a p c s 和所测得的样品质量浓 度 ( m a s s c o n c e n t r a t i o n ) 进行多元线性回归 便可以 最终得出 源的贡献和源的成分 谱。方法如下: 首先引出一个人造样品,其所有变量的浓度等于0 ,并将其标准化: ( 2 . 1 3 ) -cw一51 -一 拍- 0- 一- (z 然后计算经过最大正交旋转的绝对零主成分得分 ( a b s o l u t e z e r o p c s c o r e s ) , p 0 , 即 对于每 个p 主 成分来说, 、 二 i b pi (t 0 )t ( 2 . 1 4 ) a p c s 的计算如下: a p c s p j 二 p l p u l 一 p o i p d( 2 . 1 5 ) 这里 p a 】 中 第p 行中 所旬列的数值都是相等的, 其数值等于公式中计算所得到的 值。 尽管a p c s 对于源的贡献是成比例的,但是这些得分数值同质量浓度不是同 一单位。因此,需要将a p c s 进行一次转换,使其和质量浓度是同一单位。这可 以通过将其与所测得的质量浓度进行多元线性回归得到: p m k = 4 0 + 泌(a p c s )jk ( 2 . 1 6 ) 第二章多种大气源解析技术的原理 这 里, m , 是 第 叶样 品 的 质 量 浓 度, . 留 _ 3 ; 场 是 回 归 得到 的 截 距, 如 果 模 型 拟 合 比 较 成 功 的 话, 场 应 当 趋向 于 0 ; fi ( a p c s )p ,* 是 计 算 所 得的 第 j 个 源 对 第 k 个 样 品 的 质 量 浓 度 贡 献, k g i m 3 a 2 . 2 . 2 . 1 . 3 p c a -ml r 模型的优缺点 主成分分析一多元线性回归模型是一种定量的源解析技术,它是将定性解 析的p c a 模型同m l r 相结合。主成分分析一多元线性回归模型同其它未知源受体 模型一样,具有自 身的优点与缺点。然而,它也没有解决非负值限制的问 题, 在p c a 过程中,也会产生负数值,例如得到的主成分载荷和主成分得分会出现负 数值。 在这种情况下,通常将负值由 0 取代再进行下面的计算,因此在模型的拟 合过程中 难免会产生 误差16 。 2 . 2 . 2 . 2 p mf模型 ( p o s i t i v e m a t r i x f a c t o r m o d e l ) 2 . 2 . 2 . 2 . 1 p mf 模型原理和算法 p m f模型也是基于因子分析原理, 其考虑到了非负值的限制, 是一种较新 发展的 一 种源解析 技 术【x 29 1 。 本研究中, p m f 模型 使用的是e p a p m f 模型1 30 1 p mf模型是将原始矩阵x ( n x m ) 因子化, 分解为两个因子矩阵, f ( p x m ) 和g ( n x p ) ,以及一个 “ 残差矩阵” e ( p x m ) ,如下式表示: e二 x . j 1 g .,fpm ( 2 . 1 7 ) 这 里, 猛表 示n 个样品中 的 m 个化学成分: p 是解析出 来的 源的 数目 ; g 是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论