资源目录
压缩包内文档预览:(预览前20页/共43页)
编号:686659
类型:共享资源
大小:3.49MB
格式:RAR
上传时间:2016-07-03
上传人:棒***
认证信息
个人认证
康**(实名认证)
湖北
IP属地:湖北
25
积分
- 关 键 词:
-
jl020
独立
成分
成份
分析
技术研究
- 资源描述:
-
【JL020】独立成分分析技术研究,jl020,独立,成分,成份,分析,技术研究
- 内容简介:
-
(本科毕业设计论文 ) 毕业设计(论文)外文资料翻译 作 者: 赵利君 学科专业: 自动化 学 号: 103587 班 级: 191001 指导老师: 邢超 2014 年 6 月 变分贝叶斯独立分量分析 摘要 信号的盲分离通过 法在潜变量模型中被视为最大似然学习潜变量模型。在本文我们提出一个变换方法 最大似然学习这些模型 ,即贝叶斯推理。它已经被证明可以应用贝叶斯推理来确定在主成分分析模型潜在的维度。在本文我们为去除在独立分量分析模型中不必要的来源维度获得类似的方法。我们给一个玩具数据集和一些人为的混合图像提出结果。 独立分量分析的目的是为一个基于概率性的独立原件找到一个表示法。实现这样的表示方法是给潜变量是独立约束的潜变量模型拟合一个数据。我们假设一个 ,有潜在的尺寸 W,观察到的尺寸 P 和我们的数据集包含样本 n 的模型 M。在法中通常把潜在的维度称为“来源”。因此我们为独立生成潜在变量 X 寻找模型表示,我们将任何给定的数据点 n 带入 Ii )()( 假设高斯噪声 ,观察到的变量的每个实例化的概率 ,带入 )2),( 2 其中 W 是 阵的参数 ,B 代表了一种逆噪声方差和 u 是一个向量的方法。 分布 众所周知在独立分量分析 ,潜在分布的选择是很重要的。特别说明它必须是非高斯。非高斯源分布可以分成两类 ,那些积极的峰度或“沉重的尾巴”和那些消极的峰度或“光明的尾巴”。前者被称为超高斯分布, 后者是亚高斯。如果我们真正的源分布属于这两个中的任何一个类我们可以尝试分开。对于我们的 我们遵循 (1998)选择超高斯或者是亚高斯灵活的源分布。的运算结果的模型应用于两个可能发生的事。阿蒂亚斯选择了每个因素的混合物 M 高斯模型 Ii mn ( m 是混合系数和每个组件是由一个意思毫米和方差 蒂亚斯提到作为独立的因子分析模型。我们可能现在写下一个可能性 ,是一个函数的参数 W, , ,统的优化执行限制作为 种方法由贝尔和介绍了盲源分离作为信息最大化算法。与最大的关系可能是由不同的作者包括卡多佐指出 (1997)和麦 (1996)。 贝叶斯形式主义 在本文中我们提出, 按照推断模型的参数化的贝叶斯方法,而不是通过最大似然学习的参数 。这要求我们把先验对模型参数。我们的目标是如何通过一个特定的选择我们的先验分布的显示 P(W)我们可能自动判断哪 些已经产生了数据源的数量。我们是主教的贝叶斯 1999年) ,它的目的是确定在启发我们的方法主要子空间的自动维数。我们选择将噪音精密 ,与以前的马 , b , 这里我们定义伽玛分布 e xp,ga m 1 对于混合矩阵 W,我们认为高斯之前。特别是每一个的相关性输入可通过使用自动相关性确定 ( 来确定前(尼尔, 1996; 麦凯, 1995年) 1,0 其中前是由超参数向量管辖, ,长度 I。 参数随着网络的每个输入相关联的向量的一个元素的管辖其决定了它的“相关性”。该超参数 可以通过分层贝叶斯框架来推断。我们因此,把伽玛分布的超高斯通过这些参数, Ii i ba a )( 最后,我们将一个高斯比之前的手段其 Pp 中 T 的代表事先的逆差额。现在我们可以定义我们的 模型可能性 。 , 在贝叶斯推理,我们的目标是后验分布为参数。积分在等式 10 中所示的类型是重要的这一过程。不幸的是,贝叶斯 如我们所描述的那样,这个积分是棘手的,我们必须寻找到近似取得进展。 我们选择采取变分法 ( 约旦等,1998;劳伦斯, 2000) 。 变分方法涉及开发一个近似值, q(),鉴于观察到的变量。变推断可以提供 严格的 下界边缘化数似然的形式, ln,这个结合的和真实的边缘似然之间的差可以被证明 ,是真正的后验分布之间的距离( 度近似。 ln,如果我们利用一个无限制的近似 q(),并执行自由形式的马克西 1 利润最大化,我们会收回 q() =p( /) 和绑定将成为精确。 这种方法是一种期望最大化算法的期望步骤。然而,在我们的模型中,如果这样的选择被提出, 不会很容易被解决。 相反,通过将限制近似分布的形式,我们希望能尽量减少 对 变分的选择 q 分布是很重要的 我们寻求一个选择是足够简单,让我们的计算 死板 ,但其中 给出 了足够的灵活性,以使绑定 ( 11) 。 有各种各样的方法来确定一个有用的近似值。拉帕莱宁( 1999),例如,施加于他的变分派特定的参数设置功能表,然后最小化 度梯度它们的参数的优化。在本文中,我们更愿意考虑我们的近似分布的自由形式的优化正如我们已经提到,如果我们允许后近似完全不受约束的自由形式的优化,我们只会恢复真实后 路 分布 并且很难驾驭 。因此,我们必须施加近似的形式约束。考虑一个模型,其中的潜变量, H,分为专属子 集。假如我们要对分离性限制在这些子集上我们逼近后, i 它是直接显示,最佳形式后路分布的各个组成部分是 j H x p 在这里,我们使用的符号 q,表示下分布的期望 q,通过利用穿过模型的参数一个近似值, x, 我们可能获得的表单模型对数似然的一个下 , 对于贝叶斯 模型,正如我们所描述的那样,在等式 14 所有必要的预期可能进 行解析地给出下面的结果 111 , 1 , ,其他参数是简单的推导,并可能在主教被发现。为第 q 分 布的最佳因素的解决方案是一个隐式 1。每个分布依赖于其他解决方案的时刻。一个解决方案可以通过数字开始用合适的初始猜测和使用甲部给出主教的更新方程,通过循环通过每个分布来确定 图 1:散点图从模型样品。所发现的嵌入尺寸示于图中的实线的中心,而真正的嵌入尺寸示于每个图的虚线的右上方 。 具问题 对于我们的模型,以确定潜在的维数的能力进行评估,我们采样玩具数据集一个随机参数化模型。两个源分布被选为包含两部分,都与均值为零。每个组件的差异,均被视为 1和 50。随后被带到观测数据的维数是三 ,噪声的逆差额定为110合矩阵 W 随机从高斯采样单元变量 我们 高斯随机取样的值获得从模型 200的样本,然后试图通过推理中有三个源 维度模型推断 ,以确定源的数量和噪声方差为的相同类型中的那些生成模型。该值初始化与 解决方案。首先分布的优化 , 然后通过先进行更新的那么刹那的瞬间, 那么 X 和的时刻,最后时刻 时刻进行的。这些时刻被更新,直到收敛或最多 100次。的 和瞬间随后更新。这整个过程重复 50次。 选定的独立成分示于图 1 中。注意,源维度的真实数目已经被正确决定。 图 2 所示为各 演变 。 注意,超参数的非常迅速变成幅值比其它有效切断源维度之一大三个数量级。 时数据 由于我们的模型的进一步测试中,我们分析了两个图像。该图像是由 ,000,000 收集并在他们的红色,绿色和蓝色通道进行平均,得到灰度图像。这两个图像的峭度为负值,这表明这两个图像子高斯。从图像中我们子采样1000 个数据点,然后把它们混合使用相同的矩阵作为玩具的问题。高斯噪声,然后用方差这是源信号大小的 添加。然后,我们执行一个包含三个来源维度模型。 建议的模型表现良好,其上已经 采样玩具训练数据时,从类似的源码分发版。然而,在图像上的实验分量分析模型无法确定来源的真实数据的真实数量。这个问题可能是因为出现潜在分布的假定形式是不相匹配的真正来源分布。因此该模型可总是更好地解释该数据通过将“虚拟”源代码分发。这是因为嵌入的观测化空间可以通过增加更多的潜获得更多和更复杂的形式尺寸。这是相对于贝叶斯情况。 在贝叶斯 此,它不表现出这些问题。我们可能需要删除源具有最高超相关联的方法参数,并检查是否下界在模型上的可能 性增大。遗憾的幸运的是,虽然我们最大化下界模型似然贝叶斯 们无法确定这个界限的价值。 这是的结果 似的潜变量是高斯的混合物。为了计算绑定 16,我们需要评估混合分布的熵。有一些希望的进展,因为虽然这个熵的精确计算是棘手的,它可能被下界(劳伦斯 1999)。( 1我们不是指子高斯与超高斯分布的问题,我们有假设信源的峭度的符号被称为在这些实验中和所选择的我们潜在的分布相应。) 图 3:结果当模型被留下来确定潜在的维度。回收的来源与手动删除幻影潜在维度。注意,有更强的 鬼斗兽场的图像上的小狗。 图 4:散点图子样本的观察图像的实验尝试的确定来源的真实数量。所发现的嵌入尺寸示于中心地块为实线,而真正的嵌入尺寸显示各右上角绘制为虚线。另一种解决方案,以及 1我们将提出,将自适应地修改该潜分布作为优化过程的一部分。这可以通过以下方式实现作为所示,例如 , 1998) 的潜变量的分布。最后一种选择是使用一个简单的模型,以确定潜在的维数。我们可以应用贝叶斯 确定主要的子空间和相关的潜维度。那么一个简单的最大似然模型可以应用于内该嵌入式领域。 我们更喜欢我们 建议的解决方案,但因为它是能够处理那里有比观察到的尺寸更多的来源问题,因此比较一般。另一个非常不同的方法来确定源一直由许韦里宁和欧雅 ( 1997) 提出了建议。这种方法不是基于一个可能性模型,它与投影寻踪。我们注意到,我们所描述的模型还应该能够处理更多的源二比有数据维度。这一直被认为是一个困难的问题独立分量分析的文献。用我们的方法的另一个问题是在 数目呈指数增长作为潜空间维数的一个函数。 这使得该方法不且对于有大量的源模型。 q 贝叶斯 布资料来源 首先,我们注意到,联合分布在整个数据点可能大 家因此,采取 1在等式 14,我们需要的部件的唯一采取的期望 q,我们将期待采取的其他条款,这是在不断的照顾通过归一化常数是 co n s 12我们采取是在变形分布的潜变量模型其中每个因子是混合物 x nx x 2 1 1ex p NN mm m m 111i 1 1 M m 111e x 112111 xx m 21 2 121 x 121 121 1 11 1 M 11 M 11 M . . 1 of as in a we an to in It be to in 1999a). we a in an We on a on of is to a a is on to is to to a to be a in 1 C8 6 In CA to we in we 1)2. of of be to 2)F is a 2C1 of AC an M of is in of In be be as as If in of we to CA we 1998) a a or be a in is a 5 43)is by a 1a to as We a is a of F, AC 4)be to in to is in C to to 1995) as an by 1997) 996) we to of of us to to a of 4we of We in by CA 1999a) to of to a P 5)we 6)we a In of be of 1996; 1995b)7)is by a of of 1. of by an of B be a 48)we a 9)S of 10)3 we to 0 in we is we to We to a et 1998; 000). an to of a on 011)be 12)If we to an a of 1 5we 5P is of an in if a be by on of we to of of 5is We a is to to 1 to a 1999), on by of In we to of we if we to of we We on of a 0If we on to 513)it is to 1995a; 2000) of B 14)we W an an of 5P 15)we a on of L 77716)1 is of 41 0is CA as we 4 17)618)19)20)21)of 5. to be 999b)of 5is an on of A be a 1999b): of of as to of as an of of to a a to to D of to be of of F a We 00 to by in a of to in F a of by M C F. or a 00 B C . is 0of of of a of we ,000,000 of We 000 as a of We a of 10 15 20 25 30 35 40 45 50: of 0 of 0of in a to on we of of in of of in of by on in on to of of to As a by is of is in to CA to a As a it of on we a on we to of is a of a To 6 we to of of is it 1999)to of we of of in : is to is a on of : of of of on as to of as we be to as of be of as 1998).A is to a to CA to a CA be We as it be is to yv1997). is on a is to we be to a is in of as a of of 5of we we 22)4 we of 0as we to of 23)4is we to be a is a 5 424)663 be in of of 25)we B 26)of be in of of 27)5is a 5C1 B 8)of be 29)1We 0)31)732)of 533)4)35)to 6)37)H. (1998). 11, 803A. J., & T. J. (1995). An to 7, 1129C. M. (1999a). 88). C. M. (1999b). eural毕业论文答辩 课题名称:独立成分分析技术研究 导师:邢超 专业:自动化 班级: 191001 姓名: 赵利君 学号: 103587 主成分分析( 一种分析、简化数据集的技术。 独立成分分析 (简称独立分量分析是一种利用统计原理进行计算的方法 在诸多 定点算法 (也称 其收敛速度快、分离效果好被广泛应用于信号处理领域。 独立成分分析的一个改进的梯度学习算法,简称正交信息极大化算法 ( 个算法综合了 源信号分离、生理学数据分析、语音信号处理、图像处理及人脸识别等。 题的背景及意义 独立成分分析( 早应用于盲源信号分离( 起源于“鸡尾酒会问题”。 在常称他们的方法为 以说是最经典的 前比较流行的 息最大化)、 点算法, 速 者尽可能独立的信号对其他信号进行表征。 主成分分析( 一种分析、简化数据集的技术。经常用来减少数据集的维数,同时保持数据集的协方差贡献最大的特征。 主成分分析最终是分析出对象对系统对象对系统影响最大的一些因素。 独立成分分析是一种利用统计原理进行计算的方法。是一个线性变换可以把数据等分离的非高斯线性组合。 独立成分分析得到的是某一因素在系统中的特征。 语音数据的实验结果 用以下三个算法来进行比较; 择非线性函数 极大似然估计的自然梯度法,即 改进的梯度学习算法 ( 实验 算法的分离精度用误差指标 义为 : 这里是矩阵的第 法的分离精度越差。 )1m 1m 11 1 图展示了算法在学习过程中的误差执行曲线(只显示了 为它是不同类型的算法,不适合直接比较 ),在收敛速度上, 个算法的平均分离误差 可见, 分别执行这三个算法,来进行 从相关性分析比较计算结果。 实脸任务:中英文字形辨别 实验时,功能成像采用回波平面成像梯度回波序列,其扫描参数如下 : 000E=40of 240 404x 6 4,00 验参考函数 用线性相关分析的方法来评价 任务实验设计的 上图,所求得的混合矩阵的列为成分图的时间序列,计算混合矩阵每一列与参考函数的相关系数,所得的相关系数越大,说明求得的时间序列与实验任务越相关 (分。 源信号分离、生理学数据 分析、语音信号处理、图像处理及人脸识别等。 源图像 混合后的图像 分离后的图像 眼电信号干扰 本论文对,独立成分分析的一个改进的梯度学习算法进行了分析,简称正交信息极大化算法(个算法综合了 定点)算法的优点。从语音信号和 语音信号的分离准确度来说, 于真实的 根据 别做出人脸识别、图像分离、语音数据处理的结果图。 设计总结 感谢各位答辩老师! com西北工业大学明德学院本科毕业设计论文 (本科毕业设计论文 ) 本科毕业设计论文 题 目 独立成分分析技术研究 系 别 自动化系 专 业 自动化 班 级 191001 学生姓名 赵利君 学 号 103587 指导教师 邢超 报告日期 西北工业大学明德学院本科毕业设计论文 毕业设计任务书 一、题目 独立成分分析 技术研究 二、指导思想和目的要求 1、 利用已有的专业知识,培养学生解决实际工程问题的能力; 2、 锻炼学生的科研工作能力和培养学生的团结合作攻关能力; 三、主要技术指标 1. 研究独立成分分析算法; 2. 完成演示程序 四、进度和要求 第 01周 2周:英文翻译; 第 03周 4周: 学习主成分分析与独立成分分析技术; 第 05周 0周: 研究独立成分分析算法; 第 11周 6周: 设计演示程序 ; 第 17周 8周:撰写毕业设计论文,论文答辩; 五、主要参考书及参考资料 1 1 2001 2 A . A 2004 3 2012 学生 赵利君 指导教师 邢超 系主任 _ 西北工业大学明德学院本科毕业设计论文 I 摘 要 主成分分析( 一种分析、简化数据集的技术 。 主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。 独立成分分析 (简称 独立分量分析是一种利用统计原理进行计算的方法。它是一个线性变换 ,这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。 目前比较流行的 息最大化)、 点算法, 速 方法分类的依据主要是求取分离矩阵 计算最大似然估计时,假设了 与 之间是独立的,然而对于语音信号或者其他具有时间连续依赖特性(比如温度)上,这个假设不能成立。但是在数据足够多时,假设独立对效果影响不大,同时如果事先打乱样例,并运行随机梯度上升算法,那么能够加快收敛速度 。 在诸多 定点算法 (也称 其收敛速度快、分离效果好被广泛应用于信号处理领域。该算法能很好地从观测信号中估计出相互统计独立的、被未知因素混合的原始信号。 本论文对 ,独立成分分析的一个改进的梯度学习算法进行了分析 , 简称正交信息极大化算法 ( 个算法综合了 定点) 算法的优点。从语音信号和 语音信号的分离准确度来说, 于真实的 应的做出了语音数据的实验结果和 西北工业大学明德学院本科毕业设计论文 盲 源信号分离、生理学数据分析 、语 音信号处理、图像处理及人脸识别等 。 关键词: 主成分分析, 独立成分分析, 最大似然估计 , 西北工业大学明德学院本科毕业设计论文 is a of is to of of to of a is by is a of it is by a to is to to be on of a on of a it to to p to it to a is of is to to a of of a at to to a of as as to of or is a of is a of to is a or is of CA CA is on to 北工业大学明德学院本科毕业设计论文 IV . To is or as be in on is if in at of an of to as O of to In of to of of In CA is in of by CA is of 北工业大学明德学院本科毕业设计论文 V 目录 第一章 绪论 . 1 . 1 第二章 主成分分析法 . 3 . 3 . 4 . 6 . 7 . 8 . 9 . 9 . 9 第三章 独立成分分析技术 . 11 . 11 . 12 . 12 立成分分析基本原理与发展 . 13 . 13 性测度为依据,确定目标函数 . 13 第四章 独立成分分析算法 . 15 . 15 . 16 大似然估计法 . 16 西北工业大学明德学院本科毕业设计论文 . 18 . 18 . 18 . 19 . 20 音数据的实验结果 . 20 . 21 第五章 . 24 脑磁图 (分离非自然号 . 24 金融数据中找到隐藏的因素 . 24 . 24 . 25 . 26 . 28 第六章 全文总结 . 30 参考文献 . 31 致谢 . 33 毕业设计小结 . 34 西北工业大学明德学院本科毕业设计论文 1 第一章 绪论 独立成分分析 (简称 思想和方法最早源于上世纪八十年代几个法国学者的研究工作,尽管当时他们并没有命名其为在 1986年举行的神经网络计算会议上 ,法国学者来解决盲源分离问题 (称 他们的工作开创了信号处理领域的新纪元,从此盲源分离问题得到了各国学者的广泛重视。 但在当时, 十年代国际神经网络会议上,当时少数有关 没有引起各国学者足够的重视。 进入到上世纪九十年代初期,某些学者开始了这方面的研究,他们扩展了八十年代有关盲分离问题的一些工作。其中,学者 兰学者 线性 法。然而,直到九十年代中期, 要原因是这些学者提出的算法所能解决的问题是相当有限的。 事实上,解决盲源分离问愚是一个非常困难的任务,因为我们不知道源信号的任何信息。在 作了两个假设 :一个是假设源信号是相 互统计独立的,另一是假设己知源信号的统计分布特征。如果假设源信号是高斯分布的,则很容易看出这个育源分离问题没有一般的解,因为高斯分布的任何线性混合仍然是高斯的。用 要假设源信号是亚高斯信号,也就是说源信号的峰度值要小于高斯信号的峰度 值。直到 1994年,法国学者 清晰的数学上的框架,从此 2 正式用语 。 到日前为止,标 准的独立成分分析算法己经较为成熟,国际上使用最为广的是信息极大化算法、 、扩展的信息极大化算法( 准的独立成分分析的数学模型较为简单,不同的独立性判据所导致的算法在形式上也是基本相似的。形势虽然简单,但到目前为止,以实际的生物医学信号处理为例,研究者大量使用的主要还是标准的 要因为它发展的最为成熟,计算稳定,较少有数值问题,并且网上有相关作者编制的通用软件包可用于研究下载。在真实数据的处理过程中,可尽量将所面临的问题 转化为标准的 后选用有效的 因为真实数据往往规模比较大,选择在实算中收敛速度快,计算稳定的算法是相当重要的。 际的盲源分离问题又是方方面面,需将各种实际情况转化为相应的数学模型来解决。现在人们重点研究的是扩展的独立成分分析,其模型是标准的 进一步满足实际需要,比如具有噪声的独立成分分析 ,稀疏和超完备表示问题 ,具有时间结构的独立成分分析问题,非线性的独立成分分析和非平稳信号的独立成分分析等。独立成分分 析己经被广泛应用于实际数据的处理中,诸如图像处理、语音信号处理、生物医学信号处理、模式识别、数据挖掘、通讯等。 西北工业大学明德学院本科毕业设计论文 3 第二章 主成分分析法 在统计分析中,主成分分析( 一种分析、简化数据集的技术。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。主成分分析由卡尔 皮尔逊于 1901年发明,用于分析数据及建立数理模型。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分与它们 的权值。 主 成分 分析 (图用一组维数为数不多的特征去尽可能精确地表示样本的特征 ,它通常采用训练样本总体协方差矩阵的特征向量系作为展开基 (即 , 而那些对应若干个最大特征值的特征向量则被称为主分量或主成分(模式样本在这些主分量上线性投影后,所得的投影系数即 为主分量特征。主分量分析的具有两大优点: 1、 消除了模式样本之间的相关性; 2、 实现了模式样本的维数压缩。 K、 样本,换而言之,主分量分析给出了高维数据的一种简约的表示。由于以上优点,主分量分析被广泛地用于模式识别、数据压缩等领域。 将 来, 出了一种直接基于图像矩阵的二维主分量分析 (2法,该方法在对图 像样本进行特征提取时,直接利用图像矩阵本身计算图像的总体协方差矩阵,然后取它的前 于 2此避免了对高 维的图像向量进行计算,实验证明其不仅识别率较 高,而且特征 抽取速度也提升了十几倍。 西北工业大学明德学院本科毕业设计论文 4 以分析化学发展史为例。分析化学是化学的一个重要分支,它主要研究物质中有哪些元素或基团 (定性分析 );每种成分的数量或物质纯度如何 (定量分析 );原子如何联结成分子,以及在空间如何排列等等。 分析化学以化学基本理论和实验技术为基础,并吸收物理、生物、统计、电子计算机、自动化等方面的知识以充实本身的内容,从而解决科学、技术所提出的各种分析问题。分析化学这一名称虽创自玻意耳,但其实践运用与化学工艺的历史同样古老。古代冶炼、酿造等工艺的高度发展,都是与鉴定、分析、制作过程的控制等手段 密切联系在一起的。在东、西方兴起的炼丹术、炼金术等都可视为分析化学的前驱。 公元前 3000年,埃及人已经掌握了一些称量的技术。巴比伦的祭司所保管的石制标准砝码 (约公元前 2600)尚存于世。不过等臂天平用于化学分析,当始于中世纪的烤钵试金法中。 古代认识的元素,非金属有碳和硫,金属中有铜、银、金、铁、铅、锡和汞。公元前四世纪已使用试金石以鉴定金的成色,公元前三世纪,阿基米德在解决叙拉古王喜朗二世的金冕的纯度问题时,即利用了金、银密度之差,这是无伤损分析的先驱。 公元 60年左右,老普林尼将五倍子浸液涂在莎草纸上 ,用以检出硫酸铜的掺杂物铁,这是最早使用的有机试剂,也是最早的试纸。迟至 1751年,埃勒尔冯布罗克豪森用同一方法检出血渣 (经灰化 )中的含铁量。火试金法是一种古老的分析方法。远在公元前 13世纪,巴比伦王致书埃及法老阿门菲斯四世称 :“陛下送来之金经入炉后,重量减轻”这说明 3000多年前人们已知道“真金不怕火炼”这一事实。法国菲利普六世曾规定黄金检验的步骤,其中提出对所使用天平的构造要求和使用方法,如天平不应置于受风吹或寒冷之处,使用者的呼吸不得影响天平的称量等。 18世纪的瑞典化学家贝格曼可称为无机定 性、定量分析的奠基人。他最先提出金属元素除金属态外,也可以其他形式离析和称量,特别是以水中难溶的形式,这是重量分析中湿法的起源。 德国化学家克拉普罗特不仅改进了重量分析的步骤,还设计了多种非金属元素测定步骤。他准确地测定了近 200种矿物的成分及各种工业产品如玻璃、非铁合金等的组分。 18世纪分析化学的代表人物首推贝采利乌斯。他引入了一些新试剂和一些新技巧,并使用无灰滤纸、低灰分滤纸和洗涤瓶。他是第一位把原子量测得比较西北工业大学明德学院本科毕业设计论文 5 精确的化学家。除无机物外,他还测定过有机物中元素的百分数。他对吹管分析尤为重视,即将少许样品置于炭块凹处,用氧化或还原焰加热,以观察其变化,从而获得有关样品的定性知识。此法一直沿用至 19世纪,其优点是迅速、所需样品量少,又可用于野外勘探和普查矿产资源等。 19世纪分析化学的杰出人物之一是弗雷泽纽斯,他创立一所分析化学专业学校 (此校至今依然存在 );并于 1862年创办德文的分析 化学杂志,由其后人继续任主编至今。他编写的定性分析、定量分析两书曾译为多种文字,包括晚清时代出版的中译本,分别定名为化学考质和化学求数。他将定性分析的阳离子硫化氢系统修订为目前的五组,还注意到酸碱度对金属硫化物沉淀的影响。在容量分析中,他提出用二氯化锡滴定三价铁至黄色消失。 1663年玻意耳报道了用植物色素作酸碱指示剂,这是容量分析的先驱。但真正的容量分析应归功于法国盖吕萨克。 1824年他发表漂白粉中有效氯的测定,用磺化靛青作指示剂。随后他用硫酸滴定草木灰,又用氯化钠滴定硝酸银。这三项 工作分别代表氧化还原滴定法、酸碱滴定法和沉淀滴定法。络合滴定法创自李比希,他用银滴定氰离子。另一位对容量分析作出卓越贡献的是德国莫尔,他设计的可盛强碱溶液的滴定管至今仍在沿用。他推荐草酸作碱量法的基准物质,硫酸亚铁铵 (也称莫尔盐 )作氧化还原滴定法的基准物质。最早的微量分析是化学显微术,即在显微镜下观察样品或反应物的晶态、光学性质、颗粒尺寸和圆球直径等。 17世纪中叶胡克从事显微镜术的研究,并于 1665年出版显微图谱。法国药剂师德卡罗齐耶在 1784年用显微镜以氯铂酸盐形式区别钾、钠。德意志化学家马格拉夫在 1747年用显微镜证实蔗糖和甜菜糖实为同一物质 ;在 1756年用显微镜检验铂族金属。 1891年,莱尔曼提出热显微术,即在显微镜下观察晶体遇热时的变化。科夫勒及其夫人设计了两种显微镜加热台,便于研究药物及有机化合物的鉴定。后来又发展到电子显微镜,分辨率可达 1埃。不用显微镜的最早的微量分析者应推德国德贝赖纳。他从事湿法微量分析,还有吹管法和火焰反应,并发表了微量化学实验技术一书。近代微量分析奠基人是埃米希,他设计和改进微量化学天平,使其灵敏度达到微量化学分析的要求 ;改进和提出新的操作方法,实现毫克级无机样品的 测定,并证实纳克级样品测定的精确度不亚于毫克级测定。有机微量定量分析奠基人是普雷格尔,他曾从胆汁中离析出一种降解产物,其量尚不足作一西北工业大学明德学院本科毕业设计论文 6 次常量碳氢分析。在听了埃米希于 1909年所作有关微量定量分析的讲演并参观其实验室后,他决意将常量燃烧法改为微量法 (样品数毫克 ),并获得成功 ;1917年出版有机微量定量分析一书,并在 1923年获诺贝尔化学奖。 德国化学家龙格在 1850年将染料混合液滴在吸墨纸上使之分离,更早些时候他曾用染有淀粉和碘化钾溶液的滤纸或花布块作过漂白液的点滴试验。他又用浸过硫酸铁和铜溶液的纸,在其中 部滴加黄血盐,等每滴吸入后再加第二滴,因此获得自行产生的美丽图案。 1861年出现舍恩拜因的毛细管分析,他将滤纸条浸入含数种无机盐的水中,水携带盐类沿纸条上升,以水升得最高,其他离子依其迁移率而分离成为连接的带。这与纸层析极为相近。他的学生研究于滤纸上分离有机化合物获得成功,能明显而完全分离有机染料。 20世纪 60年代,魏斯提出环炉技术。仅用微克量样品置滤纸中,继用溶剂淋洗,而后在滤纸外沿加热以蒸发溶剂,遂分离为若干同心环。如离子无色可喷以灵敏的显色剂或荧光剂,既能检出,又能得半定量结果。色谱法也称层析法。 1906年俄国茨维特将绿叶提取汁加在碳酸钙沉淀柱顶部,继用纯溶剂淋洗,从而分离出叶绿素。此项研究发表在德国植物学杂志上,但未能引起人们注意。直到1931年德国的库恩和莱德尔再次发现本法并显示其效能,人们才从文献中追溯到茨维特的研究和更早的有关研究,如 1850年韦曾利用土壤柱进行分离 ;1893年里德用高岭土柱分离无机盐和有机盐等等。气体吸附层析始于 20世纪 30年代的舒夫坦和尤肯。 40年代,德国黑塞利用气体吸附以分离挥发性有机酸。英国格卢考夫也用同一原理在 1946年分离空气中的氢和氖,并在 1951年制成气 相色谱仪。第一台现代气相色谱仪研制成功应归功于克里默。气体分配层析法根据液液分配原理,由英国马丁和辛格于 1941年提出。并因此而获得 1952年诺贝尔化学奖。戈莱提出用长毛细管柱,是另一创新。色谱 使复杂的有机混合物在数小时内得到分离和鉴定,是最有效的分析方法之一。 在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相西北工业大学明德学院本科毕业设计论文 7 关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。同样,在科普效果评估的过程中也存在着这样的问题。科普效 果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。 如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构 的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效 果评估问题时,容易抓住主要矛盾。 上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令其中为正交阵的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些 主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科 普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果 的评估。 主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机西北工业大学明德学院本科毕业设计论文 8 向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的 后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量 尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。主成分分析是设法将原来众多具有一定相关性(比如 重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来 为新的综合指标。最经典的做法就是用 取的第一个线性组合,即第一个综合指标)的方差来表达,即 大,表示 此在所有的线性组合中选取的 称 果第一主成分不足以代表原来 考虑选取 了有效地反映原来信息, 2中,用数学语言表达就是要求 0),( 21 则称 此类推可以构造出第三、第四,第 1) 原始指标数据的标准化采集 ),.,(21 .,2,1,., 21 )( n p,构造样本阵,对样本阵元进行如下标准化变换:.,2,1;.,2,1,(2 其中1)(, 221 ni 得标准化阵 Z。 2)对标准化阵 n . . . ,2,1,1. 。 3)、解样本相关矩阵 R 的特征方程 0得 确定主成分 西北工业大学明德学院本科毕业设计论文 9 按 pj jj j 确定 信息的利用率达 85%以上,对每个j,,.,2,1 解方程组 j 得单位特征向量 。 4)将标准化后的指标变量转换为主成分 .,2,1, 为第二主成分 , ,为第 5)对 对 得最终评价值,权数为每个主成分的方差贡献率。 可消除评估指标之间的相关影响。因为主成分分析法在对原始数据指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标间相关程度越高,主成分分析效果越好。 可减少指标选择的工作量,对于其他评估方法,由于难以消除评估指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析法由于可以消除这种相关影响,所以在指标选择上相对容易些。 主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前面方差较大的几个主成分来代表原变量,从而减少了计算工作量。用主成分分析法作综合评估时,由于选择的原则是累计贡献率85%,不至于因为节省了工作量却把关键指标漏掉而影响评估结果。 在主成分分析中,我们首先应保证所提取的 前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。 主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数 p( 除非 否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。 西北工业大学明德学院本科毕业设计论文 10 当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确 。 西北工业大学明德学院本科毕业设计论文 11 第三章 独立成分分析技术 独立成分分析( 早应用于盲源信号分离( 起源于 “ 鸡尾酒会问题 ”
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。