支持向量机算法用于C60溶解度的热力学分析.doc_第1页
支持向量机算法用于C60溶解度的热力学分析.doc_第2页
支持向量机算法用于C60溶解度的热力学分析.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

支持向量机算法用于C60溶解度的热力学分析 叶晨洲收稿日期:2002-06-10;修回日期:2002-09-10作者简介:叶晨洲(1974-),自动化专业,导师:杨杰、陈念贻, 李国正1 姚莉秀1 陈念贻2 陆文聪2(1.上海交通大学图象及模式识别研究所,上海 200030;2.上海大学化学系计算机化学研究室,上海 200436)摘要 C60在许多溶剂中形成分子比各不相同的溶剂化合物。因此其实测溶解度实际上是各种不同配比的溶剂化合物的溶解度。所以将各种实测的溶解度数据直接进行对比作QSAR分析是不合适的。本工作改用C60 实测溶剂化自由能换算溶解度为C60的“推算溶解度”作多变量分析。采用预报能力强的支持向量回归算法,对C60的溶解过程的热力学函数的规律作了初步探讨。关键词 C60的溶解度;溶剂化合物;QSAR;热力学分析;支持向量回归 ;中图分类号:O 06-04Support Vector Regression Applied to Thermodynamic Analysisof Solubility of C60 in Different SolventsYe Chen-zhou1 , Li Guo-zheng1, Yao Li-xiu1, Chen Nian-yi2, Lu Wen-cong2(1. Institute of Image and Pattern Recognition, JiaoTong University,Shanghai,200030 ,China;2. Laboratory of Chemical Data Mining, Shanghai University,Shanghai,200436,China) Abstract C60 often combines with different kinds of solvents, forming solvated compounds with various stoichiometries.So it is clear that most of the experimentally measured data about the solubilities of C60 are actually the solubilities of solvated C60 ,not of pure C60 . Therefore, it seems unreasonable to compare the whole solubility data set within one mathematical model by QSAR analysis. In this work, the data of free energy of formation of C60 solvates are used to convert the experimentally measured solubility data into “hypothetical solubility data”, and then use these data as the targets of QSAR analysis. Support vector regression technique has been used in this computation.Keywords: Solubility of C60; solvates of C60; QSAR, thermodynamic analysis; support vector regression. 1引言 C60 是有很大应用潜力的碳素新材料,目前的制造方法是先用有机溶剂从石墨蒸发的烟尘中溶出C60 ,再用色谱法将其精制分离。为降低成本,希望研究利用有机溶剂溶解度设计新的精制方法。因此,人们对C60在各种有机溶剂中的溶解度以及C60溶液的热力学性质颇为关心。Murray1和 Marcus2等曾用多变量分析寻找溶剂的结构参数和C60溶解度的对应关系。虽能得到一些经验规律,但根据近年实验结果,多数溶剂和C60能形成不同化学配比的化合物,许多实测的溶解度数据,其实并不是以C60本身为平衡相,而是以各种配比的溶剂化合物(例如C60.4C6H6 , C60.C5H12等)为平衡相的溶解度。以不同固相为平衡相的溶解度数据合在一起总结规律,在理论上很难自圆其说。因此Korobov指出3:应根据C60和溶剂相互作用的热力学数据,将实测溶解度数据换算成以C60本身为平衡相的“推算溶解度”(hypothetical solubility)。并列出了一批C60在 已知热力学数据的溶剂中的“推算溶解度”。可通过多变量分析寻求“推算溶解度”和溶剂的物理化学参数的关系。鉴于已知“推算溶解度”的溶剂种类不多,此处的多变量分析是小样本集的数据挖掘课题4。用支持向量机算法5-10总结规律可能有好处。本文报导我们这方面的研究结果。若干“推算溶解度”的数据如表1所示。表中x为实测溶解度,x为C60的“推算溶解度”(均为摩尔分数),G0 溶剂化合物的分解自由能(单位:KJ/mol)。表1 C60在若干有机溶剂中的“推算溶解度”Table 1 The “hypothetical solubility” of C60 in some organic solvents溶剂298K平衡相成分G0104 x104x苯甲苯邻二甲苯间二甲苯溴苯邻二氯苯间二氯苯庚烷辛烷1:4C601:21:21:21:21:21:11:13.02.32.36.21.44.20.63.92.04.214.23.64.438.33.80.0980.0456.04.237.710.454.668.319.70.120.222模型和计算方法C60 在有机溶剂中的溶液,属于非电解质溶液范畴,其溶解度和溶液热力学性质应主要与溶质和溶剂的分子间作用势有关。因此,我们仍试用Murray和Marcus采用过的溶剂的分子参数和反映分子特征的物性参数作为自变量,用数据挖掘算法考察这些参数和“推算溶解度”的关系。这些参数是 相对介电常数e、溶解度参数d、表面张力g、极性/极化率比p、偶极矩m、极性参数Et,有关溶剂的上述参数列于表2。表 2 有关有机溶剂的若干分子参数Table 2 Some molecular parameters of relevant organic solvents溶剂edgpmEt苯甲苯邻二甲苯间二甲苯溴苯邻二氯苯间二氯苯庚烷辛烷2.272.382.572.375.409.935.041.921.9518.818.818.018.020.220.520.015.215.528.227.929.528.135.536.235.519.721.20.550.490.510.470.770.770.65-0.060.0100.310.450.301.562.501.540034.333.934.734.636.638.036.731.131.1将表1列出的“推算溶解度”为目标值,上述六个参数为自变量组成数据文件,作支持向量回归计算。3计算结果: 用留一法按预报平均偏差最小为判据,选择回归用核函数及计算参数。计算表明:用内积核函数:y = q =1, e = 0.05 时预报误差最小。根据留一法判据筛选自变量,证明由相对介电常数,溶解度参数,偶极距三个自变量组成的数据文件预报能力最强,回归方程为:104x= 3.12 + 1.41 + 13.98 25.58参 考 文 献1 Murray J S., Gagarin S G., Politzer P.: Representation of C60 solubility in terms of computed molecular surface electrostatic potentials and areas。 J. Phys. Chem., 1995, 99 : 120812 Marcus Y.: Solubilities of buckminsterfullerene and sulfur hexaflouride in various solvents。 J. Phys. Chem., B., 1997, 101 : 86173 Korobov M V., Smith A L.: “solubility of the fullerenes”, paper in“Fullerenes, Chemistry, Physics and Technology”, New York: John Wiley and Sons, Inc., 2000.4 陈念贻,钦佩,陈瑞亮,陆文聪,模式识别在化学化工中的应用,北京,科学出版社,20005 Vapnik Vladimir N., The Nature of Statistical Learning Theory. Berlin, Springer, 19956 Wan, Vincent; Campbell, William M., Support vector machines for speaker verification and identification, Neural Networks for Signal Processing - Proceedings of the IEEE Workshop 2, 2000:775-7847 Thorsten Joachims, Learning to Classify Text Using Support Vector Machines. Dissertation, Universitaet Dortmund, February 2001. 8 Burbidge R, Trotter M, Buxton B, Holden S, Drug design by machine learning: suppor

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论