




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第15卷 第4期 1998年7月28日 计算机与应用化学 Computers and Applied Chem istry Vol 15 No 4 July 1998 综述 化学结构的计算机处理 III 立体化学的贮存与检索 姚建华 中国科学院上海有机化学研究所 中国科学院计算机化学开放实验室 上海 200032 摘 要 目前应用最广泛的基于连接表的化学结构表述方法本质上只适于表述分子的拓扑 即只 能考虑分子结构中原子间的连接关系 而不能描述它们在空间中的排布 然而 两个具有相同原子 拓扑的分子 在三维空间中的真实结构可能是不相同的 其性质也不尽相同 这种现象被称为分子 结构的立体化学 实用的计算机化学结构描述方法必须能处理立体化学 本文简要地综述了基于连 接表的手性中心和双键立体化学的描述方法 关键词 C IP约定 手性标记 组成化学 立体化学 中图号 TP 319 O 641 6 O 641 6 COM PUTER HANDL ING OF CHEM ICAL STRUCTURES III The Storage of Stereochem istry of Chem ical Structures in Computer YAO Jian hua L aboratory of Computer Chem istry S hanghai Institute of O rganic Chem istry Chinese A cademy of S ciences S hanghai 200032 ABSTRACT The most w idely used representation of chem ical structureswhich isbased on connec2 tion table is essentially only suitable to describe thetopology ofmolecules i e it only can represent the bondings between the atom s in amolecule rather than their spatial arrangements topography However two molecules which have exactly the same topology can have different real structures in 3D space and their properties can be different also This phenomenon is called stereochem istry Accordingly a practical computer representation system of chem ical structures should be able to handling stereochem istry The present paper review s the methods used in connection table for the presentation of stereochem istry particularly for the chiral carbons and double bonds KEY WORDS C IP convention Designation of chirality Constitutional chem istry Stereochem istry 收稿日期 1997 10 09 国家计委 九五 攻关 国家自然科学基金 编号 29273148 29573148 中法先进研究计划 编号 PRA M 95 01 资助项目 姚建华 女 助理研究员 计算机化学专业 适于计算机使用的基于连接表的化学结构表述方法本质上只能表述分子的拓扑 这种只 考虑分子结构中原子间的 拓扑 连接关系 而不管它们在空间中排布的化学常称为组成化学 Constitutional chem istry 分子的这种拓扑结构也称为组成结构 Constitutional structure 然而 两个具有相同原子拓扑的分子 在三维空间中的真实结构可能是不相同的 其性质也不 尽相同 而且只有切断某些键再重组才能互相转换 这种分子中原子间有相同拓扑 但在三维 空间中却有不同排布的现象被称分子结构的立体化学 图1中圈起来的部分就是可能有不同 立体化学的原子或键的位置 常称立体化这中心 因此 只描述分子结构的拓扑是不够的 图1 一个带立体化学的结构图 Fig 1 A structure w ith stereochem istry 在本质上只能表述分子二维结构的方法中加入能 在某种程度上反映分子三维结构的信息是必须的 简言之 为了能处理立体化学 必须在连接表中加 入能区分立体异构体的数据项 立体化学常被分为构型立体化学和构象立体 化学两种 本文将要讨论构型立体化学中最重要的 手性中和双键立体化学的计算机处理 其他形式的 立体化学处理方法 有兴趣的读者可阅读有关参考文献 目前描述分子拓扑结构用得最多的连接表有两种 每个键在连接表中出现两次的冗余连 接表和只出现一次的非冗余 单向 连接表 通常 在冗余连接表中原子出现的次序是任意的 而在非冗连接表中 其出现次序一般取决于所采用的规范化学算法 因此 难以在连接表中直 接用原子的序号来表示它们围绕立体化学中心的位置 为了能在只能表示分子拓扑的连 图2 不对称四面体碳原子周围的24种可能排布 Fig 2 The 24 possible permutations of four neighbours of a tetrahedral carbon atom 接表中表述分子的立体化学 必须 另外加入能表示原子围绕立体化 学中心的排布方式 几何位置 的 原子次序 对周围连有4个不同配体的 四面体碳原子而言 可有4 种即 24种不同的排布方式 当我们分别 用a b c d代表四面体碳原子的 4个不同配体方向 用1 2 3 4 分别表示4种不同的配体时 可穷 尽列举这24种结合方式如图2 由于碳原子与4个配体以四 面体几何取向组成分子时所具有 的对称性 24种置换方式实际上只 构成了两种不同的空间排布 化学 中称为构型 Configuration 图2 中R和S列分别表明了这两种空 间排布中所包含的等同标号方式 在属于每一种构型的标号方式中 任意一对数字对换偶数次 后 将产生在同组能找到的数字串 即属同一构型 当对换奇数次后 将产生在另一组能找到的 491计算机与应用化学15卷 数字串 即属另一种构型 记住这一特性十分重要 因为它被用于在连接表中标识分子结构中 手性碳上的立体化学 1 表示手性原子立体化学C IP的约定 为了表示分子结构中手性碳原子的立体化学 Cahn Ingold Prelog 1 首先在50年代提 出了一种标记方式 在60和80年代又做了某些修改 这个标记法常称为C IP约定 这一约定 的基本思想是首先要建立一套能确定配体优先次序的规则 C IP规则 有了配体的优先次序 后 配体在空间中的构型就可以用它们优先次序的排布方式表示 设不对称中心碳原子周围的4个配体a b c d的C IP优先次序分别为1 2 3和4 C IP约定的构型确定方式如下 从优先级最低的配体d的反方向看过去 如a b c三个配体 的排列呈顺时针方向 称R构型 如果呈逆时针方向 称S构型 见图 3 图3 RS构型的定义法 Fig 3 Definitions of RS configurations C IP约定中配体的优先规则原则上是基于配体中与不对称中心碳原子相连原子的原子量 的大小 原子量大的优先 假如两个原子的原子量大小一样而无法区分时 要一层一层比较更 外层的原子 直到能区分为止 对双键和叁键则要拆成单键来比较 对同位素也是质量重的优 先 因此 图3中左边的是R构型 右边的是S构型 对由偶数个连续双键 A llenes化合物 的伪四面体 Pseudo tetrahedron 的立体化学也 可用RS来表示 参见图 4 具体方法是从连续双键的任一端向另一端看过去 并假定近处的 配体优先于远处的 然后检查最优先的三个配体a b c的排列 如果是顺时针为R构型 如 果是逆时针则为S构型 2 图4 偶数个连续双键 A llenes化合物 的绝对构型用RS标记法示例 Fig 4 The designation of the absolute configuration of the chiral axis of the di methylallene using the RS convention 2 双键立体化学的EZ约定 尽管以前常用顺式和反式来表示双键的立体化学 但当双键上有叁取代时会有歧义 而四 取代时会不实用 因此对abC Ccd类化学结构引入了基于次序规则的新的一套命名法 当 a优先于b c优先于d时 a 和c处于顺式时 构型就为seqcis 用Z 德文Zusammen 即在一 5914期姚建华 化学结构的计算机处理 III 立体化学的贮存与检索 起 来标记 如果a和c处于反式时 构型就为seqtrans 用E 德文Entgegen 即相对 来标记 3 结构连接表中的立体化学表示 最早在结构连接表中引入立体化学信息的可能是美国化学文摘社 CA S 的Petrarca L ynch和Rush 3 他们的工作与美国专利局的M cDonnell 和Pasternack 4 为了使Hayw ard 线 性码能描述配位化合物的立体化学所提出的方法相类似 Petrarca等简单地采用M organ算 法排序得到的序号 以下简称M organ序号 作为配体的优先次序 在连接表的最后附上一由4 个整型量作为不对称碳原子的立体化学描述符 4个整型量中按优先次序分别记录对应配体 原子的M organ序号 他们称这种标记法为 Y 和 Z 然而 由于 Y 和 Z 与已在化 学界广泛使用的 R 和 S 标记无简单的对应关系 5 因此不为大家所采用 他们也把类似 的方法应用于表示双键的立体化学 Petrarca和Rush 6 又将这个原理扩展到平面和八面体几 何关系中 由于多种原因这些方法从来未被CA S实际采用过 CA S一直沿用文字描述符 7 直至近年来才采用W ipke 8 等使用的奇偶标记法 4 SEMA命名和MDL格式 尽管Petrarca等发展的基于连接表的立体化学表述方法未被CA S所采用 但在70年代 初由W ipke和Dyott在SECS Si mulation and Evaluation of Chem ical Synthesis 8 程序中发 展成为SEMA Stereochem ical ExtendedM organ A lgorithm 命名 此后 SECS成功地衍生 出了结构数据库MACCS和反应数据库RACCS这两个MDL M olecular Design L td 的发 家产品 它们所采用的结构和反应数据格式即现常称的MDL格式 MOL文件 也是当前计 算机化学界常用格式之一 SEMA命名实际上是分子中原子用M organ序号标记的一个看作单个字符串的高度紧凑 的无冗余分子结构连接表 在一定意义上它又是一个无歧义的结构唯一表述符 同时又能方便 地扩展为计算机内常用的冗余连接表 SEMA命名 或MDL格式 中 立体化学中心是用其 奇偶 Parity 值表示的 奇偶值的确定方法是 先把立体化学中心周围配体原子用它们的M or2 gan序号代表 然后把它们按C IP规则确定的优先次序由高到低排列成一序列 再交换这个序 列中的M organ序号使得它们成单调上升 如果须作偶数次交换 包括零次 记为2 如果须作 奇数次交换 记为1 0用以表示无立体化学 3用于标记立体化学中心的构型不清楚 每个原 子的奇偶值表附于无立体化学的紧凑连接表之后 就可使分子中不对称中心的立体化学得以 表示 同样 对双键 包括奇数个连续双键 的立体化学也可用奇偶值来表示 由奇偶值的定义可见 它们与RS标记一般说来并无一个简单的对应关系 只有当配体原 子的C IP优先次序 由高到低 的序列与M organ序号由大到小的序列相一致时 才有偶数相 当于R构型 奇数相当于S构型 显然 一般情况下 由立体化学的奇偶性返回C IP的RS标记 时 还须知道周围配体原子由C IP规则确定的优先次序 一种可能的转换步聚如下 第一步 将配体原子的M organ序号由大到小排列 得第一个序列 第二步 如果立体化学中心为奇值时 将上述序列中某两个序号交换一次 第三步 用配体原子所对应的C IP优先次序代替对应的M organ序号 得第二个序列 第四步 不断交换第二个序列中C IP优先次序代表的配体原子的位置 使得所代表的配体原 子的C IP优先次序成由高到低排列 并记下交换的次数 第五步 如果交换次数为偶数 构型为 R 奇数时为S构型 691计算机与应用化学15卷 类似地 由双键的奇偶值和每一端取代基的C IP次序可得到双键的E或Z构型 第一步 将双键每端取代基的标号由小到大排列 第二步 如果双键立体化学为奇数 交换任意两个取代基标号的位置 得第一个序列 第三步 用相应的C IP优先次序取代上述序列中的取代基序号 得第二个序列 第四步 交换上述序列中C IP优先次序代表的取代基的位置 使得成由高到低排列 记下交换 次数 第五步 假如交换次数为偶数时 双键为E构型 奇数时为Z构型 5 DARC系统中的构型表示法 9 在DARC系统中不对称 手性中心 的立体化学是通过有向环境来描述的 有向环境的表 述尽管比较严密 但十分繁琐 限于篇幅不做详细介绍 仅说明DARC标记手性中心的概要 首先将不对称中心看成中心 FO 对其4个配体应用DARC优先规则可确定它们的序号分 图5 DARC系统中不对称中心的 HT 标记判别法 Fig 5 The designation of HT for an asymmetirc center in DARC system 别为A1 A2 A3和A4 然后从A4方向看过去 检查A1 A2 A3所形成的旋转方向 如果 呈顺时 针方向 则记为 H 否则记为 T 参见图5 可见观 察方向正好与C IP规则相反 但由于A1 A2 A3 和A4的DARC优先规则与C IP的配体优先则无 任何对应关系 因此 DARC标记与 RS 标记之 间也无任何规则可循 它们之间的相互转换是困 难的 在带立体化学的DARC码中 预定义成H标记优先于T标记 因此 先手性 Prochiral 中心总是选择H标记 如图6中化合物 不计立体化学时两个Cl原子无法区分它们的先后次 序 当计立体化学时 则与箭头键相连的Cl原子就优先于虚线键相连的Cl原子 因为此时不 对称中心呈H 图6 DARC系统中先手性中心用 H 标记 Fig 6 The designation of H for the prochiral center in DARC system 6 DU 模型中的立体化学表示法 面向处理化学反应的DU 模型 10 是用一个称为键电子 BE 矩阵的方阵来表示组成 结构的 组成结构的BE 矩阵实际上是显式表示氢原子的连接矩阵 主对角线上的元素用来 表示对应的原子核心上未配对价电子的数目 非对角线上的第i j个元素原子i和原子j之间 的形式键级 由此可用图7所示的BE 矩阵表示甲醛 第i行 或列 上所有元素的加和表示 了原子i上的价电子数目 BE 矩阵和连接表表述法同样只能代表分子 群 的拓扑 组成化学 而不能表达分子 群 的立体化学 为解决这一问题 Gruber 11 引入了原子的构型位置 将BE 矩阵扩展为能 表达立体化学的XBE 矩阵 在BE 矩阵中每个原子只用一行 列来表示 而在XBE 矩阵 7914期姚建华 化学结构的计算机处理 III 立体化学的贮存与检索 中 每一行 列代表了原子作为中心原子时的配位方向 构型位置 例如 碳原子要用4个行 列来表示 氧用2个 氢用1个 如图所示是包括碳和氧原子构型的甲醛XBE 矩阵 图7 甲醛的BE 矩阵来表示法 Fig 7 BE matrix for formaldehyde 图8 甲醛的立体化学XBE 矩阵 图中 3 表示此位置有共价键 Fig 8 Stereochem ical XBE matrix for formaldehyde 3 covalent bond 7 讨论 D ietz 12 将传统的立体化学标记方法分为两类 1 用RS ZE C IS TRAN S exo endo等 标记的面向命名的方法 2 将配体键接中心原子的空间排布方式构成模板 用与立体化学中 心匹配的模板来标记的模板法 这两种方法都有缺点 面向命名的方法在对完整结构中的立体化学中心进行标记不会产 生问题 但对不完整结构 在计算机化学中常称为子结构 就不行 例如 对C IP标记 当不对 称中心的某个配体未知时 由于无法确定配体间的优先次序而不能使用 因此 图9中的结构 代表不同的构型 但当我们不知道R1和R2是什么的时候 我们就无法确定4个配体间的优先 次序 从而也就无法获得它的C IP标记 因此 这类方法产生的立体化学标记无法用于结构检 索 图9 子结构中不对称中心的构型标记的困难 Fig 9 Difficulties in designation of asymmetric center in substructures 模板法的缺点是配体在不对称中心周围的排布方式难于有一个唯一描述方式 例如 图2 中的不对称中心 每个构型都有12种描述方式 因此 为了使标记实用 就必须预先将各种可 能的排布方式都定义为模板 或从等价的空间排布中选择一种称为 规范化 模板 前述的奇偶 法就属于这种方法 采用这种方法时 为了确定某个不对称中心是否与某个模板相匹配 就必 须对不对称中心的排布作等同置换 直到与某个规范化模板相匹配 因此这两种方法都不理 想 模板法的另一个缺点是每发现一种新的立体化学方式 就必须扩展模板库 这也会带来诸 多不便 因此可以说 如果要在不完整结构 子结构 的存储和检索中使用立体化学 并无一个简 便的解决办法 目前使用的方法或多或少都有其不足 最近 D ietz 12 提出了一种叶轮 Paddle w heel 标记法 但由于它过于繁琐而难于为大家所接受 相比之下 用分子中原子在三维空间 中的坐标和辅以计算机图示分子模型来表示分子结构中的立体化学可能更为直观 而且可以 891计算机与应用化学15卷 任意地旋转 平移 局部放大等 特别是随着网络三维技术的飞速发展与普及 例如 VRML V irtual RealityM odeling L anguage 13 的兴起和三维结构检索技术的进步 已使三维分子模 型可以象文字一样方便地被传输 检索和显示 这将进一步促进三维分子图形技术在处理立体 化学中的应用 但是 三维分子图形也会给习惯于传统表示法的人以某种失落感 他们往往仍 会问起这个不对称中心是 R 还是 S 能否有更好的立体化学标记方式 仍须计算机化学界 同仁的共同努力 致谢 袁身刚教授为本文提供了许多有价值的素材 并为文章的写作给予了很大的帮助 谨在此致以衷心的感谢 参考文献 1 a Cahn R S Ingold C K Prelog V Specification of molecular chirality Angew Chm Int Ed Engl 1966 5 385 415 b PrelogV Helmchen G Basic principles of the C IP system and proposals for a revision Angew Chm Int Ed Engl 1982 21 567 583 2 Stoddart J F Stereochem istry Hydrocarbons Halo Compounds Oxygen Compounds Comprehensive O rganic Chem2 istry Vol 1 The Synthesis and Reactions of O rganic Compounds Oxford Pergamon Press 1979 3 Petrarca A E Lynch M F Rush J E A method for generating unique computer representations of stereoisomers J Chem Doc 1967 7 154 164 4 M cDonnell P M Pasternack R F A line formula notation system for coordination compounds J Chem Doc 1965 5 56 59 5 Barnard J M Cook A P F Rohde B Storage and searching of stereochem istry in substructure search system s Bawden D andM itchell E M ed Chem ical Information System s Beyond the Structure Diagram New York Ellis Horrid 1990 6 Petrarca A E Rush J E M ethods for computer generation of unique configurational descriptors for stereoisomeric square Planar and octahedral complexes J Chem Doc 1969 9 32 37 7 Stouw G G V Poster session potential enhancements to the CAS chem ical registry system in Chem ical Structures The InternationalLanguage of Chem istry W arrW A ed Heidelberg Springer Verlag 1988 221 226 8 W ipkeW T Dyott T A M Stereochem ically unique nam ing algorithm J Am Chem Soc 1974 96 4834 4842 9 D
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年特种作业类危险化学品安全作业胺基化工艺作业-氯碱电解工艺作业参考题库含答案解析
- 2024-2025学年高一下学期化学期中模拟卷一含答案解析
- 2025年特种作业类危险化学品安全作业氟化工艺作业-裂解(裂化)工艺作业参考题库含答案解析
- 布施健康知识培训内容课件
- 南和五年级期末数学试卷
- 乐清乐成一中数学试卷
- 南宁重点小升初数学试卷
- 2025年学历类自考公共课计算机应用基础-英语(二)参考题库含答案解析
- 莆田中考1检数学试卷
- 2025年学历类自考专业(电子商务)互联网数据库-电子商务案例分析参考题库含答案解析
- 注重整体强化联系提高质量(西南师大李忠如)
- NB-T 33025-2020 电动汽车快速更换电池箱通.用要求
- JT-T-864-2013吸油拖栏行业标准
- 广东省深圳市2022-2023学年八年级下学期英语期末试卷(含答案)
- DB32-T 1510-2015升降作业平台检验规则
- 知识题库-人社劳动知识竞赛测试题及答案(十三)
- 读书分享交流《爱心与教育》课件
- 新手直播方案
- 消毒隔离技术
- 符合RBT214-2017防雷装置检测机构质量手册+检测作业指导书2021首版
- 6S证据资源金字塔模型
评论
0/150
提交评论