




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、虚拟筛选实例分析虚拟筛选实例分析主要内容主要内容1、对接理论部分a/ 分子对接介绍。b/ 靶点的选择、结合位点的确认;c/ 虚拟筛选的一般流程;2、对接实战部分a/ 小分子数据库的建设;b/软件AutoDock Vina的介绍;c/ 实例演示。获得受体PDB文件和3D小分子数据库;受体对接前处理;受体结合位点的确定;晶格的生成;对接操作;结果查看与软件分析(蛋白文件准备、小分子文件准备、建盒子、对接)3、后续分析流程常用的后续小分子分析方法介绍;2虚拟筛选3是计算机辅助药物设计的核心技术之一。狭义上讲,基于分子对接的数据库搜索方法称为虚拟筛选。广义地讲,只要是基于某种问题形式的数据库筛选方法都
2、可以称为虚拟筛选。虚拟筛选的目标是从几十到上百万个分子中,发现具成药性的先导化合物,降低实验筛选化合物数量,缩短研究周期,节约研究经费。虚拟筛选基本方法4LBVSSBVSLBVS 是根据已知药物活性的一系列化合物的结构、理化性质与生物活性的分析,建立合适的查询结构,进而进行小分子库的搜索,如基于药效团模型的虚拟筛选。基于药效团模型的虚拟筛选是应用最多的 LBVS 方法之一。SBVS 主要是指基于分子对接的虚拟筛选方法。虚拟筛选方法可分为基于配体结构的虚拟筛选(1igand-based virtual screening,LBVS)和基于受体的虚拟筛选(structure-based virtu
3、al screening,SBVS)两种形式。5 分子对接的最初思想起源于Fisher E提出的“锁和钥匙模型”。即受体与配体的相互识别首要条件是空间结构的匹配。 配体配体 受体受体 复合物复合物 受体配体的锁和钥匙模型受体配体的锁和钥匙模型 分子对接6perfect match! 这类方法首先要建立大量化合物(例如几十至上百万个化合物)的三维结构数据库,然后将库中的分子逐一与靶标分子进行“对接”(docking),通过不断优化小分子化合物的位置(取向)以及分子内部柔性键的二面角(构象),寻找小分子化合物与靶标大分子作用的最佳构象,计算其相互作用及结合能。在库中所有分子均完成了对接计算之后,即
4、可从中找出与靶标分子结合的最佳分子(前50或前100名) 分子对接的基本方法(1)刚体对接:指在对接过程中,研究体系(受体和配体)的构象不发生变化。适合考察比较大的体系,如蛋白质和蛋白质间以及蛋白质和核酸之间的对接。(2)半柔性对接:指在对接过程中,研究体系尤其是配体的构象允许在一定的范围内变化。适合处理大分子和小分子间的对接,对接过程中,小分子的构象一般是可以变化的,但大分子是刚性的。(3)柔性对接:指在对接过程中,研究体系的构象基本上可以自由变化的。一般用于精确考虑分子间的识别情况。由于计算过程中体系的构象可以变化,所以计算耗费最大。78虚拟筛选流程9(A) 准备工作准备工作蛋白靶标蛋白靶
5、标化合物数据库化合物数据库分子对接分子对接结果(B) 虚拟筛选虚拟筛选 对接软件:Autodock vina、Gold, Dock, Discover studio等。化合物数据库:pdbqt格式 2D-3D 软件openbabel蛋白靶标:来源PDB数据库 结构分析软件MGLTOOLS 化合物数据库10 PubChem()是由美国国家卫生研究所(NIH)建立的关于小分子生物活性的公共数据库.11PubChemPcsubstance contains about 120 million records. Pccompound cont
6、ains nearly 48 million unique structures. PCBioAssay contains more than 717,000 BioAssays. 支持文本检索和结构检索PubChem 检索可得到的结果包含了分子式、SMILES、2D 和3D 结构、InChI 和InChIKey、相对分子质量、脂水分配系数、氢键受体和供体数目、可旋转键数目、互变异构体数目等基本的结构信息和物化性质,除此以外,还有该化合物作为药物的剂型和商品信息、药理性质、毒性、生物活性检测等信息,并通过文献分类副标题可以查看相关文献。12DrugBankDrugBank(http:/www.
7、drugbank.ca)是1 个包含药物的结构、药效、作用靶标等信息的综合数据库,是由Alberta 大学计算机科学和生物学系的David Wishart 博士最初建立的。13u主要应用于计算机辅助的药物靶标的发现、药物设计、药物分子对接或筛选、药物活性和作用预测等方面。u迄今,drugbank包含了6811种药物,1528 种FDA批准的小分子药物,150种FDA批准的生物技术药,87 种营养药和5080种实验药。u每一种药物都有一个drugcard,每个drugcard包含150种数据字段,其中一半描述了药物信息,另外一半描述了药物靶标信息。药物信息包括了该药物的CAS 号、商品名、分子式
8、、分子量、SMILES、2D 和3D 结构、logP、logS、pKa、熔点、吸收性、Caco-2 细胞穿透性、药物类别和临床使用、性质描述、剂型与给药途径、半衰期、体内的生物转化、毒性、作用于哪些生物体、食物对服用的影响、与其它药物的相互作用、作用机理、代谢途径、药理学特征、与蛋白质的结合情况、溶解度、物质形态、同义词、关于合成的相关文献等,还与ChEBI、GenBank、PubChem 等外部数据库有链接。14ZINCl包含2000多万个化合物分子,适用于虚拟筛选。通过ZINC id、SMILES格式等进行检索,检索结果中给出了化合物的结构,一些化合物的重要性质,包括xlogP,溶解度,氢
9、键给体和受体数目等,以及二维和三维结构,供应商信息。用户可以自行绘制或输入分子的SMILES 字符串来上传待检索的分子,同时,还可以限定净电荷量、xLogP、可旋转键数、氢键供体和受体数等参数范围。库中的分子结构均可被免费下载,支持SMILES、mol2、 3D SDF 和DOCK flexibase 格式,并且,化合物的相关信息可以以表格形式下载,便于用户使用。15lZINC () ZINC 数据库() 是免费的用于虚拟筛选的化合物数据库,由美国加州大学药物化学系的Shoichet 教授实验室建立并维护。
10、其口号就是“ZINC is not commercial”。为了方便虚拟筛选和分子对接的研究者而设计的小分子数据库。eMolecules该数据库可以通过结构搜索和文本检索获得结果,前者包括子结构检索和精确检索,后者包括化合物名称、CAS 号和SMILES,支持SDF 文件上传,以及多个化合物批量查找。结果信息中包括化合物的分子式、CAS 号、分子量、logP 值、SMILES 等,并列出了供应商的链接,建立起买卖之间的桥梁,方便购买。16l eMolecules (http:/ eMolecules 是eMolecules.Inc 于2005 年创建的关于商购化合物的数据库。其提出的口号是“使
11、购买化合物像买书一样简单”。17DatabaseDescriptionPubChemPubChem is a database of chemical molecules which maintains three types of information namely, substance, compound and BioAssays.ZINCZINC database contains 21 million compounds available for virtual screening. In this database various molecule features like
12、molecular weight, logP etc are included.ChEMBLThis database provides comprehensive information about 1 million bioactive (small drug-like molecules) compounds with 8200 drug targets.NCINCI database had more than 275,000 small molecules structures, a very useful resource for researchers working in th
13、e filled of cancer/AIDS.ChemDBIt is a databse of five million chemicals which contains information of chemicals that includes predicted or experimentally determined physicochemical properties, such as 3D structure, melting temperature and solubility.ChemSpiderChemSpider contains more than 28 million
14、 unique chemical entities aggregated from more than 400 diverse data sources.BindingDBIt is a binding affinity database of small molecules which contains 910,836 binding data, for 6,263 protein targets and 378,980 small molecules.PDB-BindIt is a collection of binding affinities for protein-ligand co
15、mplexes with known three-dimensional structures. It contains 5671 protein-ligand complexes.PDBeChemIt provides comprehensive information of ligands, small molecules and monomers. Presently it consists 15502 ligands.KEGGIt is a database resource that integrates genomic, chemical and systemic function
16、al information.HMDBA database containing detailed information about small molecule metabolites found in the human body.SMPDBIt is Small molecule Pathway database that containing more than 350 small-molecule pathways found in humans.BIAdbIt is a comprehensive database of benzylisoquinoline alkaloids
17、which contains information about 846 unique benzylisoquinoline alkaloids.DrugBankThe database that combines detailed drug (i.e. chemical, pharmacological and pharmaceutical) data with comprehensive drug target (i.e. sequence, structure, and pathway) information. The database contains 6712 drug entri
18、es including 1448 FDA-approved small molecule drugs, 131 FDA-approved biotech (protein/peptide) drugs, 85 nutraceuticals and 5080 experimental drugs.HITHIT is a comprehensive database for protein targets for FDA-approved drugs as well as the promising precursors. It currently contains about 1,301 kn
19、own protein targets(221 proteins are described as direct targets).SuperNaturalA freely available database of approximately 50,000 natural compounds.NPACTIt contains experimentally validated plant-derived natural compounds exhibiting anti-cancerous activity. Currently it contains 1574 compound entrie
20、s.TTDThis database provide information about the known and explored therapeutic protein and nucleic acid targets, the targeted disease, pathway information and the corresponding drugs directed at each of these targets.PharmaGKBIt is a pharmacogenomics knowledge resource that encompasses clinical inf
21、ormation of drug molecules.SuperDrugThis database contains approximately 2500 3D-structures of active ingredients of essential marketed drugs.化合物类药性相关参数范围参数参数最小值最小值最大值最大值LOGP-25分子量200500氢键给体05氢键受体010摩尔折射率40130旋转键数目010重原子数目2070极性表面积0120电荷-2218构建个性化的化合物数据库小分子结构信息 化学分子结构的层次 1D:CH3CHO 2D: 3D:19一维形式 SMIL
22、ES格式简化分子线性输入规范(英文:Simplified molecular input line entry specification,简称SMILES),是一种用ASCII字符串明确描述分子结构的规范。SMILES用一串字符来描述一个三维化学结构,将化学结构转化成一个生成树,采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环打开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。20 原子:方括号内的化学元素符号表示。例如Au表示“金”。有机物中的C、N、O、P、S、Br、Cl、I等原子可以省略方括
23、号,其他元素必须包括在方括号之内。 氢原子常被省略。对于省略了方括号的原子,用氢原子补足价数。例如,水的SMILES就是O,乙醇是CCO。 离子用方括号括起,用元素符号和电荷表示,+表示正电荷、-表示负电荷,电荷数跟在正负号之后。如果该原子与氢原子相连,氢原子写在元素符号后面。例如,四价钛离子 (Ti4+) 写作 Ti+4 或 Ti+ 。三价钴离子(Co3+) 写作 Co+3 或 Co+ 。氢氧根 (OH-) 表示为 OH- ,水合氢离子 (H3O+) 表示为 OH3+ 。21 化学键:双键用“=”表示;三键用“#”表示。例如,含有双键的二氧化碳则表示为O=C=O,含有三键的氰化氢表示为C#N
24、。 环:如果结构中有环,则要打开。断开处的两个原子用同一个数字标记,表示原子间有键相连。例如,环己烷(C6H12)表示为C1CCCCC1。芳环中的C、O、S、N原子分别用用小写字母c,o,s,n表示。如苯表示为 c1ccccc1。 支链:碳链上的分支用圆括号表示。例如丙酸表示为CCC(=O)O,FC(F)F或者C(F)(F)F表示三氟甲烷。22l 立体化学:用/ 和表示双键顺反异构;对映异构:手性原子用 表示,表示反时针,表示顺时针:化合物化合物SMILES反式二溴甲烷 Br/C=C/Br 或BrC=CBr顺式二溴甲烷 BrC=C/Br 或Br/C=CBrL-丙氨酸 NCH(C)C(=O)OD
25、-丙氨酸 NCH(C)C(=O)O23二维形式 用图表示24 用矩阵表示三维形式 坐标法用坐标直接存储每个原子的三维坐标(x,y,z)25分子存储格式及其相互转换存储格式:Mol2、pdb、pdbqt、sdf、smiles、mdl等基本存储:分子的元素组成、原子坐标、原子连接关系还能存储:分子子结构信息,能适用于生物大分子原子电荷信息,调用时不必再计算确定特定原子化学环境的原子类型信息26不同的化学文件格式用来表示不同的化合物结构信息,不同的应用软件需要不同格式的化学格式,因此需要对化合物格式进行进一步转换才能进行后续的工作。27化合物格式转换软件:Open Babel下载:http:/ope
26、/wiki/Main_Page运行环境:Windows, Linux and MacintoshOpenbabel是一个免费开源的软件,用于转换不同的分子文件格式,能够识别100多种分子文件格式。282930Mol2格式openbabelpdbqt格式obabel -imol2 ./zinc_20031600.mol2 -opdbqt -O ./zinc_20031600.pdbqt31zinc_20031600.mol2zinc_20031600.pdbqt药物作用靶标确定 基于靶标三维结构的分子对接方法搜寻小分子数据库,依据靶标结构,在已知的三维数据库中进行搜寻,从而找
27、到与之结构和性质互补的配体。 从与生物活性有关的靶点入手,阐明靶点的功能、三维结构、内源性配体或天然产物的化学结构特征,以计算机辅助展示这些物质的结合位点,然后用各种方法得到选择性作于该部位的配体分子。 结合位点的确定是基于受体蛋白与小分子配体的互补结合,包括空间互补及疏水作用、离子键、氢键、电荷转移等作用。32蛋白质靶标 靶标选择:/pdb/home/home.do MGLTOOLS分析:33pdbqtpdbqt格式的格式的proteinprotein文件准备文件准备: File-read molecule Edit-Hydrogensadd: polar
28、 only ok 1Add Hydrogen: Edit-Hydrogens-Add: non-protein need add “all hydrogens”. Protein need add “Polar only”. 2Delete atoms or molecule: Select-Select From String: Then click “Add”, then click “Dismiss”. Then: Edit-Delete-Delete AtomSet-Continue To display the molecule surface with selection Grid
29、-macromolecule-chose-Select Molecule-save *.pdbqt file 34We have to choose the part for docking! 1. Set the Center Grid Box. (The values need to be remembered). 2. Set the Spacing (angstrom) as 1.000. 3. Set up the number of points in x,y,z-dimension. (The values need to be remembered for docking pr
30、ocess). 35vinavina筛选中的配置文件筛选中的配置文件:建立一个文本文件,把设置的值记录下来分子对接软件36Autodock软件介绍AutoDock AutoDock AutoDockAutoDock是分子对接的工具。当前的版本包括是分子对接的工具。当前的版本包括AutoDock 4 AutoDock 4 和和 AutoDock AutoDock VinaVina。AutoDock AutoDock 4 4主要包括主要包括2 2个主程序:个主程序: autodockautodock和和autogrid autogrid 。其中其中 AutoGrid AutoGrid 主要负责格点
31、中相关主要负责格点中相关能量的计算,而能量的计算,而 AutoDock AutoDock 则负责构象搜索及评则负责构象搜索及评价价。AutoDock vinaAutoDock vina用于分子对接、虚拟筛选,多核运用于分子对接、虚拟筛选,多核运行,性能高,准确率高,易应用。行,性能高,准确率高,易应用。37AutoDock Vina 1.1.2vina -receptor *.pdbqt -ligand *.pdbqt -out *.pdbqt -log *.log -config conf 382002年11月中国广东省发现第一例非典型性肺炎病例,世界卫生组织将其命名为严重急性呼吸道综合征(SARS),SARS的病原体为一种新的冠状病毒-SARS-Cov。SARS-Cov 感染宿主细胞起重要作用的结构蛋白: E蛋白(small envelope protein,小信封蛋白) S蛋白(spike glycoprotein,刺突糖蛋白) M蛋白(membrane protein,膜蛋白) N蛋白(nucleocapsid protein,核衣壳蛋白) 多聚酶(polymerase) 类3C蛋白酶(3C like proteinase, 3CL)39举例分析举例分析-vina对接过程对接过程3C-like proteinasePDB id:4MDS1.1.获取获取ReceptorRe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省芜湖市芜湖县2025-2026学年数学三上期末检测模拟试题含解析
- 知识产权培训课件图片
- 琵琶行教学课件设计
- 专业复习规划中级经济师试题及答案
- 销售量递增策略与实施路径
- 水利水电工程电气系统设计理解及试题及答案
- 贷款担保合同书
- 工程经济试题分析方法试题及答案
- 2025年公共关系学备考策略与试题总结
- 电子商务供应链管理协议
- 正比例函数性质课件
- 铁路退休人员乘车优惠政策
- 圆通快递员劳务合同协议
- 矿山尾矿购销合同
- 水务部门考试题及答案
- 人工智能导论课件 第十三章 类脑智能
- 渣土车安全测试题及答案
- 人工智能比赛试题及答案
- 化学(三)-2024年中考考前20天终极冲刺攻略(原卷版)
- 2025-2030中国碳酸甘油酯市场应用趋势预测及投资竞争研究研究报告
- 高热的中医护理
评论
0/150
提交评论