版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025/12/22生物信息学数据库
Bioinformaticsdatabase2025/12/22一、概述
生物信息学的定义生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。(美国人类基因组计划实施五年后的总结报告)
2025/12/22二.生物信息学数据库种类:《NucleicAcidsResearch》杂志每年的第一期中详细介绍最新版本的各种数据库。在2000年1月1日出版的28卷第一期115种通用和专用数据库。至2013年,精选的生物信息学数据库总数已达1512个,(2011年1300个)。2025/12/22《NucleicAcidsResearch》杂志
/
2025/12/22/nar/database/c/2025/12/22核酸序列研究数据库2025/12/22相关数据库及其主要分类1.核酸序列数据库2.RNA序列数据库3.蛋白质序列数据库4.结构数据库5.基因组数据库(非脊椎动物)6.代谢酶相关产物7.人类和其他脊椎动物基因组8.人类基因和疾病9.其他数据和其他基因表达数据库10.蛋白组资源11.其他分子生物学数据库12.细胞器官数据库13.植物数据库14.免疫学数据库15.细胞生物学数据库(2012年新增)2025/12/22核酸序列数据库
1.Genbank美国国家卫生研究院国家生物技术信息中心2.Embl欧洲分子生物实验室/3.DDBJ日本核酸数据库http://www.nij.ac.jp内容包括:世界上所有已公布的国际核酸序列委员会协作组核酸序列、编码和非编码DNA、基因的结构,内含子和外显子剪接位点、转录调节点和转录因子报告和相关注释
2025/12/22主要蛋白质序列数据库
SWISS-PROT(瑞士日内瓦大学)蛋白质序列数据库http://www.Expasy.ch
内容包括序列及功能信息、蛋白识别、蛋白质结构预测及其他功能NCBI蛋白质数据库包括所有蛋白质序列,及其翻译产物序列
/entrezPIR蛋白质序列信息资源库(美、德)
2025/12/22主要蛋白质结构数据库PDBProteinDataBank,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库/pdb/
NCBISTRUCTUREMMDB(MolecularModellingDataBase),包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库SCOP(Structuralclassificationofproteins)英国医学研究会(MRC)剑桥分子生物学实验室开发的蛋白质结构分类数据库。包含描述蛋白质域的家族、超家族、折叠、等级等信息。http://scop.mrc-lmb.cam.ac.uk/scop/2025/12/22基因组数据库MGD的-小鼠基因组数据库
基因指数
基因组注释的术语,本体论和术语
分类与鉴定
一般基因组数据库
病毒基因组数据库
原核基因组数据库
单细胞真核生物的基因组数据库
真菌基因组数据库
无脊椎动物的基因组数据库微阵列数据和其他基因表达数据库
MicroarrayDataandotherGeneExpressionDatabases
NCBI的GEO-GeneExpressionOmnibus(基因表达精选集)EBI-ArrayExpression(基于微阵列的基因表达知识库)2025/12/222025/12/22人类疾病与基因数据库
肿瘤数据库蛋白质的突变数据库一般人类遗传学数据库(OMIM-OnlineMendelianInheritanceinMan等)一般多态性数据库癌症基因数据库基因,系统或特定疾病数据库SNP单核苷酸多态性疾病关联遗传位点查询系统
SNP美国NCBI单核苷酸多态性疾病
关联遗传位点查询系统
当前有2600万份报告提供了人类和其他25个生物有机体基因变异综合数据查询,是目前理解人类和分子遗传变异、用于序列变异性基因图谱、定义种群结构、进行功能研究、疾病高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学基础研究等的重要工具。2025/12/222025/12/22生物信息学相关分析工具
BLAST序列相似性对比PRIMER引物设计蛋白质结构预测数据库(EMBL)根据已知蛋白质序列,预测同族二级、三维等结构蛋白质功能预测数据库(EMBL)根据已知蛋白质序列,预测蛋白质功能2025/12/22我国生物信息相关网站
中国生物信息网国家南方基因研究中心/ch/北京大学生物信息中心中国生物技术信息网
//2025/12/22三.生物信息学数据库检索集成检索系统:
NCBIEntrez系统(整合库)美国生物技术信息中心研制2025/12/22(一)Entrez-NCBI综合数据库是1991年由美国生物信息技术中心(NationalCenterforBiotechnologyInformation,NCBI)()Ref.EricW.Sayers.DatabaseresourcesoftheNationalCenterforBiotechnologyInformation.NucleicAcidsResearch,2010,Vol.38,DatabaseissueD5-D16
2025/12/22NCBI用途检索分子生物学数据如:获取GenBank,EMBL等数据库的核酸序列;获取Swiss-port,PIR,PRF,PDB等蛋白质序列;从核酸序列翻译到蛋白质的序列;获取基因和染色体图谱;蛋白质三维结构数据及大分子模式(MMDB)等其他生物信息数据库检索。分析上述数据库的来源数据检索PubMed书目文献数据。检索网络版图书(可阅读全文)1.获取序列例:获取人类血小板衍生因子的序列关键词:Pdgfhomosapiens限定字段:基因定义(标题)2025/12/22选择核酸序列数据库2025/12/22基因定义碱基数、核酸类型相关数据库分析这些序列寻找相关数据EST大规模表达序列标签2025/12/22代码物种来源参考文献染色体特性启动序列对比程序启动引物设计2025/12/22原序列复制后,可到BLAST中进行相似性对本启动序列分析软件2025/12/22
2.BLAST
序列相似性检索BasicLocalAlignmentSearchTool是核酸和蛋白质序列的局部对准相似性检索工具。2025/12/22序列相似性检索Blast是为从相同和不同的有机体中,提供对比核酸或蛋白质序列,寻找相似性序列片断的工具。通过寻找不同基因的相同序列片段,可以推断最新测定的基因功能、预测基因家族的新成员、探索基因的进化关系,预测蛋白质代码和翻译产物的功能和定位。2025/12/22基本对比选择对比程序基因组对比特殊对比2025/12/22将序列数据库中的复制序列在此粘贴自动启动系统自动将序列号贴在次框中2011年起自动启动系统2025/12/22序列对比报告对比资源类似性图谱2025/12/22对比积分报告数据库标识符基因定义类似性积分E值为匹配期望值。说明可以找到与搜索序列相匹配的其它序列的几率。E值越接近零,越不可能找到其它的匹配序列,其含义就是E值越小,匹配度越好2025/12/22人类染色体上的抗肿瘤基因序列对排表2025/12/22对排序列不一致处序列对排报告2011起自动启动引物设计引物参数:自定义引物链;PCR产品长度;返回引物数外显子连接跨度与匹配基因内区长度排序特殊引物数据核对设计结果引物对图像详细报告第一对引物序列正链、反链模板链:序列长度起始与结束序列数温度熔点引物中碱基+c的比例可能意外模板2025/12/223.NCBIstructure包括:分子模型数据库(MMDB),提供关于各种蛋白质的结构信息;蛋白质域数据库(CDD),提供在proteins(CDs)内保存的功能领域序列和结构对准表达目录。这两个数据库让科学家检索和观看结构,从结构上查找特定蛋白质的相似蛋白质,并且辨认功能位点。2025/12/22Structure检索步骤第一步:
在Entrezsturcture检索栏中直接输入的检索词包括:PDB代码,蛋白质名字,作者,或期刊名。第二步:
通过Entrez列阵搜寻,得出检索初步结果也许出现多个指定的蛋白质存在的记录,它们反映了不同的实验性技术情况,并且出现或缺乏各种各样的配合基或金属离子。记录也许并且包含全长分子的不同片段。另外,还有许多突变体蛋白质结构,用户要注意筛选。检索结果同时包含了PDB记录,包括实验性描述,PDB代码。2025/12/22第三步:显示结构概略页观察次要结构SecondaryStructure按钮对观看3D分子的结构是有用的前奏第四步:观看完整蛋白质结构按钮FullProteinStructures(须下载Cn3D软件)Viewing3DStructures2025/12/22检索MMDB例:查找铁氧化还原蛋白的三维结构蛋白质代码:1doi铁氧化还原蛋白:Halobacteriumferredoxinfe2025/12/22进入NCBISTRUCTURE点开下拉菜单2025/12/22执行检索输入检索提问(基因名称、代码、关键词)2025/12/22Structure记录蛋白质代码蛋白质描述:来自死海古菌的铁氧化还原蛋白2025/12/22StructureSummary蛋白质描述作者参考文献显示3D结构显示分子及相互作用Cn3D显示2025/12/224.GenomesandMap
Genomes由美国国家生物技术信息中心
NCBI整合,包括以下数据库:Genome(弓形体、细菌、真核、病毒、质粒、植物等超过1000种有机体的基因组)EntrezGenomeProject(细胞生物体基因组项目)CancerChromosomes(肿瘤染色体)SKY/M-FISH&CGHDatabase(光谱染色体组多元荧光和比较基因组)dbGAP(GenotypesandPhenotypes)(基因型和显型数据库)
借助EntrezMapViewer(图形显示器软件),让用户观看数据库内带有综合遗传和自然图的各种有机体基因组、全部染色体、序列集成数据。
2025/12/22进入MapViewer2025/12/22TheNCBIHandbook
ExercisesUsingMapViewer
例:获取特定基因周围的基因组序列过程图
2025/12/22例:利用MapViewer
获取特定基因周围的基因组序列在分子生物学研究中,有很多情况下,研究者经常只有序列的全长序列cDNA,但却需要了解5’或3’的核酸序列或对内含子其它等其它分子生物学内容进行分析。因为从一般数据库获得的基因组序列没有足够注释信息,难以检索某一序列特定区域。MapViewer却能很容易的进行说明、观看,并且能以多种格式下载基因组序列。2025/12/222025/12/22选择物种:Homosapeins2025/12/22输入基因名称2025/12/22滤过基因数据2025/12/22人类基因组项目原始装配数据库Celera公司数据2025/12/22序列显示器蛋白质库生物学证据Viewer
模型制作同源基因基因命名数据库序列显示Sequence
Viewer(SV)2025/12/222025/12/22
5.OMIM
OnlineMendelianInheritanceinMan
孟德尔遗传数据库由美国JohnsHopkins大学建立。现也属NCBI集成系统中的一个库。它主要报道人类基因和遗传缺陷相关疾病的文字信息、图片和参考文献,被称为人类基因及其相关疾病与遗传特征的百科全书2025/12/22例:查找与疾病相关的基因通过OMIM寻找疾病基因信息,通过染色体定位找到疾病基因如:查找角化过度症(营养不良性神经病)Keratoderma,palmoplantar2025/12/22OMIM检索
Keratodermapalmoplantar
染色体位点2025/12/22OMIM检出结果表型基因相关关系链接GeneMap2025/12/22UCSCGenomeBrowseronHuman
UniversityofCalifornia,SantaCruz
人类基因组浏览器
2025/12/22提供大型基因组采集数据的参考序列、装配工作草图6.网络版图书内容目录全文2025/12/22(三)蛋白质结构预测2025/12/22蛋白质预测的常用途径1.从氨基酸组成辨识蛋白质2.预测蛋白质的物理性质3.蛋白质二级结构预测4.其它特殊局部结构5.蛋白质的三维结构1.从氨基酸组成辨识蛋白质的程序1.1ExPASy工具包
http://www.expasy.ch/tools/1.2序列属性的方法搜索蛋白数据库rs.fr/propsearch/UweHobohm*,ChrisSander(EuropeanMolecularBiologyLaboratory,69012Heidelberg,Germany):“艾滋病毒的Nef蛋白与MHC人类白血胞抗原相似吗?”,FEBS-333(1993):211-213(SCI收录)。通过PROPSEARCH辨识蛋白质结构:将已测序列粘贴到检索框,该序列可包含唯一的氨基酸残基字符(一个字母代码),没有空格、无位置符号,回车。
2025/12/222025/12/222025/12/222.预测蛋白质的物理性质
ComputePI/MW:/compute_pi/Peptidemass:http://expaxy.hcuge.ch/ch2d/pi-tool.html
2025/12/223.蛋白质二级结构预测3.1ExPASy(http://www.expasy.ch/tools/);3.2PredictProtein(
)4.其它特殊局部结构4.1COILS:
4.2TMpred:/software/TMPRED_form.html。4.3SignalP:http://www.cbs.dtu.dk/services/SignalP/2025/12/22蛋白质的三维结构7.5.1SWISS-MODEL:http://www.expasy.ch/swissmod/SWISS-MODEL.html7.5.2CPHmodels:http://www.cbs.dtu.dk/services/CPHmodels/2025/12/22蛋白质预测的成功范例
色氨酸笼trp-cagenlyiqwlkdggpssgrppps
由20个氨基酸构成,是华盛顿大学的JonathanNeidigh制造的人造蛋白。大部分小分子短链结构比较松散,这种蛋白质却像大分子蛋白质一样,具有紧凑、明确的结构。
Simmerling等人利用电脑模拟技术,根据一种蛋白质的基因编码,准确地预测了它是怎样折叠成三维结构的。预测结果,几乎完全符合华盛顿大学研究小组利用核磁共振技术测量出的这种“迷你”蛋白的形状。2025/12/22色氨酸笼——氨基酸序列:nlyiqwlkdggpssgrppps
2025/12/22三维结构预测范例建立mouseFASantigeneligand蛋白质分子模型1.获取序列(识别号:p41047)2025/12/22通过在蛋白质数据库中输入关键词或识别号如:(p41047)获取序列2025/12/22点击序列号,获取详细信息2025/12/22获取序列选择序列格式显示2025/12/22获取FASTA格式序列2025/12/22复制序列2025/12/22P41047序列MQQPMNYPCPQIFWVDSSATSSWAPPGSVFPCPSCGPRGPDQRRPPPPPPPVSPLPPPSQPLPLPPLTPLKKKDHNTNLWLPVVFFMVLVALVGMGLGMYQLFHLQKELAELREFTNQSLKVSSFEKQIANPSTPSEKKEPRSVAHLTGNPHSRSIPLEWEDTYGTALISGVKYKKGGLVINETGLYFVYSKVYFRGQSCNNQPLNHKVYMRNSKYPEDLVLMEEKRLNYCTTGQIWAHSSYLGAVFNLTSADHLYVNISQLSLINFEESKTFFGLYKL进入日内瓦大学生物分子学网站
选择同源建模服务器SWISSMODEL同源建模服务器建模自动模式联盟模式项目模式同源建模(比较建模)是从蛋白质的氨基酸序列(目标序列)出发,建立3D模型的计算方法。建立一个成功的模型需要至少一个已经通过实验测定的蛋白质3D结构(称为“模板”,即template),并且该蛋白质的氨基酸序列应与目标序列有显著的相似性。以模板作为台架(scaffold)基础,对目标序列(targetsequence)进行建模,其步骤是:选择模板,目标与模板的联配,建立模型,评估,循环重复,直到得到一个满意的模型为止。三种模式Automatedmode自动模式用于建模的氨基酸序列或是Swiss-Prot/TrEMBL(/sprot)编目号,可以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大学(工程造价)工程管理模拟真题及解析
- 2025年大学大二(文物与博物馆学)文物学概论试题及答案
- 2026年职业知识(知识考核)考题及答案
- 2026年注册公用设备工程师(动力基础考试上)试题及答案
- 2025年大学第三学年(高分子材料与工程)高分子合成技术阶段测试试题及答案
- 火电厂热工自动化
- 深度解析(2026)《GBT 18286-2000信息技术 文本通信用控制功能》(2026年)深度解析
- 深度解析(2026)《GBT 18017.2-1999订舱确认报文 第2部分订舱确认报文子集 订舱确认报文》
- 深度解析(2026)《GBT 17848-1999牺牲阳极电化学性能试验方法》
- 深度解析(2026)《GBT 17706-1999销售预测报文》
- GA 68-2024警用防刺服
- 炭窑口硫铁矿矿山地质环境保护与土地复垦方案
- 2025年西点烘焙师职业考试试卷及答案
- 六西格玛黑带培训大纲
- 2025年公安信息管理学及从业资格技能知识考试题与答案
- 兴业银行贷款合同模板大全
- 普通高等学校三全育人综合改革试点建设标准试行
- 卖房承诺书范文
- 招投标自查自纠报告
- 高校公寓管理述职报告
- HG-T 20583-2020 钢制化工容器结构设计规范
评论
0/150
提交评论