




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、文章编号:100021336(20020120081203利用SWISS 2PR OT 网获取生物信息学资源刘树春(中国医科大学医学信息学系,沈阳110001关键词:生物信息学;蛋白质序列;因特网中图分类号:Q51收稿日期:2001210215作者简介:刘树春(1963,男,博士生。生物信息学是是采用数学、统计学和计算机方法对生物学数据信息进行采集、存储、传播、分析、归类、解释的科学1。Internet 网络是信息传输、检索、获取、交流的重要手段。当前,在Internet 网上可以查询到大量的生物信息学数据库,其中SWISS 2PROT 蛋白质序列数据库是网上生物信息学最核心的3个数据库之一。
2、通过该数据库,可以较完整地获得生物大分子的序列信息。同时,研究者也可以将测定的序列信息通过该数据库予以认定、发表、交流。本文主要探讨SWISS 2PROT 蛋白质序列数据库的特点、检索方法及利用Internet 获取蛋白质序列信息。1.蛋白质序列数据库1.1SWISS 2PROT 蛋白质序列数据库SWISS 2PROT 是蛋白质序列注释性知识数据库,创建于1986年,由瑞士生物信息学研究所(S wiss Institute for Bioinformatics ,SI B 和欧洲生物信息学研究所(European Bioin formatic Institute ,E BI 共同协作维护。该数
3、据库到2001年末共收录102708个序列数据,包含37803202个氨基酸。在SWISS 2PROT 数据库各种氨基酸的分布中,亮氨酸、丙氨酸、丝氨酸、甘氨酸、缬氨酸、谷氨酸占较高的比例,而组氨酸、半胱氨酸、苯丙氨酸等占的比例较小(表1。SWISS 2PROT 数据库现有的序列数据涉及1202种期刊的92845篇文献。被引用100篇文献以上的期刊有91种,其中经常被引用的前20种期刊(表2被引用次数皆在表1SWISS 2PROT 蛋白质序列数据库中各种氨基酸分布氨基酸%氨基酸%氨基酸%氨基酸%Ala7.62G ln 3.94Leu 9.54Ser 7.08Arg 5.19G lu 6.47L
4、ys 5.97Thr 5.57Asn 4.35G ly 6.85M et 2.36T rp 1.21Asp 5.25His 2.25Phe 4.10T yr 3.16Cys1.62Ile 5.85Pro 4.89Val6.61表2SWISS 2PROT 蛋白质序列数据库引用文献来源期刊分布N o.期刊名称被引用文献(篇%1J of Biol Chem81258.752Proc Natl Acad Sci US A 4659 5.023Nucleic Acids Res 3560 3.834J Bacteriology 3320 3.585G ene3163 3.416FE BS Lett250
5、2 2.697Biochem Bioph Res C ommun 2316 2.498Eur J Biochem 2274 2.459Biochem istry 2164 2.3310E M BO J 2006 2.1611Nature1914 2.0612Biochim Bioph Acta 1846 1.9913J M ol Biol 1692 1.8214Cell1528 1.6515G enom ics 1487 1.6016M ol Cell Biol 1439 1.5517Biochem J1112 1.2018M ol G ene G ene 1087 1.1719Plant M
6、 ole Biol 1081 1.1620Science10391.121000次以上,合计贡献文献48314篇,占总被引用文献数的52.04%,说明这些期刊是发表蛋白质序列相关信息的主要文献源。1.2SWISS 2PROT 数据库的特点(1可提供蛋白质序列的详尽注释信息序列注释包括蛋白质功能、蛋白质翻译后修饰、结构域和结合位点、二级结构、四级结构、蛋白质缺陷相关疾病等信息。(2避免过多的重复在SWISS 2PROT 中,尽量避免过多的重复。对同种蛋白质的多个记录进行仔细比较后归结到一个记录内,方便了用户检索利用。表3SWISS2PROT记录字段及含义缩写全称含义缩写全称含义ID Identi
7、fication标识号RC Reference comments参考文献评注AC Accession Number登记号RX Cross2references交叉参考DT Date创建日期RA Reference authors文献著者DE Description名称R L Reference location文献出处G N G ene name(s基因名称CC C omments or notes评注或注释OS Organism species来源物种DR Database cross2references数据库参见OG Organelle来源细胞器K W K eyw ords关键词OC O
8、rganism classification物种分类FT Feature table data特征数据列表RN Reference number参考文献序号S Q Sequence header序列题头RP Reference position参考文献内容/T erm ination line结束符(3与其他数据库交叉参考一次检索可同时获得蛋白质的各方面资料信息。(4记录显示格式规范字段名运用两位字母代码表示。代码具体含义(表3。1.3T rE M BL蛋白质序列数据库T rE M2 BL是计算机注释的蛋白质序列数据库,是SWISS2PROT蛋白质序列数据库的辅助数据库,其包含尚未结合到SWI
9、SS2PROT数据库的E M BL核酸序列数据库中所有编码序列(C DS的翻译内容。T rE M BL可作为SWISS2 PROT的初级部分,它也是加速注释升级以达到SWISS2PROT质量标准的重要处理过程。SWISS2PROT和T rE M BL记录的一般结构是一致的,检索方式也相同。二者的主要区别在于T rE M BL的数据分类总是标明“Prelimi2 nary(初级”,而SWISS2PROT数据标明“Stan2 dard(标准”。2.SWISS2PR OT/T rEMB L数据库的检索Web上有多个站点可进入并检索该数据库。其主要站点有蛋白质分析专家系统(Ex2 PASy分子生物学网
10、站(http:/w w w.expasy. ch/sprot/和欧洲生物信息学研究所(E BI网站(http:/w w w.ebi.ac.uk/swissprot/等。通过ExPASy网站可链接到国际上包括SWISS2PROT、T rE M BL、PROSITE、E NZY ME等数据库的有关蛋白质、核酸、基因组序列、结构与功能的1000多个站点。该网站在瑞士、澳大利亚等国家和地区设立了镜像站点, 2000年起在中国的北京大学也设立了镜像站点,网址是/。2.1SWISS2PROT/T rE M BL的常规检索途径进入ExPASy网站上的SWISS2PROT
11、/ T rE M BL首页,在检索窗口内输入检索词进行一般性检索(Quick Search。这些检索词可以是:登记号(AC、标识号(I D、序列描述内容(Description、基因名称(G ene name、物种名称(Organism等字段中的词汇。通过首页的上的“Access to SWISS2PROT and T rE M BL”栏目可从以下几种途径进行检索:(1全文搜索(Fulltext Search通过点击“Fulltext Search”链接到全文搜索界面。在检索窗口内,可以输入:AC、I D、DE、G N、OS、OC、RX、RC、RA、R L、CC、DR、K W、FT字段中的任意
12、词。输入的检索词应区分大小写。如果选定检索窗口下方的“Prefix and append wildcard 3to w ords”(前缀及词上添加通配符3复选框,还可以将输入的检索词作为前缀或词的一部分进行扩展检索。当同时输入多个检索词时,则可利用逻辑运算符(AND,OR, NOT及大括号“”、“”来限定检索。例如:“coli ANDatpase OR atp synthetase”,该检索式可获得包含“coli”,同时还包含“atpase”或“atp synthetase”的记录。(2登记号或标识号(AC或I D途径检索进入登记号检索界面后,可在检索窗口内输入登记号或标识号进行检索。如:P0
13、4406, G3P2-H UMAN。但需注意,每次只能输入一个登记号或标识号。(3序列描述或标识(DE或I D检索在此检索界面可在检索窗口内输入SWISS2PROT 或T rE M BL数据库中DE、OS、OG、G N或I D字段中的任意词进行检索。(4著者(Author检索可在检索窗口内输入著者姓名全称或姓名的一部分。名字缩写后需加“.”。例如:BAIROCH、H ochstrasser D.F.。在输入著者姓名时,也可以利用通配符“3”代表多个字母,利用“?”代表任意一个字母。例如:可利用“Craw for3”或“Craw?ord”检索“Craw ford”为作者的记录。(5文献源(Cit
14、ation检索此途径只可以检索SWISS2PROT数据库而不能检索T rE M BL 数据库。用户可以在相应的检索窗口内输入期刊全名或刊名缩写、期刊的出版年、卷号(后两者可选等,从发表文献的期刊的角度检索。2.2SRS序列检索系统通过点击在Ex2 PASy的SWISS2PROT数据库网页下方的SRS 链接进入建立在Web上的SRS序列检索系统。在SRS页面上,点击“Start”按钮进入选择ExPASy数据库网页。ExPASy网站上的所有数据库均可通过该网站的SRS检索系统进行检索。SRS的大多数界面上方有6个按钮,包括“T op Page”、“Query F orm”、“Query Manag
15、er”、“View Manag2 er”、“Databanks”及“Help”。“T op Page”用于选择数据库,一次可选择;“Query F orm”为检索界面,通过在检索窗口内输入检索词,进入检索;“Query Manager”有两个功能,其一为存储检索史,其二是做进一步检索或实现链接;“View Manager”可以定义检索结构的阅读方式;“Databanks”网页上以图表的方式列出了可提供服务的数据库,并标明版次、数据记录数量、索及日期、分组等信息;“Help”提供数据库、字段等各种帮助信息。3.检索结果的显示与输出在检索窗口内输入检索词并执行数据库检索后,可显示出符合检索条件的记
16、录列表。选择需要浏览详细资料的记录,进入记录的详细显示界面。在结果显示的详细界面中,最初为NiceProt显示方式,内容包括:一般信息(记录名、登记号等、名称及来源(蛋白质名称等、PubMed文献信息、评论、交叉检索、关键词、特性、序列信息等。也可以对SWISS2PROT显示格式进行选择。此外,通过点击“Quick Blastp search”可进入SI B的BLAST网络服务系统,对序列进行相似性比较。4.SWISS2PR OT序列数据上传研究者可将被直接测序的肽链序列数据上传至E BI的SWISS2PROT数据库。该数据库将为这些序列提供登记号。上传序列数据表格可在E BI网站(http:
17、/w w w.ebi.ac.uk/2 sp/sub.form获得。表格填写后,将其发至datasubsebi.ac.uk。在7个工作日内将收到结果信息,告知著者所呈报的序列被赋予的登记号或所需要进一步提供的信息。呈报的蛋白质序列数据还与德国的MIPS(Martin2 sried蛋白质序列数据研究所及美国的NBRF2PIR(国家生物医学研究基金会蛋白质鉴定资源等数据库共享。参考文献1萧浪涛.湖南农业大学学报(自然科学版,2000,26(6:405410第六届细胞信号转导专题学术讨论会经细胞生物学会细胞信号转导专业委员会主持召开首次筹备会(武汉,2001年5月19日讨论决定,原“钙与细胞功能暨细胞信号转导专题学术讨论会”改名为“细胞信号转导专题学术讨论会”,届时将请多名国内外知名教授作报告。会议欢迎跨学科(物理、化学等专业专家、研究生参加。本会第六届会议将于2002年10月在武汉召开,主办单位为武汉大学生命科学学院,会议名誉主席为该学院杨弘远院士。会议主题内容为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 老年婚恋交友平台创新创业项目商业计划书
- 线上购物线下试妆创新创业项目商业计划书
- 水利工程维修养护数字孪生管理创新创业项目商业计划书
- 电商供应链可视化管理系统创新创业项目商业计划书
- 汽车赛事直播服务创新创业项目商业计划书
- 2025年数字货币对货币政策传导机制影响的金融科技视角研究
- 2025年文化与科技融合趋势下的数字文化内容创作创新模式研究报告
- 2025年文化旅游演艺项目跨界合作模式创新研究报告
- 2025年老年健康管理长期照护服务模式与慢性病管理的研究报告
- 2025年新能源汽车制造产业技术创新与产业链协同发展报告
- 2023年山东水发集团有限公司招聘笔试题库及答案解析
- 全国2023年招商银行招银网络科技校园招聘考试模拟卷3套含答案详解
- YY/T 1745-2021自动粪便分析仪
- MT 220-1990煤矿用防爆柴油机械排气中一氧化碳、氮氧化物检验规范
- 燕窝工艺参考
- 班组施工任务单
- 斜拉桥主桥索塔施工监理实施细则
- 钢结构模块化安装施工方案
- 双氧水生产工艺简单简介
- KNS机器参数,干货
- 医院输血科技术人员绩效考核指标
评论
0/150
提交评论