下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、NANJINGTECHUNJVKRSJITY工物号制药工程学院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring生工类1301-3生物信息学考试说明时间:第17周周五(6月17日)上午3-4节地点:厚学201题型:(开卷)名词解释5题20分,单项选择题10题20分,综合分析题4题60分。重点:可参考以下课后题2.2 何为一级数据库?有哪些一级数据库?一级数据库属于档案数据库,库中的主要内容是来源于实验室操作所得到的原始数据结果;一级数据库:核酸序列数据库GenBank、EMBL、DDBJ及蛋白质数据库PDB(proteindataba
2、nk)。2.3 二级数据库、三级数据库等是指什么样的数据库?二级数据库是在一级数据库的信息基础上进行了计算加工处理并增加了许多人为的注释而构成的。例如,NCBI的RefSeq数据库,其mRNA序列式综合了GenBank中来源于同一物种相同基因的所有Mrna序列信息的一致性序列;而公共数据库中大多数的蛋白质序列是将核昔酸序列中的编码序列区域进行蛋白质翻译后,通过后续的一些计算分析,主观的人为地为序列加上蛋白质产物名称及功能注释。三级数据库:参考书本P16页2.6 请查阅资料,了解序列信息的标准数据存放格式:FASTA、NBRF/PIR、GDE和Raw。书10页到11页2.8 GenBank数据库
3、中的GenBank条目包含哪些内容?请结合GenBank中的一条具体的序列信息加以说明。书17页到19页2.12 蛋白质序列数据库有哪些?书22页2.13 Uniprot数据库分哪几个层次?书22页,分为三个层次。一是UniprotKnowledgebase(UniprotKB)它涵盖大量人工注释的蛋白质信息,包括功能、分类以及数据库的交叉引用等;二是UniprotArchive(Uniparc)力图收集最完整、最全面的蛋白质序列数据,不过数据没有加以注释整理,只给出了相关序列的来源;三是UniprotReferenceClusters(UniRef),是将UniParc中的序列数据依据不同的
4、参数条件去除冗余后得到的结果。2.14 UniProtKB/SwissProt和UniProtKB/TrEMBL有何关联?书23页SwissProt提供了最全面和可靠的注释信息,被称为是蛋白质序列数据的“黄金标NANJINGTECHUNJVKRSJITY工物号制药工程学院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring准";TrEMBL是为了在不降低SwissProt高水平注释质量的同时,又能使经由测序和翻译获取的蛋白质序列数据得以尽快地发布,作为SwissProt数据库的补充。3.1 序列比对在什么情况下选择核甘酸序列?
5、在什么情况选择蛋白质序列?书51页核甘酸序列:在确认给定DNA序列和DNA数据库中的序列的一致性时。在搜索多态性时。在分析所克隆的cDNA片段的一致性时。蛋白质序列:由于蛋白质序列比DNA所含信息多,所以除以上情况外用蛋白质序列。3.2 请比较同源性、相似性和一致性三个概念。书51页到53页同源性:是指从某个共同祖先经趋异进化而形成的不同序列,也就是从一些数据中推断出的两个基因在进化上具有共同祖先的结论,是质的判断。一致性:是指两序列在同一位点核甘酸或氨基酸残基完全相同的序列比例。相似性:两序列间直接的数量关系,如部分相同,相似的百分比或其他一些合适的度量。3.4在进化过程中,两条同源蛋白质序
6、列之间会产生分歧的突变有哪些?书P54替换、插入、删除替换:发生于一个突变导致的一种氨基酸的密码子变成另一种氨基酸的密码子时,在比对结果中显示为同一位置上出现两个不同的氨基酸。插入和删除:发生于残基添加或消除时,比对中由一单点表示(.),加在一条或另一条序列中。插入和删除(即使只有一个字符长度)都被认为是比对中的空位3.13查阅资料了解BLAST比对程序家族的主要程序,如何选择?程序名查询序列数据库搜索方法Blastn核酸核酸核酸序列搜索逐一核酸数据陈中的序列畀Blastp蛋白质蛋白质蛋臼质序列搜索逐一蛋白质数据库中的序列。Blastx核酸蛋白质核酸序列6框翻译成蛋白质序列后和蛋白质数据库中的
7、序列逐一搜索.Tblastn蛋白质核酸蛋白摄序列和核酸数据庠中的极酸序列6框期译后的宙白质序列逐一比对TBIastx核酸核酸核酸序列6框胡译版蛋白质序列.再和核酸数据库中的核酸序列6挺翅译成的蛋白质序列逐一进行比对“NANJINGTECHUNJVKRSJITY工物号制药工程学院CollegeofBiotcchncilcyandPharinac-cuticalEngineering3.15 如何寻找远缘相关的蛋白质?PSI-BLAST是位点特异性迭代BLAST,用来寻找远缘相关的蛋白质序列,对于蛋白质的相似序列的寻找比常规blastp更敏感。PSI-BLAST工具的比对步骤为:(1)用blast
8、p在目标数据库中进行比对搜索;(2)从第一步中获得的结果构建多序列对比,根据多序列比对构建一个位点特异性矩阵PSSM;(3)用第二步获得的PSSM矩阵再一次搜索目标数据库;(4)位点特异性反复比对后用缺失比对的参数检验每个匹配的统计显著性;反复执行24步,一般要重复5次,而当新的结果不再出现或者程序明确指出不会再有新的结果出现时,可以停止比对循环。3.16 如何利用BLAST来发现新基因?(1)用一个已知序列蛋白质开始TBLAST比对,搜索一个DNA数据库;(2)检查结果:寻找与已知蛋白质,相关蛋白质的DNA序列匹配,非显著序列的匹配;(3)进行BLASTXNR或BLASTPNR比对(4)用你
9、新发现的DNA或蛋白质搜索一个蛋白质数据库来证实是否真的发现一个新的基因或蛋白质。4.3什么是外显子?什么是内含子?外显子:是真核生物基因的一部分,他在剪接后仍会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质。内含子:是一个基因中非编码DNA片段,他分开相邻的外显子。内含子是阻断基因线性表达的序列。NANJINGTECHUNJVKRSJITY工物号制药工程学院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring4.6 基因预测方法有哪些?书本P107基于表达数据的基因预测、基于机器学习方法的基因预测基于表达数据的基因预测方法主要是
10、利用基因产物(包括cDNA、EST以及蛋白质等)反推基因结构。基于机器学习方法的基因预测主要是通过挖掘基因组序列以及各类证据以及各类证据数据信息中蕴含的基因结构特征,并建立数据模型进行基因结构预测。4.7 什么是EST序列?如何利用EST序列预测基因?EST:完整mRNA转录物的片段。把来自不同克隆的EST拼接起来形成完整的cDNA弥补其数量缺少的情况利用PASA程序软件将聚类的转录物片段(全长cDNA和EST)拼接成最大对比片段得到完整地或者部分的基因结构,并获得更多的可变剪切的信息5.3 什么是系统发生树?在研究生物进化和系统分类中,常用一种类似树状分支的图形来概括各种(类)生物之间的亲缘
11、关系,这种树状分支的图形称为系统发生树。5.5 构建系统发生树有哪两类方法?P131一类是基于距离的方法,也直接称为基于距离法另一类是基可二字母特征的方法5.8 分子系统发生分析常用的软件有哪些?PHYLIP。(2)PAUP。(3)MEGA。(4)TREE-PUZZLE。(5)MrBayes。(6)PhyML。6.1 提供了蛋白质结构的检索和查询服务的数据库主要有哪些?PDB数据库、DSSP数据库、HSSP数据库SCOPCATH6.2 简要说明四个层次的蛋白质结构。(一)一级结构蛋白质的一级结构(primarystructure)是指多肽链的氨基酸残基的排列顺序。(二)二级结构蛋白质二级结构(
12、secondarystructure)是指多肽链主链原子借助于氢键沿一维方向排列成具有周期性的结构构象,是多肽链局部的空间结构(构象)主要有“螺旋、浙叠、3转角、无规卷曲等形式(三)超二级结构、结构域超二级结构(supersecondarystructure)是指相邻的二级结构单元组合在一起,彼此相互作用,排列形成规则的、在空间结构上能够辨认的二级结构组合体,同时充当三级结构的构件,基本形式有aa>333a等。NANJINGTECHUNJVKRSJITY工物号制药工程学院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring(四)三
13、级结构三级结构(tertiarystructure)是指整条多肽链的三维结构,包括骨架和侧链在内的所有原子的空间排列。(五)四级结构e四级结构(quatrnarystructure)指在亚基和亚基之间通过疏水作用等次级键结合成为有序排列的特定的空间结构。6.4 PDB收录了哪些实验类型的结构数据?X射线晶图谱法,核磁共振法,电子显微镜二维晶体三维结构6.6 蛋白质结构家族分类数据库主要有哪些?SCOP,CATH,FFSP6.8 蛋白质结构分析主要包含哪些方面?组织层次、结构测定及预测,蛋白质折叠6.9 如何进行蛋白质结构比对?有那些常用的结构比对工具?首先对两个蛋白质结构定义结构相似部分(或称
14、共同子结构);然后通过多次迭代策略来调整共同子结构,直到找出优化的结构比对,即找到两个蛋白质空间上最大的重叠部分。DALI方法、CE方法、STRUCTURAL方法、SSM方法、TM-align方法6.13 同源建模方法预测蛋白质结构的基本步骤有哪些?1、模板的选择2、待测序列与模板序列的比对3、同源模型的建立4、同源模型精修和评估7.2常用的蛋白质序列分析和功能预测方法有哪几类?书171页大致分为四类:1 .基于序歹U或结构的分析方法(sequenceandstructurebasedmethods),又称进化方法,这类方法基于全局或局部序列或者结构上的保守性来预测蛋白质功能。2 .基于基因组
15、上下文的方法,又称比较基因组方法,分别基于结构融合事件、系统进化特征谱、保守的基因顺序、表达谱以及共调控等预测蛋白质功能。3 .基于相互作用的方法,又称细胞方法,利用蛋白质相互作用数据预测功能4 .基于过程的方法,又称代谢方法,利用生物化学路径的结构化网络来匹配蛋白质的非典型反应。7.6 基于序列相似性预测蛋白质功能的主要依据是什么?具基本步NANJINGTECHUNJVKRSJITY工物号制药工程学院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring骤有哪些?P171大致分为四类:1 .基于序歹U或结构的分析方法(sequenceandstructurebasedmethods),又称进化方法,这类方法基于全局或局部序列或者结构上的保守性来预测蛋白质功能。2 .基于基因组上下文的方法,又称比较基因组方法,分别基于结构融合事件、系统进化特征谱、保守的基因顺序、表达谱以及共调控等预测蛋白质功能。3 .基于相互作用的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 货物存放合作协议书
- 货物样品买卖协议书
- 货物订购合同协议书
- 购买渣土协议书模板
- 财务合同外包协议书
- 调皮学生入学协议书
- 购买岗位服务协议书
- 购房担保服务协议书
- 购销产品合同协议书
- 购买汽车消费协议书
- 2025江苏南京市市场监督管理局所属事业单位招聘工作人员6人考试笔试参考题库附答案解析
- 急性肾盂肾炎护理
- 北京市石景山区2024-2025学年八年级上学期期末数学试题
- 房屋清洁劳务协议书
- 双语平翘舌课件及讲解
- 老子的思想主张是什么老子对世界有什么影响
- 2025年协管员笔试试题及答案
- 2025年高职智能制造(PLC控制系统)试题及答案
- 钢筋除锈工程专项方案
- 2025年大学生国家安全教育期末考试及答案
- 中国南方航空校招笔试题及答案
评论
0/150
提交评论