版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因组注释的学习资料第1页/共54页5.1搜寻基因5.1.1根据基因结构特征搜寻基因5.1.2同源基因查询5.1.3实验确认基因第2页/共54页5.1.1根据基因结构特征搜寻基因通过ORF扫描(ORFscanning)定位蛋白质编码基因
“Anopenreadingframeisaportionofagene'ssequencethatcontainsasequenceofbases,uninterruptedbystopsequences,thatcouldpotentiallyencodeaprotein”
第3页/共54页i)原核生物中ORF扫描可有效定位基因
原核生物的ORF是指从起始密码子到终止密码子的一段序列,通常代表一个编码蛋白质的基因
startcodon:ATGstopcondon:TAA,TAG,TGA
第4页/共54页
ORF扫描的关键是stopcodon在6种读框中出现的频率,一般长的ORF(不少于100个codon)可能代表一个基因(Ecoli~317codonsyeast~483human~450)原核生物基因无内含子,基因间DNA少,很少有重叠基因和基因内基因,因此原核生物中简单的ORF扫描可以定位大多数基因第5页/共54页ii)真核生物ORF扫描程序的修改不能仅仅根据ORF长度来判断哪种读框正确,因为:
a.基因间有大量的非编码序列
b.基因通常含有非编码的内含子,外显子长度往往小于100个密码子扫描真核生物ORF必须加入的规则:
①密码子偏倚(codonbias)②外显子-内含子边界(exon-intronboundaries)③上游调控序列(upstreamregulatorysequence)
第6页/共54页Codonbias:是指特定生物体的基因中并不是所有密码子的使用频率都是相同的所有生物都有密码子偏倚,预期真正的外显子有密码子偏倚,而非编码区,三联核苷酸随机排列不会有密码偏倚现象,只有平均的碱基分布水平。所以根据已有的生物密码子偏倚的资料在编写计算机程序时会写入这些限制,许多基因注释程序会写明适用于哪些物种第7页/共54页人类,果蝇和大肠杆菌中精氨酸密码使用频率的比较第8页/共54页Exon-intronboundaries
内含子5’端或donorsite:5’-AG↓GTAAGT-3’3’端或acceptorsite:5’-PyPyPyPyPyPyCAG-3’很多外显子-内含子边界序列并不是上述序列,所以上述序列只适用于一定范围第9页/共54页Upstreamregulatorysequence
调控序列有明显特点,在查找基因时可作为参考,特别是原核生物,但真核生物基因上游的调控序列变化较大,以此作为标志判断基因应当谨慎另外个别生物的基因组特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有CpG岛第10页/共54页定位功能性RNA(functionalRNA)基因
此类RNA往往具有特征性的二级结构,这些特征可以用来帮助在基因组序列发现它们第11页/共54页5.1.2同源基因搜索同源查询(homologysearch)
通过待查基因组序列与DNA数据库中的已知基因序列进行比较,从中查找可与之匹配的碱基序列或蛋白质序列及其比例用于界定基因的方法依据现有生物的不同种属之间具有功能或结构相似的同源基因成员,它们在起源上一脉相承,其间存在保守的顺序组成第12页/共54页5.1.2同源基因搜索同源查询(homologysearch)
通过待查基因组序列与DNA数据库中的已知基因序列进行比较,从中查找可与之匹配的碱基序列或蛋白质序列及其比例用于界定基因的方法依据现有生物的不同种属之间具有功能或结构相似的同源基因成员,它们在起源上一脉相承,其间存在保守的顺序组成第13页/共54页序列相似性的表现:
①存在某些完全相同的序列②ORF读框的排列类似,如等长的外显子③ORF指令的氨基酸顺序相同④模拟的多肽高级结构相似第14页/共54页比较基因组学是一种更准确的同源搜寻方法运用基因组之间的同线性可以检测短ORF的真实性第15页/共54页常用的基因注释软件1)abinitio基因预测软件GeneScan
(/GENSCAN.html)偏重于运用起始密码子,终止密码,终止信号,剪接供体和受体序列,多聚嘧啶序列,分支点保守序列来进行基因预测
FgeneSH
(/berry.phtml)
偏重于运用密码子使用偏好来进行基因预测,据研究是最快和最准确的预测基因的软件第16页/共54页2)根据同源性进行基因注释
TWINSCAN
(/nscan)
SGP2
(http://genome.crg.es/software/sgp2/sgp2.html)任何一种软件都不可能根据所有的特征来编写,所以实际的基因组注释中一般是综合好几种软件程序的结果,以及搜索cDNA数据库的结果等等,最后将信息整合到计算机上,就显示出不同程序而确定的不同序列特征的位置第17页/共54页典型基因组注释系统所显示的内容第18页/共54页5.1.3实验确认基因依据是任何基因都可转录成RNA拷贝Northernblotting可以判断DNA序列是否含有表达序列第19页/共54页种属间杂交/动物园杂交(zoo-blotting)
对Northern杂交不易检测到的基因可以采用此法亲缘关系相近的物种,基因编码区相似性高,非编码区同源性低,因此将某一物种的DNA顺序与来自另一亲缘种的DNA片段进行Southern杂交,如果产生阳性信号,则该区段可能含有基因第20页/共54页Zoo-blotting第21页/共54页获得基因在基因组中的定位信息的最容易的方法是对相关cDNA进行测序
比较cDNA与基因组DNA序列,可以找到基因的位置以及外显子和内含子的边界
要获得单个cDNA,首先需要构建cDNA文库,然后用目的基因DNA片段筛选文库
对于不完整的cDNA,可根据已知片段设计引物,通过RACE技术得到基因的全长cDNA序列第22页/共54页5’RACE(rapidamplificationofcDNAends)第23页/共54页3'RACE第24页/共54页5.2确定单个基因功能5.2.1计算机预测基因功能5.2.2用实验分析阐明基因功能5.2.3其他的基因功能研究方法第25页/共54页5.2确定单个基因功能5.2.1计算机预测基因功能主要依据仍然是同源性比较,同源基因可分为两种:直向同源基因(orthologousgene/orthlog):不同物种间的同源基因,来自物种分隔前的同一祖先,结构相似,功能高度保守乃至于几乎相同横向同源基因(paralogousgene/paralog):同一物种内的同源基因,通常是多基因家族的不同成员,由基因复制并趋异产生,共同的祖先可能存在物种形成之前或者之后第26页/共54页第27页/共54页同源性、一致性和相似性
homology:指起源于同一祖先但序列已经发生变异的基因成员,同源性只有“是”和“非”的区别,没有百分比的说法
identity:指同源DNA顺序的同一碱基位置的相同的碱基成员,或者蛋白质的同一氨基酸位置的相同的氨基酸成员,可用百分比表示
similarity:同源蛋白质的氨基酸顺序中一致性氨基酸和可取代氨基酸所占的比例
一般认为氨基酸的一致性或相似性大于25%可视为同源基因第28页/共54页两个DNA序列具有80%的序列一致性当在氨基酸序列比较时,两个序列之间缺少同源性就更明显(nt76%,aa28%)第29页/共54页同源性比较最常用的软件程序是BLAST,此程序能鉴别相似性大于30%-40%的同源基因有相同的结构域的非同源基因,可以通过在已知基因中结构域的功能推测未知基因的功能第30页/共54页5.2.2用实验分析阐明基因功能
通过基因失活进行功能分析
1)基因剔除(geneknock-out)定义:通过同源重组,一段无关的DNA片段取代某一特定的基因,使其失去功能的技术原理:在一段无关片段的两侧连接与替换基因两侧相同的顺序,将这一构件导入目的细胞,由于同源片段之间的重组,可以使无关片段取代靶基因整合到染色体中。为了便于筛选,用于取代的外源DNA中含有报告基因第31页/共54页2023/3/1432第一阶段构建带有中断基因的干细胞第32页/共54页2023/3/1433第二阶段将中断基因置于动物体内第33页/共54页2)转座子标签法(transposontagging)
通过向基因中插入转座元件或转座子使基因失活人工诱导转座第34页/共54页3)RNA干扰(RNAinterference)
利用双链小RNA高效,特异地降解细胞内同源mRNA,从而阻断靶基因表达,引起基因表达沉默第35页/共54页5.2.2用实验分析阐明基因功能
基因过表达用于功能检测通过增加基因的拷贝数和采用强启动子促使基因超表达,使受体表现出生长和发育的异常,来研究基因的功能第36页/共54页Activationtagging2023/3/1437第37页/共54页5.2.2用实验分析阐明基因功能其他的基因功能研究方法基因失活与过量表达是研究基因功能的基本方法,但并非只有这两种技术才能提供基因功能的信息有许多蛋白质必须与其他蛋白质互作才能表现其功能,常用的研究蛋白质互作的技术:
噬菌体外显(phagedisplay),酵母双杂交(yeasttwohybridsystem)第38页/共54页Y2H基本原理2023/3/1439第39页/共54页Y2H基本过程第40页/共54页Phagedisplay第41页/共54页Phagedisplay第42页/共54页5.3功能基因组学5.3.1转录组研究基因表达系列分析(serialanalysisofgeneexpression,SAGE)来自转录物内特定位置的一小段寡核苷酸序列(9~11bp)含有鉴定一个转录物特异性的足够信息,可作为区别转录物的标签(tag);通过简单的方法将这些标签串联在一起,形成大量多联体(concatemer),对每个克隆到载体的多联体进行测序,并应用SAGE软件分析,可确定表达的基因种类,并可根据标签出现的频率确定基因的表达丰度(abundance)第43页/共54页第44页/共54页第45页/共54页数字基因表达谱分析
(digitalgeneexpressionprofiling)第46页/共54页基因芯片技术
通过微加工技术,将大量特定序列的DNA片段(基因探针,probe)分子固定于支持物上后与标记的样品(sample)分子进行杂交,通过检测每个探针分子的杂交信号强度进而获取样品分子的数量和序列信息第47页/共54页2023/3/1448第48页/共5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年江西水利职业学院单招职业适应性考试备考试题及答案解析
- 2026年重庆电讯职业学院单招职业适应性考试参考题库及答案解析
- 2026年江西应用科技学院单招职业适应性考试备考题库及答案解析
- 2026年湖北水利水电职业技术学院单招职业适应性考试备考试题及答案解析
- 2026年许昌陶瓷职业学院单招职业适应性测试备考试题及答案解析
- 期中考试学生检讨书范文12篇
- 2026年塔里木职业技术学院单招职业适应性考试备考题库及答案解析
- 2026年武汉城市职业学院单招职业适应性测试模拟试题及答案解析
- 甘肃省武威第二十中学2025-2026学年九年级数学上册人教版第二十三章《旋转》单元测试题(含答案)
- 校园安全教育的发言稿8篇
- 常用统计软件应用知到智慧树章节测试课后答案2024年秋扬州大学
- 河道水质提升治理施工方案
- 汽车配件供货协议书(2篇)
- 江西省吉安市泰和县2024-2025学年数学六年级第一学期期末统考试题含解析
- 《光伏发电工程安全验收评价规程》(NB-T 32038-2017)
- 水质分析仪安装调试报告
- GB/T 2881-2023工业硅
- 教科版四年级上册科学期末测试卷(含答案)
- 医院诊断证明书word模板
- 广告维修合同
- 公司葡萄图模板
评论
0/150
提交评论