版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.1.Promoter Prediction2. PlantCARE(plantcis-acting regulatory elements), a database of plantcis-acting regulatory elements 3. promoter 2.0 prediction server 4.启动子分析网址:1 2 3 4 . s/solorz/index.html5 can/ . ters.html#databases常用启动子分析网址:首先就是想直接查找有没有人做过这条基因的启动子,在pubmed中输入genename+promoter接着就想看看有没有数据库可以直
2、接给出启动子序列的,很幸运竟然发现一个极好的启动子搜索讲义网站,如下,第一步就是要找到基因确定基因所在基因组区域,其中列出很多网站,不过偶还是习惯genbank,在gene栏中search某个基因,不要搞错基因种 属!进入后即可看到该基因的详细条目,别眼花,就点击右侧link栏的Map viewer链接,进入即可看到该基因在染色体上的形象定位,鼠标悬停在基因的起始位点时,即可在浏览器下方的状态栏中显示该位点在染色体上的明确定位, 比如110997788,结合给出的基因跨度,比如1107799,即可大概确定该启动子在基因组中的大概定位,即 1107788;第二步搞清楚基因组状态,我没搞太清楚,不
3、过其中给的一个链接来查出启动子所在克隆(查出克隆号可以购买)该链接中的clonefinder工具可以做到,只要提交你要查找的基因officialname就可以返回一个clonelist;第三步搜索启动子,其中可以用启动子数据库和启动子预测软件,当然如果启动子数据库中有最好,但很失望给出的数据库均不能查到!只好用启动子预测软件,使用了几个在线预测工具后觉得下面这个速度贼快,推荐我把该基因的dna序列submit之后返回了很多个PolII识别位点,到底哪个是呢?我个人理解启动子应该是翻译起始位点附近,所以在这个dna序列 中定位翻译起始位点即可找到最近的Highly likely predicti
4、on,那么怎么定位呢?利用blast2这个利器,只要把dna和mrna序列粘贴进去提交就ok,正好在翻译起始位点上游几百bp有个 识别位点,ok!启动子序列就是翻译起始位点上游大概1kb长度的序列了!直接用ensemble数据库的话,可以直接知道基因外显子和起始位点的位置,然后直接可以查到之前的序列,再选3k-4k的长度预测就比较方便了。启动子及转录因子结合位点数据库及预测工具(2009-05-14 23:54:56) 转载忽然感觉很GUILTY的,BLOG里竟然不放一点点和研究有关的重要工具。换了电脑之后才发现,很多有用的链接都没有COPY下来,于是,从头开始做吧。这是Andrew给我的他的
5、PAPER里的有关转录因子结合位点的数据库,还有其他网友整理的,都很有用,这个星期有空再核下几个重要基因的SNP。PROMOTER FINDING AND ANALYSIS PROGRAMS ON THE INTERNET-TRANSPLORER (TRANScription exPLORER)Dnanalyze (TF mapping)Dragon Promoter Finder 1.2 (TSS finder and promoter region analysis)FunSiteP 2.1HCtata (TATA signal prediction)McPromoter Ver.3Mat
6、Inspector (Search for TF binding sites)ModelGenerator and ModelInspectorNNPP2.1 (TSS finder)PromoterInspector (Strand non-specific promoter region finder)Promoter2.0 (TSS finder)Promoter Scan II (Promoter region prediction)RGSiteScanSignal Scan (Search for Eukaryotic Transcriptional Elements)TESS (S
7、earch for Transcription Elements)TFSEARCH (Predicts TF binding sites based on TRANSFAC data)TRANSFAC (TF database and a number of associated programs)TSSG and TSSWPROMOTER 2.0 通常确定启动子的算法可以分成两种,一种根据启动子区各种转录信号,如TATA 盒、CCAAT 盒,结合对这些保守信号及信号间保守的空间排列顺序的识别进行预测。如PROMOTER 2.0, 用神经网络方法确定TATA 盒、CCAAT盒、加帽位点(cap
8、 site) 和GC 盒(GCbox) 的位置和距离, 识别含TATA 盒的启动子。PROMOTER SCAN 根据转录因子结合部位在基因组中分布的不平衡性,将转录因子结合部位分布密度与TATA 盒的权重矩阵(weight matrix) 结合起来,从基因组DNA中识别出启动子区3 。但上述程序预测的假阳性率较高,PROMOTER 210 每23kb 出现一个假阳性;PRO2MOTER SCAN 平均每19kb 出现一个假阳性。PromoterInspector 另一种方法根据启动子区序列的特征进行预测。Promo2terInspector 从一组训练序列中提取出启动子区的环境特征,并将外显子
9、、内含子和3端非翻译区的特征与启动子区加以区分,从而在基因组中确定启动子位置FirstEF 近来还有一些程序将上述方法与CpG 岛(CpG islands) 信息相结合。CpG岛是一段200 bp 或更长的DNA 序列,核苷酸G + C 的含量较高,并且CpG双核苷酸的出现频率占G+ C 含量的50 %以上。许多脊椎动物的启动子区都与CpG岛的位置重合。FirstEF ( http :/ / rulai1cshl1org/ tools/ FirstEF/ ) 搜索通过5UTR 定位技术构建的第一外显子数据库,识别第一剪切点(first splicing donor site) ,结合CpG 岛
10、信息,确定启动子区。这种方法使预测的敏感性和特异性都明显提高。该程序预测含CpG岛的启动子的敏感性和特异性都高于90 % ,预测不含CpG岛的启动子的精确性相对略低。TRRD 数据库 收录了真核基因调控区结构和基因表达方式的信息,每个条目对应一个基因。应用权重矩阵数据库搜索转录因子结合部位的程序包括SIGNAL SCAN MatInspector 转录因子搜索程序( transcriptional factor search ,TF2 SEARCH ) 等等。尽管基于PWM 的搜索比较敏感,但它最大的缺点就是假阳性率过高,在预测的结果中有很多结合部位并不真正具有生物学功能。COMPEL 数据库
11、 经实验确定的复合元件不多,COMPEL 数据库中收录了近200 条经实验确定的复合元件的信息。如果转录因子结合部位的预测结果中包含复合元件,显然比单个元件更有可能具有生物学功能。Co - Bind 程序通过建立两个转录因子结合部位的PWM 及其复合作用的模型,可以预测序列中的复合元件。还有一些程序利用COMPEL 数据库中已知的复合元件去搜索基因组序列。Consensus AlignACE 等是用来搜索高含量基序(overrepresented motif finding) 的一些算法,可以对一组基因簇中的基因调控区进行比较,以发现其中存在的高含量的基序,调控元件可能就存在于这些基序之中。摘
12、自tjogzts的BLOG,有些挺好的收录1. NCBI上的Finding Promoter (NCBI推荐的)()Promoter Scan from the Bioinformatics and Molecular Analysis section ofNIH.TFSearch from the Computational Biology Research Center of Japan.DRAGON Gene Start Finder from the DRAGON Genome Explorer site.2. Promoter 2.0 Prediction Server()Promo
13、ter2.0 predicts transcription start sites of vertebrate PolIIpromoters in DNA sequences. It has been developed as an evolution ofsimulated transcription factors that interact with sequences in promoterregions. It builds on principles that are common to neural networks andgenetic algorithms.3. TFSEARCH ()Searching Transcription Factor Binding Sites (ver 1.3)4. Neural Network Promoter Prediction (伯克利大学)()5. The Markov Chain Promoter Prediction Server(杜克大学)(.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年四川希望汽车职业学院单招职业适应性考试题库含答案详解(考试直接用)
- 2026年吉林省白城市单招职业适应性考试题库含答案详解(研优卷)
- 人机协作机器人应用技巧
- 儿童疼痛管理康复护理
- 如何应对客户稽核技巧
- 10.3任务三 应付款项业务核算与应用
- 培训资料-多发伤护理查房
- 连续梁底板混凝土缺陷检测及维修加固整治技术交流材料 课件
- 开启地理之门:探索我们生活的世界
- 2026福建福州高新区实验中学春季教师招聘2人考试参考试题及答案解析
- 2025年湖南长沙天心城市发展集团有限公司招聘笔试参考题库附带答案详解
- 盘发培训课件
- 新22J01 工程做法图集
- 高中生干部培训
- 2025固体矿产地质调查规范1:25000
- (一模)2024~2025 学年度苏锡常镇四市高三教学情况调研(一)英语试卷
- 《运营管理 第7版》课件 马风才 第01-6章 运营管理概论- 工作系统研究
- 设计符号学现代设计语言中的符号学在建筑设计中的运用
- 《功能材料学概论》课件
- 隧道照明工程施工方案
- 苏教版五年级数学下册全册教案与反思
评论
0/150
提交评论