生物信息学软件_第1页
生物信息学软件_第2页
生物信息学软件_第3页
生物信息学软件_第4页
生物信息学软件_第5页
已阅读5页,还剩159页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学软件JASPARConSiteTRANSFACrVista2.0

MEMEWeblogPISCESCH-HITPSIPREDChEMBLDavid转录因子结合位点转录因子:能够结合在某基因上游特异核苷酸序列上的蛋白质,活化后从胞质转位至胞核,通过识别和结合基因启动子区的顺式作用元件,启动和调控基因表达转录因子结合位点:转录因子结合位点是转录因子调节基因表达时,与转录因子结合的区域JASPARJASPAR是收集有关转录因子与DNA结合位点模体(motif)的最全面的公开的数据库,该数据库是由哥本哈根大学维护。JASPAR数据库中所包含的数据,都经过严格筛选,有确切的实验依据,通过计算机辅助软件进行整合识别匹配并用生物学手段进行注释(1)

JASPARCORE(2)JASPARCNE(3)JASPARFAM(4)JASPARPBM(5)JASPARPBM_HLH(6)JASPARPBM_HOMEOJASPAR_CORE核心数据库TheJASPARCOREdatabasecontainsacurated,non-redundantsetofprofiles,derivedfrompublishedcollectionsofexperimentallydefinedtranscriptionfactorbindingsitesforeukaryotes.Theprimedifferencetosimilarresources(TRANSFAC,etc)consistoftheopendataaccess,non-redundancyandquality.

JASPARCNEJASPARCNEisacollectionof233matrixprofilesByclusteringofoverrepresentedmotifsfromhumanconservednon-codingelements.Thebiochemicalandbiologicalroleofmostofthesepatternsisstillunknown如何得到位置矩阵位置矩阵如何打分PhylogeneticfootprintingPhylogeneticfootprintingisatechniqueusedtoidentifytranscriptionfactorbindingsites(TFBS)withinanon-codingregionofDNAofinterestbycomparingittotheorthologoussequenceindifferentspecies.同源假设两个或多个结构具有相同的祖先,那么称它们同源(Homology)这里相同的祖先既可以指演化论意义上的祖先,即两个结构由一个共同的祖先演化而来,也可以指发育意义上的祖先,即两个结构由胚胎时期的同一组织发育而来。

直系同源与旁系同源如果两个基因有着几乎一样的DNA序列,那么它们很可能同源。同源序列可分为两种:直系同源(orthology)和旁系同源(paralogy)。直系同源的序列因物种形成(speciation)而被区分开(separated):假设一个基因原先存在于某个物种,而该物种分化为了两个物种,那么新物种中的基因是直系同源的。啮齿动物和人类旁系同源的序列因基因复制(geneduplication)而被区分开(separated):假设生物体中的某个基因被复制了,那么两个副本序列就是旁系同源的。肌红蛋白(myoglobin)和血红蛋白(hemoglobin)被认为是古老的旁系同源体ConSiteConSiteisauser-friendly,web-basedtoolforfindingcis-regulatoryelementsingenomicsequences.Predictionsarebasedontheintegrationofbindingsitepredictiongeneratedwithhigh-qualitytranscriptionfactormodelsandcross-speciescomparisonfilteringByincorporatingevolutionaryconstraints,selectivityisincreasedbyanorderofmagnitudeascomparedtosingle-sequenceanalysis

TRANSFAC

TRANSFAC数据库是关于转录因子、结合位点和与DNA结合的profiles的数据库。由SITE、GENE、FACTOR、CLASS、MATRIX、CELLS、METHOD和REFERENCE等数据表构成。Match-1.0Public

Matchisaweightmatrix-basedprogramforpredictingtranscriptionfactorbindingsites(TFBS)inDNAsequences.ItusesalibraryofpositionalweightmatricesfromTRANSFAC®Public6.0.

rVista2.0

Analyzingnovelsequencesforthepresenceofknowntranscriptionfactorbindingsitesortheirweightmatricesproducesahugenumberoffalsepositivepredictionsthatarerandomlyanduniformilydistributed.

rVistacombinesdatabasesearcheswithcomparativesequenceanalysis,reducingthenumberoffalsepositivepredictionsby~95%whilemaintainingahighsensitivityofthesearchMEMEMotif-basedsequenceanalysistools寻找DNA,RNA和蛋白质的共有序列可以在启动子区域搜寻TFBS的结合位点可以搜寻蛋白质家族的模体(motif)WeblogWeblogo基于多序列比对信息,把多序列的保守信息通过图形表示出来。每个logo由一系列碱基〔氨基酸〕组成,在每一个序列位置上用总高度表示此位置上的序列保守性,用碱基〔氨基酸〕字母的高度表示出现的频率PISCES序列相似性比对软件进行序列相似性比对蛋白质预测时序列相似性一般选取:25%,40%CH-HIT序列相似性比对软件DOS下运行最低的序列相似性为40%PSIPREDPSIPRED(PositionSpecificIteratedPRED)Server是一个预测蛋白质二级结构的效劳器ChEMBLChEMBLisadatabase

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论