牛全基因组预测转录因子-数据库构建及分析_第1页
牛全基因组预测转录因子-数据库构建及分析_第2页
牛全基因组预测转录因子-数据库构建及分析_第3页
牛全基因组预测转录因子-数据库构建及分析_第4页
牛全基因组预测转录因子-数据库构建及分析_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、牛全基因组预测转录因子数据库构建及分析导 师: 张勤教授研究生: 王志鹏August, 2008概要 研究背景 数据库构建与网页 材料与方法 结果与讨论转录因子定义: 能够结合在某基因上游特异核苷酸序列上从而调控其基因转录的一类蛋白质。结构特点: 存在结构域和功能域 结构域(DBD) :与DNA结合的具有特异性 结构模式:锌指,亮氨酸拉链, 螺旋转角螺旋, 螺旋环螺旋 顺式作用元件与反式作用因子 物种 #转录因子 物种 #转录因子 人 1790 拟南芥 1953 猩猩 242 水稻 400 鼠 1305 小麦 97 鸭嘴兽 139 玉米 37 鸡 585 番茄 29 斑马鱼 874 绿藻 90

2、 果蝇 586 红藻 10 线虫 635 酵母 322 真核生物转录因子收集于NCBI原核生物转录因子收集于NCBI 暖枝菌 8 紫色光合细菌 20 热变形菌 9 具核梭杆菌 2 常温泉古菌 15 乳酸球菌 1 嗜热菌 7 发光杆菌 7 超嗜熱菌 6 双叉杆菌 7 嗜盐杆菌 39 抗辐射细菌 17 古细菌 503 细菌 332古细菌物种 #转录因子 细菌物种 #转录因子J. L. Riechmann 2000 science.转录因子所占比例生物进化历史J. L. Riechmann 2000 science.转录因子存在的特性 1. 转录因子存在的普适性2. 物种间的差异性3. 与进化历史有

3、一定关系转录因子的作用基因调控特别针对真核生物的多级调控结构基因调控网络辅助基因网络的推断已有转录因子数据库/cgi-bin/pub/databases/transfac/search.cgi http:/dbd.mrc-lmb.cam.ac.uk/DBD/index.cgi?About /archaeatf/Homepage.php / http:/dbtbs.hgc.jp/ http:/regulondb.ccg.unam.mx/ / http:/genome.gsc.riken.jp/TFdb/ / / 已有转录因子数据库农场生物转录因子收集于NCBI 猪 94 马 156 牛 634

4、羊 17 鸡 585 狗 215 猫 5 水稻 400 小麦 97 玉米 37物种 #转录因子关注于模式生物NCBI634 编码转录因子的基因TRANSFAC 10 编码转录因子的基因 16 转录因子调控的基因DBD 2333 预测转录因子 (无注释)牛转录因子目 的全基因组范围完整注释的牛转录因子库概要 背景知识 数据库构建与网页 材料与方法 结果与讨论实现步骤数据的收集转录因子的识别预测转录因子的注释预测转录因子的展示技术路线本地 BLAST转录因子功能注释QTL区域信息信息整合基因注释转录因子物理位置注释基本信息生物功能信息注 释基因组,蛋白质组数据蛋白质二级结构模型集( Pfam &S

5、uperFamily)预测转录因子集HMMER 程序已知转录因子集合数据收集牛全基因组序列3.1版本 。( ENSEMBLE )收集牛已知蛋白质序列2.7万条。(ENSEMBLE)获得由GENESCAN 预测蛋白质5.6万条。与转录因子相关的基因信息4357条, 转录信息4933条。 (NCBI)PDB数据3.6万条 。 (SWISS-MODEL )收集涉及91个性状的QTL共846条。(QTLdb)转录因子识别识别蛋白质是否含有DBD结构与DNA结合的结构域(DBD)具有特异性HMMER程序 (hmmpscan,hmmsearch) 66个家族231个HMM模型(SCOP)参数为默认值,取E

6、-value0.01 预测转录因子的注释转录因子基本信息物理位置转录因子家族信息DBD信息基因与转录本信息基因结构与3D结构信息GO信息表型性状与QTL信息序列信息概要 背景知识 数据库构建与网页 材料与方法 结果与讨论预测转录因子的展示C S构架 动态网站数据存储 Mysql (5.0.18)服务 Apache (2.2.4)界面 Perl (5.8.7) perl : DBI 、perl : CGI perl : GD 数据表结构TF 基本信息TF_family 信息Motif 信息转录和外显子信息基因信息序列信息QTL 信息PDB 信息注释信息概要 背景知识 数据库构建与网页 材料与方法

7、 结果与讨论结 果 (I)共计 5479 个转录因子,4357个基因 由已知蛋白集合预测 3810个基因4932个转录因子 由预测蛋白集合预测 4260个基因5487个转录因子已知蛋白集合54754738104932预测蛋白集合结 果 (I)4357个基因5479 个转录因子占全基因组14转录因子的可变剪切有886个基因产生个或个以上的转录蛋白 1 个基因产生 个不同的转录因子 个基因每个产生 个转录因子 个基因每个产生 个转录因子 712 个基因每个产生 个转录因子可变剪切不影响转录因子绑定形式 ENSBTAG00000005251产生了7个转录因子 每个转录因子只包含RING/U-box结

8、构。可变剪切影响转录因子绑定形式 ENSBTAG00000000054产生了4个转录因子 3个含Homeodomain-like和 DEATH domain 1个只含有Homeodomain-like结构 这4个因子的Homeodomain-like均为四联体重复可变剪切的影响在各条染色体上的分布不均 chr. 19 18 5 3 7 . 1(146Mb) 367 333 307 287 279 . 242结 果 (II) Chromosome 1 每条染色体上分布呈非随机性结 果 (II) 3174转录因子分到47个性状中MY PP PY FP FY SCS SCC 187 274 253

9、184 180 384 122 合计:1584 结 果 (III) 产奶量 转录因子分布乳脂量 转录因子分布2967个转录因子只存在一个DBD结构,其余的存在多个DBD结构。存在结构洗牌现象 同一DBD结构重复 不同DBD结构的组合结 果 (IV)结构洗牌HLHHLH BasicBasicT_BoxMyc_NHLH T_boxHLH Myc_NHTH_11Com_HTHHTH_1HTH_10HomeoboxHom CUTCUTPouZf_C2H2Hom PouHom ZFPAXHom PAXFork_headFork ZFbZip_1Zip ZF结构洗牌按照DBD结构将转录因子分为64个家族每

10、个家族所含转录因子数目差异较大,5个家族的成员超过300个,大部分家族含有少许转录因子(幂率分布)。结 果 (IV)部分家族具有种属特异性 牛特有家族 ZF-C2H2_DDE GATA_Atrophin-1 哺乳动物特有家族 ZF-C2H2_KRAB_SCAN ZF-C2H2_SCAN 温血动物特有家族 ZF-C2H2_KRAB14 动物特有家族 Fez1 ; Ets 真核生物特有家族 bHLH 部分家族成员数目具有种属特异性(与鸡作比) 牛含量高的家族 ZF-C2H2-3 牛含量低的家族 T-box结 果 (IV)典型家族进化树分析bHLH (生物中共有家族)HomeoBox (牛最多成员数

11、家族)Ets (动物中共有家族) 结 果 (V)bHLH此树涉及33个物种108条数据牛 bHLH 家族进化关系图牛 HomeoBox 进化树包含 128 条数据牛Ets家族进化树14个成员串联重复定义:两个或多个同家族成员基因出现在同一条染色体,且距离相差小于200kb。牛 18号染色体ENSBTAG00000000332 185ENSBTAG00000007466 190ENSBTAG00000013444 193130Kb50Kb 基因重复X5161871881941712195197189转录因子家族进化树分析结果存在重复序列和串联重复片段。有些基因直接来源与祖先基因,一些基因具有直系同源性,一些基因具有并系同源性。根据进化树可将同一基因家族内的成员进一步细化。结 论 (I)在基因组范围内存在一定比例的基因表达转录因子,且在基因组的分布具有非随机性,存在富集区。与QTL关联的转录因子可作为候选基因考虑,需要进一步实验验证

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论