前列腺癌遗传易感基因的数据库查找比对分析_第1页
前列腺癌遗传易感基因的数据库查找比对分析_第2页
前列腺癌遗传易感基因的数据库查找比对分析_第3页
前列腺癌遗传易感基因的数据库查找比对分析_第4页
前列腺癌遗传易感基因的数据库查找比对分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、前列腺癌遗传易感基因的数据库查找比对分析年级:2005 姓名:吕晓敏应用生物信息学的方法对国人和欧美人的前列腺癌易感基因之间的异同点进行分析,从而找出前列腺癌发病的可能发病机制。方法:我们首先在OMIM 数据库中查找得到欧美人的前列腺癌相关基因的基因序列,然后将其与中国人的基因组序列进行BLAST 同源序列比对,找出这些序列之间具体的碱基的相同点与不同,用于研究国人和欧美人在前列腺癌发病率的不同。一. 实验背景1前列腺癌的研究现状前列腺癌是老年男性常见的恶性肿瘤。在我国,前列腺癌的发病率虽远低于西方国家,但近年来随着饮食结构和生活方式的西化,其发病率呈明显上升趋势 。由于大规模PSA (Pro

2、state Specific Antigen,PSA )普查未能广泛接受和使用,血清PSA 水平在前列腺癌诊断方面的局限性,以及个体之间自然病程的差异,前列腺癌临床确诊患者以进展期为主。内分泌治疗仍为前列腺癌的主要治疗方式,内分泌治疗最终将导致前列腺癌发展为激素非依赖性。由于前列腺癌发病机制尚不清楚,目前临床上对于前列腺癌发病预测和治疗仍然存在着一定的滞后和盲目性。前列腺癌的发生发展与遗传因素和生活方式密切相关。在我国,生活方式西化和脂肪摄入量的持续增加导致前列腺癌危险因素和保护因素失衡是前列腺癌发病的重要环境因素,而个体遗传学上的差异是前列腺癌发生的必要条件。北欧一项关于443,788对双胞

3、胎的研究表明,遗传因素对前列腺癌发生的影响度达42。对欧美人前列腺癌的全基因组关联研究(Genome-Wide Association Studies,GWAS 发现,有多个基因位点与前列腺癌的发病相关,这些位点分别位于第3, 6, 7, 10, 11, 19 和 X 染色体。有研究者选择2893例瑞典前列腺癌患者和1781例正常人对照的基因组进行研究,分析了5个染色体区(3个位于8q24,2个位于17q )中与前列腺癌发病有关的16个SNP (Single Nucleotide Polymorphisms, SNP),发现,联合应用其中5个SNP 与家族史可以预测前列腺癌发病的危险程度。而且

4、这种预测与PSA 值无关,也就是说,即使血清PSA 水平很低,只要他携带一个或多个前列腺癌相关的基因型,就存在前列腺癌发病的高危险性。全基因组关联研究表明,遗传性的易患前列腺癌体质是由较低外显性基因引起的。有报道指出,亚裔美国人前列腺癌的发病率显著高于本国人,但总的前列腺癌发病率仍仅为美国白人的一半。提示,前列腺癌发病不仅与环境因素有关,遗传因素同样发挥着重要作用。因此,明确前列腺癌的遗传易感基因对前列腺癌的发病预测和预后判断具有重要意义。尽管年龄、种族和家族史是三个明确的前列腺癌发病危险因素,但是我国前列腺癌发病中具有种族特点的遗传基因却尚未得到确认。从1971年美国总统尼克松发起对“对癌症

5、的战争(War on Cancer)”以来,癌症研究虽然取得了重要进展,但是我们并没有赢得这场战争。一个重要原因就是我们尚缺乏以证据为基础的癌症预防战略。寻找前列腺癌遗传易感基因是前列腺癌研究的重要战略之一。目前,人类疾病的基因组学研究已进入到多基因疾病这一难点。由于多基因疾病不遵循孟德尔遗传规律,难以从一般的家系遗传连锁分析取得突破。这方面的研究需要在人群和遗传标记的选择、数学模型的建立、统计方法的 改进等方面进行艰苦的努力。近来也有学者提出,用比较基因表达谱的方法来识别疾病状态下基因的激活或受抑。实际上,“癌肿基因组解剖学计划(Cancer Genome Anatomy Project,

6、CGAP)”就代表了在这方面的尝试。从上述情况可以发现,国人和欧美人在前列腺癌发病率上的巨大差异, 遗传因素可能是产生这一差异的重大影响因素。所以,我们有必要利用人类基因组计划的成果,从基因的水平上对国人和欧美人的前列腺癌遗传相关基因进行比较,以得出前列腺癌的可能的遗传影响机制。二. 实验原理GCG 及EMBOSS 等软件包中包含有五种BLAST :BLASTP 是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。BLASTX 是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白

7、序列比对。BLASTN 是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。TBLASTN 是蛋白序列到核酸库中的一种查询。与BLASTX 相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。TBLASTX 是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。通常根据查询序列的类型(蛋白或核酸)来决定选用何种BLAST 。假如是作核酸核酸查询,有两种BLAST 供选择,通常默认为BLASTN 。如要用TBLASTX 也可,但记

8、住此时不考虑缺口。BLAST 适用于本地查询。可以下载公共数据库,对于该数据库的更新和维护是必不可少的。如果要直接到网上查询也可以(即Net Blast),但记住如果你认为自己的序列很有价值的话,还是谨慎为宜。我们在实验中用到的BLAST 比对就是BLASTN ,即为核酸-核酸查询,通过对国人和欧美人同一基因的BLAST 比对可以找出两条序列间的不同位点及各位点不同碱基的个数。三实验步骤1. 前列腺遗传相关基因的查找在OMIM 数据库中查找前列腺相关基因,以prostate cancer为检索词,并将查询范围限定在titles 上,便可以找到相应的前列腺遗传相关基因,如图1 图1 OMIM搜索

9、欧美人前列腺癌遗传相关基因结果将所查找得到的序列列表显示如表1,表中包括基因的名字,MIM 号以及该基因所在的基因位置。表1 欧美人前列腺癌相关基因序号基因名 MIM 号 基因位置序号 基因名 MIM 号 基因位置1TMEM16G 605096 2q37.3 14 SYT7 604146 11q13 2STEAP2 605094 7q21 15 HPC1 601518 1q25 3PCA3 604845 9q21-q2216 HPC7 610321 15q12 4PSMP 612191 9p13.3 17 HPC4 608658 7p11-q21 5HPC11 611955 17q12 18

10、HPC8 602759 1q42.2-q436HPC13 611928 10q11.2 19 HPCX1 300147 Xq27-q287HPC12 611868 2p15 20 HPC15 311959 19q13.4 8PDZD2 610697 5p13.2 21 HPC14 611958 11q13 9ALKBH3 610603 11p11.1222 HPC9 610997 17q21-q2210TBC1D3B 610144 17q12 23 HPC6 609558 22q12.3 11HPC3 608656 20q13 24 HPC5 609299 3p2612ELAC2 605367

11、 17q11 25 HPC3 608656 20q13 13 SLC45A3 605097 1q32.1 26 HPCX2 300704 Xp11.22 在表1所示的序列中,只有15条序列完成了序列比对,如表2所示: 表2-2 完成比对的前列腺癌相关基因 序号 基因名 MIM号 基因位置1 TMEM16G 605096 2q37.3 2 STEAP2 605094 7q21 3 PCA3 604845 9q21-q22 4 PSMP 612191 9p13.3 5 HPC11 611955 17q12 6 HPC13 611928 10q11.2 7 HPC12 611868 2p15 8 P

12、DZD2 610697 5p13.2 9 ALKBH3 610603 11p11.12 10 TBC1D3B 610144 17q12 11 HPC3 608656 20q13 12 ELAC2 605367 17q11 13 SLC45A3 605097 1q32.1 14 SYT7 604146 11q13 15 HPC1 601518 1q25 除以上序列外,还有其他部分基因由于序列比对上的困难而没有完成比对,将这些基因列举如表3所示: 表3 比对不完全的前列腺癌相关基因总结 序号 基因名 MIM号 基因位置1 HPC7 610321 15q12 2 HPC4 608658 7p11-q

13、21 3 HPC8 602759 1q42.2-q43 4 HPCX1 300147 Xq27-q28 5 HPC15 311959 19q13.4 6 HPC14 611958 11q13 7 HPC9 610997 17q21-q22 8 HPC6 609558 22q12.3 9 HPC5 609299 3p26 10 HPC3 608656 20q13 11 HPCX2 300704 Xp11.222 基因序列比对在表1所示的各个基因序列中选出两个基因STEAP2与PCA3按前述的BLAST 序列比对方法进行序列比对,寻找国人和欧美人各基因的不同点。1) STEAP2在NCBI 上查找

14、欧美人的STEAP2的基因序列,图2,并将其与国人基因组序列进行BLAST 序列比对。 图2 欧美STEAP2基因序列序列比对的结果如图3所示: 图3 国人和欧美人STEAP2基因序列比对结果从图3中可以发现,两条序列共有9处不同,结果见表4。2)PCA3在NCBI 上查找欧美人的PCA3基因序列,见图4,并将其与国人的基因序列进行BLAST 序列比对。 图4 欧美人PCA3的基因序列序列比对的结果如图5所示: 图 5 国人和欧美人 PCA 基因序列的比对结果 从图 5 中可以发现,两条序列间共有 9 处不同,结果见表 4。 3 实验结果 通过序列的 BLAST 比对, 我们得出了国人和欧美人两个基因序列不同的具体情况, 并总结这些差异得到结果,如表 4 所示。 表 4 国人和欧美人前列腺癌相关基因序列异同点总结 序号 2 STEAP2 基因名 9 差异位点 个数 差异位点序列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论