生物信息学试题复习参考(张弓).docx_第1页
生物信息学试题复习参考(张弓).docx_第2页
生物信息学试题复习参考(张弓).docx_第3页
生物信息学试题复习参考(张弓).docx_第4页
生物信息学试题复习参考(张弓).docx_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2014-2015学年 生物信息学期末考试题写在前面:这是我考试时候写的答案的大致内容,具体文字我已经不记得了,给大家一个参考,希望对大家复习有帮助。因为我也是扣了很多分,所以答案也有很多错的,大家不要尽信。祝大家考试顺利。一、实验设计和基础分析以下qPT-PCR实验方案有哪些错误?请标出错误,并说明原因和写出正确方案。目的:比较肺癌细胞迁移前后的X基因转录水平表达量方法:(1)用Trizol法提取细胞总RNA,并用跑胶、OD260/280等方法确认无降解。(2)用poly-dT引物进行反转录(3)设计基因特异性PCR引物,用qPCR仪测定X基因和GAPDH基因的Ct值。GAPDH作为内参。(4)以2-Ct方法计算X基因相对于GAPDH的相对含量(5)比较迁移前后的相对表达量,做三个重复,用t-test进行统计检验,P500x,由于与其临床耐药菌与标准菌株的基因组差异较大,因此采用Velvet算法进行拼接,然后进行BLAST2GO自动功能注释。通过将拼接出的contigs与标准菌株基因进行比对,可找出突变,进而统计出可能耐药相关的基因和突变。这一测序和分析策略是否有问题?你能否提出更好的方案?为什么你的方案更好?【水生生物学、海洋生物与生物技术专业】水体富营养化极易造成赤潮爆发,传统研究只关注某种条件下的一种优势菌株,但近年来的研究发现在真实赤潮环境中优势菌株并不单一。例如2002年在东海地区发生的赤潮。赤潮开始时的优势菌种有两种:东海原甲藻和塔玛亚历山大藻(均属甲藻),然而后期则发生了种族演变东海原甲藻仍然维持很高的生物量,但塔玛亚历山大藻则被肋骨条藻和红色中缢虫所取代。以上所述几种藻类,其基因组均未测序过,一般藻类的单倍体基因组约为100Mb左右,然而流式细胞染色结果指出,东海原甲藻的单倍体基因组估计为2.2Gb左右,要想测定这些藻类的全基因组所需的经费实在太高,并不现实。然而甲藻属于间核生物,兼具原核生物和真核生物的特点。现要用测序技术来研究藻种演替过程中究竟是什么生物的哪些基因发生了改变,为何东海原甲藻能一直维持很高的生物量,而塔玛亚历山大藻却在后期消亡。请设计测序和分析策略,并简要说明每一步骤为什么这么做(例如为什么选这个测序仪而不选另一种)分析其可行性和效率比。【生科院其他专业】抑郁症已成为现代人类日益严重的健康威胁,现已知神经元细胞突触上的一种膜蛋白5-HT1A(5-羟色胺1A受体)与抑郁症非常相关。5-HT1A可被5-HT(5-羟色胺)结合,通过G蛋白偶联信号转导通路行使功能。5-HT的减少使该信号通路受到抑制,最终导致抑郁症。某新型抗抑郁症的药物被设计成可以与5-HT1A特异性结合,持续激活该信号通路,从而达到抗抑郁的效果,然而,该药物在欧美白种人中抗抑郁的效果很好,但在中国的临床试验中发现大部分病人治疗效果很差。Western blot发现白种人和黄种人神经元中5-HT1A蛋白质含量无显著差异。目前的dbSNP(单碱基多形性数据库)中,只有关于5-HT1A的两个SNP纪录,一个位于3-UTR,一个位于编码区中,是同义突变,请提出一个假说,解释这个药物为何对中国人效果很差,并设计一个实验策略来验证你的假说。答:假说:由于位于编码区的同义突变导致蛋白质的三级结构改变,药物不能特异结合上去。实验方案:区中国人抑郁症患者神经细胞,设置三组组一:不做处理,对照组组二:通过点突变进行回复突变,将细胞的DNA变成和欧美患者的DNA信息一样组三:取欧美患者的神经细胞,进行点突变,将位于编码区的的SNP位点突变成和中国患者一样分别对三组细胞进行相同条件培养,并给予药物处理,然后检测下游信号通路的相关信号的表达量。还可以对不同人种患者的细胞的膜蛋白5-HT1A,用核磁共振的方法测定结构域。四、大规模测序数据分析一些中药在肿瘤治疗上有着相当好的效果,但由于中药成分复杂,寻找其有效成分和作用机制一直是一大难题。现用mRNA-seq方法研究某抗癌中药作用前后肝癌细胞Hep3B的转录组变化,寻找中药可能的作用靶点。测序建库和测序送给公司完成,数据分析自己做。FANSe2算法云平台做基础分析完成后,下载基因表达量的表格,含有每个基因的read count和rpkM数据。(1)Reads过少的基因,定量是不准的,不宜加入差异表达分析。你怎样筛选可定量的基因?其理由原理是什么?(2)由于经费所限,加药组和不加药组分别只能测一次序,如何分析哪些基因显著上调?在edgeR软件中用怎样的命令来表示?其前提条件是什么?(3)两个样品的log10rpkM值做散点图如下图,相关性高达R=0.98。edgeR分析得出差异表达的基因仅有15个。这是什么原因造成的?答(1) 利用rpkM进行筛选可定量的基因。因为rpkM的前提是假定两个样本之间的总RNA的表达量是一样的,而进行的基因真正的表达量的衡量。(2)(3) 因为中药作用前后,各个基因的表达量本来就是相关性很高的。五、高级统计与数据挖掘为研究影响中国人口出生率的关键因素,从国家统计局网站上获得2004年中国31个省会城市、直辖市的相关数据,选择如下几项指标:Y:人口出生率,即一年内平均每千人所出生的人数X1:居民消费价格指数X2:高等教育比例,为每千人中,大专以上文化程度比例X3:年人均工资,以元/人为单位X4:少年儿童抚养比,即(014岁人口总数)/(1564岁人口总数)X5:老年人口抚养比,即(=65岁人口总数)/(1564岁人口总数)分析方案一:应用最小二乘法进行多元线性回归,得到回归方程:Y=2993+0.32X1+0.94X2+0.093X3+0.36X4-0.24X5R2=0.87分析方案二:逐次回归,得到回归方程:Y=4.15-0.08X3+0.34X4-0.21X5R2=0.83回答下列问题:(1)你会选择哪个分析方案? 方案2 (2)你作出选择的依据是什么?(单选)A.能够容纳更全面的指标B.每个指标都对回归显著C.更高的R2D.更加简洁有代表性E.更符合日常生活感受(3)现在中国的总和生育率已跌至1.2,老龄化问题严重,养老系统濒于崩溃,迫切需要提高人口出生率。但即便开放二胎,由于离婚率飙升和抚养成本升高,人们的生育意愿依然低下。以你所选择的分析方案所得出的回归方程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论