版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因测序数据分析工程师岗位招聘考试试卷及答案一、填空题(每题1分,共10分)1.第二代测序技术(NGS)中,Illumina平台的核心原理是______测序。2.基因组序列比对常用工具包括BWA和______。3.人类参考基因组常用版本是GRCh38和______。4.FPKM的全称是______。5.变异检测工具GATK的全称是______。6.SAM格式的二进制版本是______。7.单细胞RNA-seq细胞聚类常用算法是______。8.真核生物编码蛋白质序列占比约为______%。9.拷贝数变异(CNV)检测常用工具是______。10.基因本体(GO)分析的三大类别是分子功能、______和生物学过程。二、单项选择题(每题2分,共20分)1.以下属于第三代长读长测序技术的是?A.IlluminaNovaSeqB.PacBioSMRTC.IonTorrentD.4542.RNA-seq定量分析工具不包括?A.DESeq2B.edgeRC.TopHatD.Salmon3.人类基因组中最常见的变异类型是?A.SNPB.IndelC.CNVD.SV4.SAM文件中“”表示?A.无比对信息B.正向比对C.反向互补D.低质量reads5.存储基因表达数据的数据库是?A.NCBIGEOB.UniProtC.PDBD.Ensembl6.基因组组装常用工具是?A.Bowtie2B.TrinityC.SPAdesD.STAR7.单细胞RNA-seq中UMI的作用是?A.减少PCR偏好性B.增加读长C.比对参考基因组D.定量基因8.导致移码突变的是?A.同义替换B.3bp插入C.1bp插入D.错义替换9.功能富集分析常用工具是?A.GOseqB.BLASTC.ClustalWD.MAFFT10.转录组从头组装工具是?A.BWAB.STARC.TrinityD.GATK三、多项选择题(每题2分,共20分)1.第二代测序技术特点包括?A.短读长B.高通量C.高错误率D.低成本2.变异检测的步骤包括?A.序列比对B.质量控制C.变异callingD.功能注释3.单细胞RNA-seq分析步骤包括?A.细胞分选B.文库构建C.表达定量D.细胞聚类4.基因表达定量方法包括?A.FPKMB.TPMC.RPKMD.DESeq25.变异注释数据库包括?A.dbSNPB.ClinVarC.COSMICD.UniProt6.长读长测序技术包括?A.PacBioB.OxfordNanoporeC.IlluminaD.IonTorrent7.NGS分析QC常用工具包括?A.FastQCB.MultiQCC.TrimmomaticD.STAR8.结构变异(SV)包括?A.50bp以上IndelB.CNVC.倒位D.易位9.差异表达分析工具包括?A.DESeq2B.edgeRC.limma-voomD.Salmon10.常用参考基因组数据库包括?A.EnsemblB.UCSCC.NCBIRefSeqD.UniProt四、判断题(每题2分,共20分)1.边合成边测序(SBS)是Illumina核心技术。()2.BWA是RNA-seq比对常用工具。()3.FPKM与TPM计算结果完全相同。()4.GATK主要用于基因组变异分析。()5.单细胞RNA-seq可分析单个细胞表达。()6.SAM文件可直接用文本编辑器打开。()7.ClinVar存储疾病相关变异。()8.Trinity用于基因组从头组装。()9.长读长测序错误率高于短读长。()10.p值越小基因差异越显著。()五、简答题(每题5分,共20分)1.简述NGS分析中QC的主要步骤及工具。2.什么是SNP?列举其2个应用场景。3.简述RNA-seq差异表达分析的核心步骤。4.单细胞RNA-seq与bulkRNA-seq的主要区别。六、讨论题(每题5分,共10分)1.如何解决NGS数据分析中的adapter污染问题?2.长读长测序技术的优势及挑战是什么?---答案部分一、填空题答案1.边合成边测序(SBS)2.STAR3.hg194.每百万片段中来自某一基因每千碱基长度的片段数5.GenomeAnalysisToolkit6.BAM7.t-SNE(或UMAP)8.1-29.CNVkit10.细胞组分二、单项选择题答案1.B2.C3.A4.A5.A6.C7.A8.C9.A10.C三、多项选择题答案1.ABD2.ABCD3.ABCD4.ABC5.ABC6.AB7.ABC8.ABCD9.ABC10.ABC四、判断题答案1.√2.×3.×4.√5.√6.√7.√8.×9.√10.√五、简答题答案1.NGSQC步骤及工具:文库前QC(DNA/RNA完整性:琼脂糖凝胶、Bioanalyzer);测序中QC(测序仪实时监测);文库后QC(reads质量:FastQC;去低质量/adapter:Trimmomatic/TrimGalore);数据分析QC(比对率:Samtoolsflagstat;覆盖度:Bedtools;变异QC:GATKVQSR)。2.SNP及应用:SNP是基因组单个碱基变异(人群频率≥1%)。应用:①遗传关联分析(如糖尿病致病SNP);②个性化医疗(如CYP450SNP指导药物代谢);③群体遗传学(研究人群进化)。3.RNA-seq差异表达步骤:①原始数据QC(FastQC+Trimmomatic);②序列比对(STAR/Hisat2);③表达定量(Salmon/HTSeq);④预处理(过滤低表达、归一化);⑤差异分析(DESeq2/edgeR);⑥结果筛选(p<0.05、|FC|≥2);⑦功能富集(GOseq)。4.单细胞与bulk的区别:bulk分析细胞群体平均表达,掩盖异质性;scRNA-seq分析单个细胞表达,揭示异质性。样本:bulk混合细胞,sc单个细胞;工具:sc用Seurat/Scanpy,bulk用DESeq2;重点:bulk关注群体差异,sc关注细胞类型/亚群。六、讨论题答案1.adapter污染解决方法:①文库构建优化:设计特异性引物,减少adapter残留;②测序前检测:Qubit测文库浓度,避免过量;③数据分析:Trimmomatic指定adapter序列去除,TrimGalore自动识别;④QC验证:FastQC检查adapter是否消失;⑤污染严重则重构建文库。2.长读长测序的优势与挑
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家庭小农场财务制度
- 小微企业管理及财务制度
- 建工集团财务制度
- 农村志愿消防队值班值守制度
- 养老院老人情感关怀制度
- 养老院老人健康管理制度
- 施工现场施工防生物危害制度
- 志愿活动策划方案案例(3篇)
- 剪辑养颜活动策划方案(3篇)
- 活动策划方案广场舞(3篇)
- 文化馆安全生产制度
- (2025年)保安员(初级)证考试题库及答案
- 2026年浙江省军士转业岗位履职能力考点练习题及答案
- 2026年检察院书记员面试题及答案
- 安全设备设施安装、使用、检验、维修、改造、验收、报废管理制度
- 2026届四川省成都市2023级高三一诊英语试题(附答案和音频)
- 《煤矿安全规程(2025)》防治水部分解读课件
- 2025至2030中国新癸酸缩水甘油酯行业项目调研及市场前景预测评估报告
- JJF 2333-2025恒温金属浴校准规范
- 员工自互检培训
- (2025年)司法考试法理学历年真题及答案
评论
0/150
提交评论