雨课堂学堂在线学堂云《大数据与人工智能基础及生物医学应用(中央民族)》单元测试考核答案_第1页
雨课堂学堂在线学堂云《大数据与人工智能基础及生物医学应用(中央民族)》单元测试考核答案_第2页
雨课堂学堂在线学堂云《大数据与人工智能基础及生物医学应用(中央民族)》单元测试考核答案_第3页
雨课堂学堂在线学堂云《大数据与人工智能基础及生物医学应用(中央民族)》单元测试考核答案_第4页
雨课堂学堂在线学堂云《大数据与人工智能基础及生物医学应用(中央民族)》单元测试考核答案_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1题本大数据与AI课程主要针对哪类学生?A计算机科学专业的学生B计算机、大数据、AI类、生物医药类等专业的本科生、研究生C数学专业的学生D物理学专业的学生第2题该课程的教学特色是什么?AA理论教学为主B编程学习为主C实践教学为主D案例分析为辅第3题数据挖掘是从哪种类型的数据中提取信息的过程?A小规模且结构化B大量且含噪声C小量但精确D结构化且无噪声第4题下列哪项不属于大数据的特点?AVolume(大量)BVelocity(高速)CValue(价值)DVariable(变量)第5题生物医学进入到了哪个阶段?A单一学科研究B经典实验科学C多学科交叉、系统生物学和多组学时代D医疗保健时代第6题哪一年的人工智能进展被授予诺贝尔物理学奖?A2023年B2024年C2025年D2026年第7题机器学习利用了什么结构来分类和分析大量数据?A决策树B神经网络C支持向量机D随机森林第8题在生命科学领域,复杂系统指的是什么?A简单的细胞过程B单一基因的作用C细胞、组织、生命或生物体内多个相互作用的组件都是复杂系统D生态系统中的单一物种第9题下面哪一个不是生物医学大数据的特点?A数据规模小B数据增长快速C数据潜在价值巨大D开放获取、资源共享第10题Hi-C技术主要用于研究什么?A蛋白质折叠B基因表达水平C全基因组范围内染色质DNA的空间位置关系D细胞代谢途径第11题以下哪一项是多组学研究的例子?A测量血压B分析天气模式C对一个个体进行全基因组测序D进行心理评估第12题下列哪一项是生物医学大数据的主要应用方向?A文档编辑软件开发B游戏设计C新药研发和疾病诊断D社交媒体分析第13题生物医学大数据的研究常用工具不包括:AR语言BPythonCSQL数据库管理DAdobePhotoshop第14题生物医学大数据的数据类型不包含下列哪一种?A图形图像B文本信息C实验数据D个人隐私信息第15题空间转录组学技术可以用来做什么?A研究单个基因的功能B研究细胞内的蛋白质合成C研究组织内基因表达的空间分布D研究生态系统的变化第16题三维基因组学研究的是什么?A基因序列的线性排列B基因组在细胞核内的空间结构CDNA双螺旋结构DRNA分子的三级结构第17题下列哪项不是生物医学大数据面临的挑战?A数据异质性和复杂性B数据量庞大C数据处理速度快D数据安全和隐私保护第18题AI生成内容(AIGC)的例子A使用计算机辅助设计(CAD)软件绘制工程图BAI绘画工具创建艺术作品、大语言模型生成内容等C手动编写代码D制作Excel表格第19题AGI代表什么?A自动化通用接口B人工通用智能C应用图形界面D高级基因识别第20题Gemini是一个什么样的模型?A一款新型的医疗设备B一个多模态大模型,能够处理文本、图像等不同形式的数据C一个新的编程语言D一种新的化学物质第21题该课程不需要任何编程基础。第22题生物医学大数据的数据类型只有文本信息。第23题生物医学已经进入了大数据、AI及多组学时代。第24题大数据的特点之一是其价值密度非常高。第25题空间转录组学可以帮助理解基因表达的空间定位。第26题数据挖掘只能应用于商业领域。第27题人工智能可以模拟人类的记忆和学习功能。第28题大数据和AI在生物医学领域的应用仅限于肿瘤诊疗。第29题生物医学大数据具有开放获取和资源共享的特点。第30题Hi-C技术可以解析全基因组互作模式。第1题下列哪个不是GUI软件用于数据分析的例子?ASASBSPSSCWEKADPython第2题下列哪种编程语言在生物医学领域最常被使用?AMATLABBPerlCR&PythonDOctave第3题下列哪一个不属于四大机器学习编程语言(工具)?APythonBRCJavaDMATLAB第4题下列哪一项是Python的一个优点?A比R慢,尤其是在迭代循环中B免费、开源、速度快C创建独立应用程序的能力有限D比Matlab绘图差第5题WEKA是什么?A一个数据挖掘工作平台B一种统计分析系统C一种专有的商业工具D一个编程语言第6题Python的IDE中,哪一个是由JetBrains开发的?AIDLEBPyCharmCSpyderDJupyterNotebook第7题Colab的主要特点之一是什么?A需要配置环境B不支持GPUC支持免费的GPU访问D不支持代码分享第8题下列关于R语言的说法中哪项是正确的?A它主要用于工程计算B它拥有顶尖水准的制图功能C它是一个商业软件D它不支持扩展包第9题下列哪项是MATLAB的优点?A完全免费B最快的数学和计算平台C无法执行,必须转换成另一种语言D社区合作较少第10题Python社区相较于R社区,在哪个方面较小?A开源包的数量B金融领域的社区C数据科学的应用DAI研究领域第11题在R中,标准包指的是什么?A在R安装过程中事先已经安装好了的包B需要额外购买的包C第三方贡献的包D只能在线使用的包第12题下列哪项不是R语言的优势?A交互式数据分析的强大平台B顶尖水准的制图功能C开发速度比Python快60%D自由、免费、开源第13题下列哪项是Python的缺点?A一些不成熟的包B开源C快速的数据处理能力D适用于多种应用开发第14题在生物医学大数据与AI研究中,下列哪个工具最不适合用于参数优化?AWEKABPythonCSASEnterpriseMinerDGUI软件如SAS、SPSS第15题OCTAVE与MATLAB相比的一个显著优点是什么?AOCTAVE具有更好的图形能力BOCTAVE有更广泛的社区支持COCTAVE是免费且开源的DOCTAVE提供了更多的专有工具箱第16题下列哪项不是Colab的特点?A需要本地配置环境才能使用B提供免费的GPU访问C支持代码执行和文本结合在同一文档中D可以存储笔记本到GoogleDrive第17题SPSSClementine支持以下哪个过程?A仅限于模型评估B数据获取、转化、建模、评估到最终部署C仅限于数据获取D不支持任何数据挖掘过程第18题下面哪一项描述了R包的主要分类?AR包分为基础包和高级包BR包分为官方包和非官方包CR包分为标准包和贡献包DR包分为免费包和付费包第19题下列哪个选项是R语言的优势之一?AR比Python慢,在迭代循环中尤其明显BR拥有良好的向量化运算性能CR创建独立应用程序的能力有限DR绘图功能不如MATLAB第20题Python相较于其他编程语言的一个优势是什么?APython在金融领域的社区比R大BPython是免费的,并且拥有快速的数据处理能力CPython的迭代循环性能较差DPython在迭代循环中的速度不如MATLAB第21题WEKA是一个公开的数据挖掘工作平台,它提供了大量的机器学习算法,每月下载量超过万次。第22题Python和R都是免费、开源且适用于数据科学和机器学习的编程语言。第23题SASEnterpriseMiner是一款开源的数据挖掘工具,提供图形化流程处理环境给用户进行建模。第24题Mahout是ApacheSoftwareFoundation下的一个商业项目,用于提供专有的数据分析算法实现。第25题Colab允许用户编写和执行Python代码而无需任何本地配置,并且可以免费访问GPU资源。第26题MATLAB是一款免费的软件,适合所有数学和交易领域的商业级软件。第27题Octave是一个MATLAB的免费替代品,但它的图形能力不如MATLAB。第28题Python的PyCharmIDE和R的RStudio都为用户提供了一个集成了代码编辑器、控制台、终端以及各种辅助功能标签的工作界面。本章习题第1题在R语言中,用于安装R软件的官方网站是哪个?AGitHubBCRANCStackOverflowDRStudio官网第2题下列哪项不是R语言的集成开发环境(IDE)?AJupyterNotebookBRStudioCVisualStudioCodeDEclipse第3题在R控制台中输入表达式并按Enter后会发生什么?A表达式被保存为脚本B表达式被求值并显示结果C表达式被编译成二进制代码D表达式被转换为函数第4题哪个命令用于创建一个新的工作目录?Adir.create()Bsetwd()Cgetwd()Dlist.files()第5题R的工作空间(workspace)指的是什么?A存储所有用户定义的对象的地方B用户保存的所有数据文件CR程序的源代码DR的帮助文档第6题filter()

函数的主要作用是什么?A添加新列到数据表B删除数据表中的行C根据条件筛选数据表的行D选择特定的列第7题select()

函数用来做什么?A修改现有列的数据B筛选行C创建散点图D选择特定的列第8题使用管道操作符

%>%

的主要优势是什么?A提升代码执行速度B减少内存使用C不需要指定所需参数D自动更新R包第9题CRAN上的主题(Topics)代表了什么?AR语言的新版本BR包的分类集合CR社区的论坛板块DR的官方教程第10题安装R包时使用的函数是什么?Ainstall.packages()Blibrary()Crequire()Dsource()第11题更新R版本时可以使用哪个包来简化过程?AupdateRBinstallrCdevtoolsDremotes第12题mutate()

函数的作用是什么?A删除一列B添加或修改一列C排序数据D分组汇总第13题如何在R中创建一个数据框?Adata.frame()Bmatrix()Cvector()Dlist()第14题当x轴和y轴的数据长度不一致时,plot()

函数会怎样?A正常绘制图形B报错C自动调整长度匹配D忽略较短的一方第15题使用

ggplot2

绘制散点图时,哪个几何对象适合表示点?Ageom_line()Bgeom_bar()Cgeom_point()Dgeom_boxplot()第16题哪个命令可以用来查看当前工作目录?Adir.create()Bsetwd()Cgetwd()Dfile.path()第17题subset()

filter()

函数的区别是什么?Asubset()

是基础R函数,而

filter()

来自

dplyr

包Bfilter()

可以做更复杂的过滤Csubset()

更快D没有区别第18题在R中如何设置工作目录?Adir.create()Bsetwd()Cgetwd()Dlist.files()第19题下面哪个命令是用来安装名为dslabs的包的?Ainstall.packages("dslabs")Blibrary(dslabs)Crequire(dslabs)Dsource("dslabs")第20题如果想要查看已经安装的所有包,应该使用哪个命令?Ainstalled.packages()BsessionInfo()CpackageStatus()Dhelp.search("packages")第21题使用

ggplot2

绘制线性模型平滑线时,应该使用哪个几何对象?Ageom_smooth(method="lm")Bgeom_line()Cgeom_abline()Dstat_smooth()第22题R语言中,%>%

这个符号被称为?A管道操作符B指针操作符C箭头操作符D连接操作符第23题使用

ggplot2

时,aes()

函数主要用于?A设置图表标题B指定绘图元素的美学属性C控制坐标轴刻度D添加文本标签第24题若要在散点图中添加文本标签,应该使用哪个几何对象?Ageom_text()Bgeom_label()Cannotate()Dgeom_point()第25题在R中,如何将一个数值向量转换为因子变量?Aas.factor()Bfactor()Cas.character()Das.numeric()第26题使用

ggplot2

时,theme()

函数主要用于?A设置图表标题B指定绘图元素的美学属性C控制图表的主题元素D添加文本标签第27题使用

ggplot2

绘制分面图(facet)时,应该使用哪个函数?Afacet_wrap()Bfacet_grid()Cgrid.arrange()Dlayout()第28题R语言可以在CRAN网站上免费下载。第29题RStudio是一个必须与R一起安装的软件。第30题在R控制台中输入表达式后,该表达式会被立即求值。第31题filter()

函数只能用于删除数据表中的行。第32题使用

select()

函数可以选择特定的列,但不能同时进行筛选。第33题使用管道操作符

%>%

可以让代码更加简洁和易读。第34题install.packages()

函数只能安装来自CRAN的包。第35题mutate()

函数只能用于添加新列,不能修改现有列。第36题ggplot2

包仅能用于绘制散点图。第37题ggplot2

aes()

函数可以用来设定图表的颜色、形状等美学属性。第38题ggplot2

中的

geom_smooth()

函数可用于拟合回归线。第39题使用

ggplot2

facet_wrap()

函数可以根据某个变量对图表进行分割。第40题ggplot2

labs()

函数可以用来给图表添加标题和轴标签。第41题ggplot2

theme()

函数可以用来定制图表的整体外观。第42题在R中,as.factor()

函数可以将字符型变量转换为因子。第43题ggplot2

geom_text()

函数可以用来在图表中添加文字注释。第44题installr

包可以帮助用户更新R版本,并保留之前的包配置。本章习题第1题Colab指的是什么?A一种编程语言BGoogle开发的一种浏览器插件CGoogleColaboratory的简称,用于编写和执行Python代码DPython的一个库第2题在Colab中,无需进行哪项操作即可使用Python?A编写代码B安装Python环境C执行代码D分享代码第3题下列哪个不是Colab的特点?A免费使用GPUB易于分享C需要本地配置D浏览器内运行第4题Colab笔记本支持哪种类型的单元格?A只有文本单元格B只有代码单元格C文本和代码单元格DHTML单元格第5题在Colab中,如何执行一个代码单元格?A单击代码单元格B使用快捷键“Command/Ctrl+Enter或单击执行图标”C双击代码单元格D拖拽代码单元格第6题Colab笔记本存储在哪里?A用户的GoogleDrive账户B用户的计算机硬盘CColab服务器D云端,但不是GoogleDrive第7题Colab中的文本单元格使用什么格式?AHTMLBLaTeXCMarkdownDXML第8题在Colab中,如何安装额外的Python包?A不需要安装任何包B使用pip命令C使用conda命令D通过导入模块第9题在Colab中,fromgoogle.colabimportfiles的主要用途是什么?A导入Python文件B导出Python文件C上传和下载文件D连接数据库第10题drive.mount('/content/drive')的作用是什么?A创建一个新的Drive文件夹B将GoogleDrive挂载到Colab环境中C删除现有的Drive连接D列出所有可用的Drive文件夹第11题Colab在机器学习社区中被广泛使用,下面哪个不是它的应用之一?A开始使用TensorFlowB开发和训练神经网络C实验TPUsD网站设计与开发第12题哪个命令可以用来从GitHub加载notebooks?AgitpullBGitHubAPICSavingandloadingnotebooksinGitHubDColabAPI第13题什么是NumPy?A一个用于科学计算的Python库B一个用于Web开发的框架C一个用于游戏开发的引擎D一个用于数据可视化的工具第14题以下哪项不是Colab笔记本的一部分?A可执行代码B富文本C图像D数据库查询第15题在Colab中,importnumpyasnp语句意味着什么?A导入numpy并命名为npB导入numpy并命名为numpyC导入整个numpy库D导入numpy的子模块np第16题Colabnotebook的文件扩展名是什么?A.pyB.ipynbC.txtD.html第17题在Colab中,下列哪个库用于绘制图表?ApandasBmatplotlibCscipyDseaborn第18题Colab允许用户免费访问哪种类型的处理器?ACPUBGPUCTPUD所有上述选项第19题如何在Colab中导入自己的数据?A通过URL链接B通过GoogleDriveC通过本地文件系统上传D所有上述选项第20题Colab是否支持与他人共享笔记本?A是B否C仅限于Google员工D仅限于付费用户第21题在Colab中,哪一个不是有效的Python模块导入方式?AimportmoduleBfrompackageimportmoduleCfrommoduleimport*Dmodule.import()第22题下面哪个不是Colab中机器学习的例子?ATensorFlow入门B训练神经网络C构建网站D使用TPU实验第23题Colab是一个在线平台,允许用户无需配置就可以编写和执行Python代码。第24题在Colab中,定义在一个单元格中的变量不能在其他单元格中使用。第25题Colab笔记本只能包含可执行代码,不能包含富文本。第26题当您创建自己的Colab笔记本时,它们会自动保存到您的GoogleDrive账户中。第27题Colab不支持图像、HTML、LaTeX等元素的嵌入。第28题Colab是由Jupyter项目托管的。第29题使用plt.fill_between函数可以填充两个水平曲线之间的区域。第30题NumPy库用于处理数组和矩阵运算。第31题Matplotlib是Python中最著名的2D绘图库。第32题在Colab中,您可以通过condainstall命令来安装Python包。第33题使用fromgoogle.colabimportfiles可以从用户的本地文件系统上传文件。第34题Colab支持使用GoogleDrive的数据,包括电子表格。第35题Colab的机器学习例子不包括创建教程。第36题14.Colab不支持加速硬件如GPUs和TPUs本章习题第1题生物医学大数据的特征不包括以下哪一项?A数据规模大B单一数据模态C复杂、异质化D快速增长第2题生命与健康的大数据与其他大数据相比最显著的特点是什么?A免费获取、开放共享B数据量较小C难以分析D数据价值密度低第3题下列哪项不是生物医学大数据的数据类型?A图形图像B文本信息C实验数据D金融交易数据第4题智能药物研发的主要应用场景不包括?A海量文献信息分析整合筛选药物B化合物高通量筛选C发掘新娱乐用途D发掘药物靶点第5题Exscientia公司通过AI药物研发平台为哪家公司开发创新小分子药物?A强生B默克C葛兰素史克D赛诺菲第6题AI在病理生物学研究中的应用不包括:A病理图像转化为可挖掘的数据B定量化病理诊断和疾病预后C自动生成病理诊断报告D设计新型抗生素结构第7题IBMWatson在ALS研究中使用了哪种方法来鉴定RBPs?A基于基因编辑技术B使用卷积神经网络C基于相关文献学习建立预测模型D利用CRISPR技术第8题人工智能用于医学影像分析的技术路径不包括:A图像识别B深度学习C物理模拟D影像三维重建第9题在智能医学影像的应用方向中,下列哪个不属于其范畴?A病灶识别与标注B靶区自动勾画与自适应放疗C手术机器人操作D智能手术视频解析第10题关于大规模多维组学数据分析,下列说法错误的是:A包含微生物群、空间组学等B主要挑战在于数据整合、偶联、集成C不涉及数字细胞或数字生命的研究D可应用于精准医疗第11题下列哪项不是精准医学的核心要素?A基因测序B靶向治疗/细胞免疫治疗C基因编辑D传统化疗第12题下列哪项是精准医疗的高阶应用层次?A基因测序B靶向治疗/细胞免疫治疗C基因编辑D分子诊断第13题什么是CAR-T疗法的主要区别之一?A只能识别肿瘤表面抗原B更适合应用于实体瘤治疗C是人工合成分子D降低了细胞毒性的风险第14题下列哪项不是AlphaFold2的优势?A预测蛋白质三级结构B高精度预测蛋白质结构C预测突变对蛋白质结构的影响D预测蛋白质相互作用第15题AlphaFold3目前不能够做什么?A预测蛋白质结构B预测DNA、RNA等生物分子的结构及相互作用C开发新药、设计新的疫苗D基于硅基生命生产碳基生命第16题下列哪项不是智慧医疗的优点?A促进优质资源的共享B避免患者重复检查C提供免费医疗服务D促进医疗智能化第17题下列哪项不是公共卫生管理的传统不足?A周期长B数据滞后C预警及时D缺乏实时性第18题下列哪项不是健康大数据应用于健康管理?A风险识别B虚拟护士C精准手术D移动医疗第19题下列哪项不是智能医院管理及公共医疗服务平台的功能?A提供个性化诊疗服务B进行移动健康咨询服务C提供电影推荐D对接医疗服务第20题下列哪项不是数字生物学/数字生命的特征?A自主学习B知识表示与推理C计算机视觉D提供免费医疗咨询第21题下列哪项不是AI在生物医药的主要应用方向?A智能药物研发与筛选B智能医学影像分析C社交媒体广告投放D精准医学第22题下列哪项不是生物信息学的目标?A揭示大量而复杂的生物医学大数据所蕴含的生物医学奥秘B为医生提供手术指导C改善疾病预防与治疗效果D推动新疗法的开发第23题下列哪项不是智能医学影像分析的目的?A提供更快、更准确、更专业的结果B降低假阴性诊断率C提高读片效率D增加医生的工作量第24题下列哪项不是AlphaFold2的应用成果?A预测人类几乎所有蛋白质的结构B预测其他20种模式生物的“蛋白质组”C预测DNA序列D开放预测结果数据库第25题下列哪项不是智能药物研发的流程?A海量文献信息分析整合筛选药物B化合物高通量筛选C发现潜在药物靶点D设计新的社交媒体算法第26题下列哪项不是智能医院管理的特点?A综合性B开放性C游戏化D高可靠性第27题下列哪项不是精准医疗的层次?A基础层次——基因测序B中间层次——靶向治疗/细胞免疫治疗C高阶层次——基因编辑D最终层次——虚拟现实第28题下列哪项不是AGI的特性?A任务与问题理解B决策能力C普遍人类智能水平D无法自主学习第29题下列哪项不是AlphaFold3的新功能?A预测蛋白质结构B预测DNA、RNA等生物分子的结构及相互作用C设计新的社交网络平台D预测蛋白质相互作用第30题下列哪项不是智能药物研发的典型代表?ABenevolentBioBAtomNetCExscientiaDFacebook第31题下列哪项不是数字生物学的未来展望?A硅基生命替代碳基生命的奇点来临B实现碳基生命—造硅基生命—造碳基生命C创建基于AI的虚拟助手D电影《非诚勿扰3》中的人工智能人第32题下列哪项不是智能药物研发的挑战?A研发成本高昂B成功率低C投资回报率逐渐下滑D研发周期短第33题下列哪项不是智能医学影像的应用?A病灶识别与标注B靶区自动勾画与自适应放疗C影像三维重建D电影特效制作第34题下列哪项不是精准医疗的关键?A个人基因组B生活习惯C环境因素D社交媒体使用频率第35题下列哪项不是数字生物学的发展趋势?A数字细胞B数字生命C硅基生命D电子游戏第36题下列哪项不是AI在生物医药的主要应用?A智能药物研发与筛选B智能医学影像分析C大规模多维组学数据分析D视频游戏开发第37题下列哪项不是精准医学的定义?A基于个体的遗传信息提供定制化的治疗方案B结合患者的个性化生活习惯、生活环境进行综合考虑C开展个性化精准治疗,提高疾病预防与治疗效果D仅依赖于患者的临床症状制定治疗方案第38题下列哪项不是精准医疗的的范畴?A基因测序B靶向治疗/细胞免疫治疗C抗体偶联药物(ADC疗法)D传统化疗第39题下列哪项不是数字生物学的例子?AAlphaFold系列BRoseTTAFoldCColabFoldDWindows第40题下列哪项不是数字生物学/数字生命发展的关键?A大数据B算法C算力D传统实验技术第41题生物医学大数据的特点之一是数据规模庞大,动辄达到EB级甚至更高。第42题生物医学大数据的价值密度非常高,因此很容易从中提取有价值的信息。第43题生物医学大数据的数据基本上都是免费且开放共享的第44题AI在药物研发中可以加速化合物筛选过程,提高筛选成功率。第45题Exscientia公司的AI系统完成新药候选的时间和资金成本远远低于传统方法第46题IBMWatson能够从大量文献中学习并成功鉴定出新的ALS相关的RBPs。第47题AI可以帮助病理学家进行更高效的癌症检测,如前列腺癌的区域检测。第48题AlphaFold2只能预测蛋白质的二级结构,而不能预测三级结构。第49题AlphaFold3不仅限于蛋白质结构预测,还可以预测DNA、RNA等生物分子的结构及相互作用。第50题AlphaFold的成功意味着所有蛋白质结构都可以立即被实验验证。第51题生物医学大数据与AI相辅相成,共同推动了精准医疗的发展。第52题生物医学大数据的复杂性和异质化增加了数据分析的难度。第53题生物医学大数据的增长速度已经超过了摩尔定律的速度。第54题生物医学大数据的价值主要体现在其庞大的数据量上。第55题AI可以在药物研发的不同阶段减少不确定性和缩短研发周期。第56题精准医学强调个性化治疗,而不是一刀切的治疗方法。第57题数字生物学的发展将使生物学从科学变为工程学。第58题AGI具有普遍人类智能水平,能够执行各种任务和适应环境。第59题AlphaFold2的预测结果不需要任何实验验证。第60题生物医学大数据的开放共享有助于加快科学研究进展。本章习题第1题流行病学主要研究的是:A动物疾病B植物健康C人群中疾病与健康状况的分布及其影响因素D个体心理状态第2题Meta分析中RR指的是:A风险减少率B风险增加率C相对风险(RiskRatio)D回归系数第3题下列哪项不是Meta分析的研究对象?A人群B单个病人C疾病与健康状况D探索病因第4题Meta分析属于哪种类型的研究?A原始研究B初级研究C二次研究D描述性研究第5题数据提取不包括下列哪一项?A样本量BOR或RRC95%CID研究者的私人信息第6题用于调整漏斗图不对称的方法是什么?A数据清洗B敏感性分析C修剪-填充方法D数据增强第7题本Meta分析中的异质性测试使用了什么检验?AT检验BF检验CQ检验DZ检验第8题本Meta分析中使用的随机效应模型估计器是什么?ADLBFECREMLDML第9题在本Meta分析中,使用什么函数来执行初步的Meta分析?Ametareg()Bforestplot()Cmetabin()Drma()第10题在本Meta分析中,使用什么函数来安装所需的R包?Ainstall.packages()Blibrary()Csource()Drequire()第11题在本Meta分析中,使用什么函数来读取Excel格式的数据文件?Aread.csv()Bread_excel()Cread.table()Dreadxl()第12题下列哪个模型在估计效应量时不考虑研究间的变异性?A随机效应模型B固定效应模型C混合效应模型D多水平模型第13题当使用trimfill函数调整漏斗图不对称时,以下哪一项是该方法所添加的研究类型?A实际研究B虚构研究C历史研究D对照研究第14题metabin函数中,参数sm="OR"表示什么?A风险比B比值比C发病密度比D相对风险第15题使用forest函数生成森林图时,leftcols="studlab"参数的作用是什么?A显示研究标签B不显示研究标签C显示左侧颜色D不显示左侧颜色第16题如果一个meta分析中有明显的发表偏倚,应该使用哪种方法来校正?AtrimandfillBlogistic回归C线性回归D卡方检验第17题在R语言中,哪个函数可以用来读取Excel文件?Aread_excelBread.csvCscanDsource第18题metareg函数主要用于做什么?A生成森林图B进行meta回归C创建数据框D执行t检验第19题bubble函数通常用来绘制什么类型的图表?A漏斗图B气泡图C散点图D条形图第20题在本章学习中,tau^2在Meta分析中的含义是什么?A总体变异B残差变异C研究内变异D研究间变异第21题在本章Meta分析中,I²值接近于100%表示什么?A异质性较低B异质性较高C没有异质性D数据质量高第22题在本章代码中,Q-Profilemethod主要用于什么?A估计tau^2B计算P值C绘制森林图D评估发表偏倚第23题在本章代码中,funnel函数用于绘制哪种图形?A森林图B漏斗图C散点图D条形图第24题setwd()函数在R语言中用于做什么?A设置工作目录B获取当前工作目录C安装包D加载包第25题在read_excel函数中,如果路径不在工作目录中,应该如何处理?A忽略路径B使用绝对路径C修改文件名D删除路径第26题library(meta)命令的作用是什么?A安装meta包B更新meta包C卸载meta包D加载meta包第27题summary()函数在Meta分析中用于做什么?A绘制图形B查看结果摘要C执行统计测试D保存结果第28题在Meta分析中,随机效应模型下的合并RR值为1.4070,其95%CI为[1.2369;1.6004],这意味着什么?A结果无统计学意义B结果有统计学意义C结果不确定D结果不适用第29题exp()函数在转换logOR为原始OR值时的作用是什么?A加法B减法C乘法D指数运算第30题tf4<-trimfill(metaresult4,comb.fixed=T)语句中的comb.fixed=T代表什么意思?A使用固定效应模型B使用随机效应模型C不使用任何模型D同时使用固定效应和随机效应模型第31题H值在Meta分析中代表什么?A异质性程度B研究数量C观察人数D事件发生数第32题I^2值超过多少被认为是高度异质性?A0.25B0.5C0.75D1第33题在Meta分析中,tau^2的受限最大似然估计(REML)是用来做什么的?A估计研究间方差B估计研究内方差C估计总体方差D估计样本方差第34题Q值在Meta分析中代表什么?A研究间的异质性B研究内的异质性C研究间的相似性D研究内的相似性第35题在Meta分析中,p-value小于多少被认为是统计显著?A0.1B0.05C0.01D0.001第36题metaresult5<-metabin(event.e,n.e,event.c,n.c,data=X0617,sm="OR",studlab=paste(study))命令中,studlab=paste(study)代表什么意思?A添加研究标签B删除研究标签C修改研究标签D保存研究标签第37题X0618$Gender<-c(...)命令的作用是什么?A添加新列B删除列C修改现有列D保存列第38题tf5<-trimfill(metaresult5,comb.random=T)命令中的comb.random=T代表什么意思?A使用固定效应模型B使用随机效应模型C不使用任何模型D同时使用固定效应和随机效应模型第39题Numberofstudies:k=23表示什么意思?A研究数量为23B观察人数为23C事件发生数为23D以上都不是第40题Numberofobservations:o=32260表示什么意思?A研究数量为32260B观察人数为32260C事件发生数为32260D以上都不是第41题Numberofevents:e=11632表示什么意思?A研究数量为11632B观察人数为11632C事件发生数为11632D以上都不是第42题RR95%-CIzp-value输出中的z代表什么?A标准误差BZ分数Ct分数DF分数第43题Quantifyingheterogeneity:部分中,tau^2、I^2和H分别代表什么?A研究间方差、异质性百分比、异质性比例B研究间方差、异质性比例、异质性百分比C研究内方差、异质性百分比、异质性比例D研究内方差、异质性比例、异质性百分比第44题Testofheterogeneity:部分中,Q、d.f.和p-value分别代表什么?A异质性检验统计量、自由度、P值B异质性检验统计量、P值、自由度C自由度、异质性检验统计量、P值DP值、自由度、异质性检验统计量第45题流行病学是一门研究人类疾病在人群中的分布及其影响因素的学科。第46题本Meta分析遵循Cochrane干预措施系统评价手册5.1.0版的指南。第47题Meta分析是一种二次研究,它依赖于初次研究所提供的数据。第48题使用随机效应模型得到的可信区间总是比固定效应模型窄。第49题在Meta分析中,I²值越小,说明研究间的异质性越大。第50题trimfill方法能够完全消除发表偏倚的影响。第51题read_excel函数只能读取位于工作目录中的Excel文件。第52题forest函数不能用于展示单个研究的结果。第53题在Meta分析中,如果P值小于0.05,则认为结果具有统计学意义。第54题metareg函数可以在不考虑异质性的情况下直接应用。第55题bubble函数绘制的图表可以用来直观地展示meta回归的结果。第56题tau^2的估计值越大,代表研究间的变异程度越高。第57题Q值大于20通常意味着存在显著的异质性。第58题I^2值为0%表示完全没有异质性。本章习题第1题使用setwd()函数的作用是什么?A设置工作目录B获取当前工作目录C写入文件D读取文件第2题如何在R中定义一个向量?Avector("numeric",length=10)Bc("Iran","SaudiArabia")Cdata.frame()Dlist()第3题data[which(data$location%in%East_Medit),]这段代码做了什么操作?A创建了一个新列B删除了指定的行C筛选出特定国家的数据D修改了列名第4题rownames(data1)<-NULL这行代码的作用是什么?A设置行名为NULLB去掉不连续的行名C显示行名D添加新的行名第5题write.csv(data1,file="East_Medit.csv")的功能是什么?A将数据框写入CSV文件B从CSV文件读取数据框C删除CSV文件D显示CSV文件的内容第6题ggplot包中的geom_violin()函数用于绘制哪种图表?A折线图B箱线图C小提琴图D直方图第7题scale_color_manual(values=c(1:6))的作用是什么?A自动设置颜色B手动设置颜色C设置透明度D设置点的大小第8题theme(plot.title=element_text(hjust=0.5))实现了什么效果?A标题居中B标题左对齐C标题右对齐D标题倾斜第9题dev.off()函数是用来做什么的?A关闭图形设备B打开图形设备C保存图形D显示图形第10题sapply(East_Medit6t,class)这段代码的作用是什么?A显示数据框内的数据属性B显示数据框内的数值C显示数据框内的字符串D显示数据框内的逻辑值第11题read.csv("East_Medit6t.csv",header=T)中header=T代表什么意思?A文件包含表头B文件不包含表头C表头是数字D表头是日期第12题pheatmap(East_Medit6t3,cluster_cols=F)中cluster_cols=F参数的意义是什么?A不对列进行聚类排序B对列进行聚类排序C不对行进行聚类排序D对行进行聚类排序第13题下列哪个选项不是aes()函数的参数?AxByCfillDtitle第14题geom_line(size=1.5,shape=4)中size参数控制的是什么?A点的大小B线的粗细C线的颜色D点的形状第15题colnames(data)[11]<-'Cases_per_million'的作用是什么?A添加新列B修改列名C删除列D复制列第16题AP<-c("Japan","Philippines","Malaysia","India","Bangladesh","Indonesia")这行代码创建了什么类型的对象?A数据框B向量C列表D因子第17题head(EM_Index)显示的是数据框的哪部分?A最后几行B中间几行C第一行D最前几行第18题str(EM_Index)显示的是什么信息?A数据结构B数据类型C数据长度D数据值第19题apply(EM_Index[1:1231,2:7],2,mean,na.rm=T)计算的是什么?A行均值B列均值C行中位数D列中位数第20题如果有NA值,计算平均值时需要加入哪个参数以避免结果为NA?Ana.omitBna.actionCna.rm=TDna.exclude第21题Active=Confirmed-Deaths-Recovered这行代码添加了一列什么数据?A治愈病例B死亡病例C确诊病例D活跃病例第22题library(dplyr)加载的是哪个包?A数据可视化包B数据清洗包C时间序列分析包D机器学习包第23题filter(location%in%East_Medit)的作用是什么?A过滤出不在East_Medit列表中的地点B过滤出仅在East_Medit列表中的地点C将所有地点转换为East_MeditD替换地点名称为East_Medit第24题mutate,

filter,

select属于哪个包的功能?Aggplot2BdplyrClubridateDepitools第25题geom_point()函数用于绘制哪种类型的图表?A折线图B点状图C饼图D条形图第26题hist(data1$total_cases_per_million)绘制的是什么类型的图表?A箱线图B小提琴图C直方图D散点图第27题which(names(data)=="stringency_index")的结果是什么?A返回"stringency_index"列的索引位置B返回"stringency_index"列的所有值C返回"stringency_index"列的名称D返回"stringency_index"列的类型第28题length(data$stringency_index)返回的是什么?A列的长度B列的宽度C列的最大值D列的最小值第29题scale_shape_manual(values=c(1,4,5,7,9,11))设置了什么?A点的颜色B点的透明度C点的形状D点的大小第30题axis.text.x=element_text(angle=45,vjust=0.5)的作用是什么?A旋转x轴文本标签B旋转y轴文本标签C改变标题字体D改变坐标轴刻度第31题boxplot(total_cases_per_million~location,data=data1)绘制的是什么类型的图表?A折线图B箱线图C小提琴图D直方图第32题ggplot(vd,aes(x=v,y=y,group=type))+geom_line()中group=type的作用是什么?A分组线条样式B分组线条颜色C分组线条连接点D分组线条透明度第33题scale_alpha__manual()用于自定义点或线的透明度。第34题scale_size__manual()不能用于自定义点的大小或线条的宽度。第35题covid19_data1=data.frame(covid19_data,Active)这行代码创建了一个新的数据框,并加入了活跃病例一列。第36题write.csv(covid19_data2,file="covid_19_data1.csv")中的covid19_data2应该被替换为实际要写入文件的数据框名称。第37题data$Entity表示访问数据框data中的Entity列。第38题colnames(data)[4]<-'Stringency_Index'改变了第四个列名。第39题data1=data[which(data$Entity%in%East_Medit),]语句筛选出了data中Entity中的East_Medit的数据第40题dev.off()关闭了最后打开的图形设备。第41题sapply(East_Medit6t,class)检查了East_Medit6t数据框内各列的数据类型。第42题rownames(data1)=c(1,2,3,4,5,6)手动设定了行名。第43题pheatmap(East_Medit6t3,cluster_cols=F)不允许对列进行聚类排序。第44题apply(EM_Index[1:1231,2:7],2,mean,na.rm=T)计算了选定列的平均值,忽略了NA值。本章习题第1题在Python中,可以通过plt.rcParams['figure.figsize']=10,12设置图形大小。第2题使用warnings.filterwarnings('ignore')可以忽略所有的警告信息。第3题%matplotlibinline只能在JupyterNotebook或JupyterLab环境中使用。第4题在处理日期格式时,df['Date']=pd.to_datetime(df.Date)可以将日期字符串转换为日期时间对象。第5题groupby操作后可以直接进行计算,不需要额外调用其他方法。第6题保存DataFrame到文件时,to_excel方法可能会遇到问题,而to_csv通常是可靠的替代方案。第7题PlotlyExpress可以用来快速生成交互式图表。第8题Prophet库可以用于非时间序列数据的预测。第9题Prophet模型的输入必须包含名为ds和y的两列,其中ds表示日期时间,y表示数值。第10题Prophet预测结果中的yhat表示预测值的确切点估计。第11题pd.read_csv()函数可以读取CSV文件,并将其转换为DataFrame。第12题使用query方法可以根据条件筛选DataFrame中的行。第13题plotly.express是对plotly.graph_objects的高级包装,用于快速数据探索和图形生成。第14题若要在Plotly中创建一个带有颜色渐变的柱状图,应该使用color_discrete_sequence参数。第15题若要在Plotly中设置图表背景颜色,应该使用fig.update_layout(bgcolor='rgb(230,230,230)')。第16题Prophet模型默认不考虑节假日等特殊事件的影响。第17题在Prophet中,make_future_dataframe方法用于生成未来时间点的数据框。第18题若要在Plotly中创建一个带有标记的折线图,应该使用mode='lines+markers'。第19题在Plotly中,若要显示交互式地图,应该使用Folium库。第20题若要在Prophet中添加额外的回归变量,应该使用add_regressor方法。第21题若要在PandasDataFrame中正确解析日期格式,应使用哪个函数?Apd.to_dateBpd.datetimeCpd.to_datetimeDpd.date_parser第22题在绘图时,为了确保图形直接嵌入JupyterNotebook中,应该使用哪个魔法命令?A%matplotlibnotebookB%matplotlibinlineC%pyplotinlineD%plotinline第23题下列哪项不是PlotlyExpress的特点?A简洁的APIB高级包装器C快速数据探索D数据清洗工具第24题使用groupby后想要得到DataFrame形式的结果,可以使用什么方法?Areset_index()Bset_index()Csort_values()Dmerge()第25题Prophet模型默认创建的预测区间宽度是多少?A0.8B0.9C0.95D0.99第26题如果需要生成未来的时间点用于预测,Prophet库提供了哪个方法?Amake_future_dataframe()Bgenerate_future_dates()Ccreate_prediction_timeline()Dextend_time_series()第27题Plotly图表的背景颜色可以通过哪个参数设置?Afig.update_layout(bgcolor='rgb(230,230,230)')Bfig.set_background(color='rgb(230,230,230)')Cfig.update_layout(plot_bgcolor='rgb(230,230,230)')Dfig.set_plot_bgcolor('rgb(230,230,230)')第28题在绘制柱状图时,若要指定颜色离散序列,应该使用哪个参数?Acolor_discrete_sequenceBcolor_continuous_scaleCcolor_paletteDcolor_map第29题使用warnings.filterwarnings('ignore')的作用是什么?A打印所有警告信息B忽略所有的警告信息C抛出异常代替警告D记录警告到日志文件第30题若要计算每日新增确诊病例数,应该对原始累计数据进行什么操作?A直接求和B求差分C排序D过滤第31题df.groupby(df['Date']).sum()语句主要用于哪种类型的聚合?A计算每组的数量B计算每组的平均值C计算每组的总和D计算每组的最大值第32题当保存DataFrame到Excel文件时遇到问题,通常会尝试哪种替代方案?A使用CSV格式保存B将数据转换为JSON格式C使用SQL数据库存储D直接在Python中打印输出第33题在Plotly中创建一个散点图,应当调用的方法是?Afig.add_trace(go.Scatter())Bfig.add_trace(go.Bar())Cfig.add_trace(go.Line())Dfig.add_trace(go.Pie())第34题若要从R语言环境中导入COVID-19数据分析的结果,应使用哪个函数?Aread_excelBpd.read_csvCread_sqlDload_rda第35题Prophet库主要适用于以下哪种任务?A分类任务B回归任务C时间序列预测D聚类任务第36题在Prophet中,yhat_lower代表什么?A预测值的上限B预测值的下限C预测值的确切点估计D实际观测值第37题若要过滤特定国家的数据,比如巴西,应该使用的查询语句是?Adf[df['Country']=='Brazil']Bdf.query('location=="Brazil"')Cdf.filter('location','Brazil')Ddf.select('location','Brazil')第38题使用to_datetime函数时,如果日期是Unix时间戳,应该如何指定参数?Apd.to_datetime(df['ds'],unit='s')Bpd.to_datetime(df['ds'],format='%Y-%m-%d')Cpd.to_datetime(df['ds'],infer_datetime_format=True)Dpd.to_datetime(df['ds'],tz='UTC')第39题若要将Prophet预测结果可视化,可以使用哪些方法?Aplot

plot_componentsBplot_forecast

plot_residualsCshow_prediction

display_componentsDvisualize_forecast

plot_trend第40题在Pandas中,如何重命名一列的名称?Adf.rename(columns={'old_name':'new_name'})Bdf.columns.rename({'old_name':'new_name'})Cdf.rename_column('old_name','new_name')Ddf.change_column_name('old_name','new_name')第41题若要在Plotly中创建一个折线图并添加标记,应该调用的方法是?Afig.add_trace(go.Scatter(mode='lines'))Bfig.add_trace(go.Scatter(mode='markers'))Cfig.add_trace(go.Scatter(mode='lines+markers'))Dfig.add_trace(go.Line())第42题在Prophet中,interval_width参数表示什么?A置信区间的宽度B预测区间的宽度C时间间隔的长度D数据点之间的距离第43题若要在Python代码运行时忽略所有警告信息,应该使用哪个命令?Awarnings.ignore()Bwarnings.filterwarnings('ignore')Cwarnings.suppress()Dwarnings.disable()第44题在Pandas中,groupby操作后得到的对象是什么类型的?ADataFrameBSeriesCGroupByObjectDList第45题Prophet模型的输入必须包含哪两列?Ads

yBdate

casesCtime

valueDx

y第46题若要在Plotly中创建一个带有颜色渐变的柱状图,应该使用哪个参数?Acolor_discrete_sequenceBcolor_continuous_scaleCcolor_paletteDcolor_map第47题若要在Plotly中设置图表标题,应该使用哪个参数?Atitle_textBchart_titleCgraph_titleDfigure_title第48题若要在Plotly中创建一个饼图,应该调用的方法是?Afig.add_trace(go.Scatter())Bfig.add_trace(go.Bar())Cfig.add_trace(go.Line())Dfig.add_trace(go.Pie())第49题在Plotly中,若要显示交互式地图,应该使用哪个库?AMatplotlibBSeabornCFoliumDBasemap第50题若要在Prophet中调整季节性相关参数,应该使用哪个属性?Aseasonality_modeBseasonality_prior_scaleCyearly_seasonalityDAlloftheabove第51题若要在Prophet中添加额外的回归变量,应该使用哪个方法?Aadd_regressorBadd_variableCadd_featureDadd_predictor本章习题第1题基因测序的成本在过去几年里大幅下降。第2题AACRGENIE项目是一个国际性的、开放的泛肿瘤登记数据项目。第3题ICGC目标是获取多达50种肿瘤及其亚型的基因组、转录组和表观遗传的全部信息。第4题cBioPortal提供交互式分析模块。第5题TCGA数据库包括基因组拷贝数变化、表观遗传、基因表达谱、miRNA等数据。第6题GDC平台支持从各种NCI计划获得的标准化基因组数据集的接收、质量控制、整合、存储和再分配。第7题TIDE框架用于研究肿瘤免疫逃逸和免疫治疗反应的途径和调节机制。第8题分子组学数据描述了细胞系统和组织样本中分子的丰度或状态。第9题使用临床大数据筛选样本可以加快研究进程。第10题临床大数据分析与挖掘可以帮助进行综合健康评估。第11题疾病风险预测公式Risk=w1SNP1+w2SNP2+…+wi*SNPi中的变量代表风险权重和单核苷酸多态性位点。第12题个性化的乳腺癌药物治疗首次人体试验在牛津大学开始。第13题个性化医疗的一个挑战是平均响应率低至25%。第14题DDR1是实体瘤治疗的有效靶点。第15题使用深度生成模型设计的新小分子DDR1抑制剂展示了较好的药代动力学。第16题数据融合指的是多平台多队列、多维、多模态、超复杂的数据整合。第17题生物医疗大数据的未来发展需要考虑强人工智能的发展。第18题TCGA项目的资助方是哪两个机构?A美国国立癌症研究所(NCI)和国家人类基因组研究所B私人公司和组织C国际组织和WHOD两个非营利机构第19题TCGA项目包含多少患者的配对样本?A5000B7500C11000D20000第20题TCGA数据库提供的数据量大约是多少?A1PBB2.5PBC5PBD10PB第21题AACRGENIE项目包含超过多少个肿瘤患者的数据?A10000B110000C100000D1000000第22题cBioPortal属于哪类资源?A癌症组学项目B数据存储库C交互式Web应用D医疗设备制造商第23题大数据分析在临床转化中的一个应用是什么?A设计新的体育运动B创作音乐C个性化诊疗D改善城市规划第24题在药物设计中使用AI可以做什么?A减少药物的副作用B发现新靶点C缩短药物审批时间D所有上述选项第25题ICGC的目标是获取包括胆道癌、膀胱癌、血癌等在内的多少种肿瘤及其亚型的基因组、转录组和表观遗传的全部信息?A20B30C50D100第26题GEO数据库是哪种类型的资源?A癌症组学项目B数据存储库C交互式Web应用D医疗设备制造商第27题以下哪个不是常见的癌症研究数据类型?A分子组学数据B扰动表型数据C分子相互作用数据D地理位置数据第28题跨队列聚合(cross-cohortaggregation)是指集成来自哪里的数据?A同一队列B不同队列C单一样本D同一样本第29题跨模态整合(cross-modalityintegration)是指跨多种什么集成数据?A数据来源B数据模式C数据格式D数据大小第30题TCGA项目涉及多少种不同的数据类型?A3B5C7D10第31题TCGA项目完成后,数据访问有何限制?A完全公开无任何限制B只对学术研究人员开放C需要申请权限D仅限美国国内用户第32题GDC平台能够轻松搜索、下载并分析什么类型的数据?A临床信息B基因组特征数据C两者皆是D以上都不是第33题TCGA项目结束时,总共覆盖了多少种癌症类型?A10B20C33D50第34题ICGC项目的目标是什么?A获取50种肿瘤及其亚型的基因组、转录组和表观遗传的全部信息B获取33种肿瘤类型的基因组数据C获取20种肿瘤的临床信息D获取10种罕见癌症的信息第35题GDC平台是由哪个机构建立的?A美国国立癌症研究所(NCI)BWHOCFDADCDC第36题GDC平台为用户提供哪些服务?A标准化的生物样本B临床和分子数据C序列分析工具D所有上述选项第37题TCGA项目中,每种肿瘤类型至少有多少个样本?A10B50C100D300第38题TCGA项目的数据可以通过哪些平台访问?AcBioPortalBGDCC两者皆可D以上都不是第39题AACRGENIE项目中,参与的癌症中心包括哪些?A约翰霍普金斯大学西德尼金梅尔癌症中心BMD安德森癌症中心C纪念斯隆凯特琳癌症中心D以上都是第40题AACRGENIE项目旨在为全球癌症研究和临床治疗提供什么?A测序技术B信息C药物D以上都不是第41题GDC平台支持哪种类型的分析?A高水平序列分析B低水平序列分析C临床数据分析D影像数据分析第42题TIDE框架从免疫肿瘤学研究中收集的数据主要用于什么?A研究肿瘤免疫逃逸和免疫治疗反应的途径和调节机制B开发新的药物C诊断疾病D预防疾病第43题在癌症研究中,分子组学数据描述了细胞系统和组织样本中分子的什么?A结构B功能C丰度或状态D位置第44题跨队列聚合(cross-cohortaggregation)和跨模态整合(cross-modalityintegration)能显著提高大数据分析的什么?A速度B成本C可靠性和深度D简单性第45题多组学研究建立了胃癌的精准分子分型,该研究方法是?A单纯的基因组学分析B单纯的蛋白质组学分析C综合多种组学数据进行分析D单纯的代谢组学分析第46题使用临床大数据筛选样本的优势不包括?A选择面广B控制干扰因素C加快研究进程D增加人工成本第47题临床大数据分析与挖掘可以帮助进行健康评估,这通常涉及到?A统计学建模B社交媒体分析C游戏开发D房地产投资第48题数据融合指的是什么?A来自同一队列的数据的集成B多平台多队列、多维、多模态、超复杂的数据整合C数据的简单合并D数据的物理连接本章习题第1题使用read.table()读取文件时,如果文件的第一行不是标题,则应设置header=F。第2题exprs()函数可以用来从ExpressionSet对象中提取样本的表型信息。第3题BiocManager::install()安装包之前必须先安装BiocManager。第4题table(ids$symbol)可以用来统计每个基因对应的探针数。第5题exprSet=exprSet[rownames(exprSet)%in%ids$probe_id,]这行代码会删除表达矩阵中所有行。第6题exprSet<-exprSet[rownames(exprSet)%in%probes,]这行代码会保留所有不在probes列表中的探针。第7题exprSet=exprSet[rownames(exprSet)%in%ids$probe_id,]这行代码不会改变原始的exprSet。第8题exprSet<-exprSet[rownames(exprSet)%in%probes,]这行代码会创建一个新的exprSet对象。第9题exprSet=exprSet[rownames(exprSet)%in%ids$probe_id,]这行代码会增加exprSet的维度。第10题exprSet<-exprSet[rownames(exprSet)%in%probes,]这行代码会保持exprSet的行列数不变。第11题exprSet=exprSet[rownames(exprSet)%in%ids$probe_id,]这行代码会根据探针ID筛选出相应的行。第12题exprSet<-exprSet[rownames(exprSet)%in%probes,]这行代码会根据探针ID筛选出相应的行。第13题使用read.table()读取文件时,参数header=T表示第一行作为列名。第14题在R语言中,suppressPackageStartupMessages()可以用来抑制加载包时的信息输出。第15题表达矩阵exprSet的第一列通常包含的是样本ID。第16题hclust()函数进行层次聚类分析时,输入的数据必须是距离矩阵。第17题PCA主成分分析的主要目的是为了简化数据维度并解释尽可能多的方差。第18题在R中,dim(exprSet)返回的是表达矩阵的行列数。第19题table(rownames(exprSet)%in%ids$probe_id)可以用来检查有多少探针ID存在于表达矩阵中。第20题exprSet<-exprSet[rownames(exprSet)%in%ids$probe_id,]语句中,逗号后面为空表示选择所有列。第21题使用by(exprSet,ids$symbol,function(x)rownames(x)[which.max(rowMeans(x))])可以找出每个基因最高表达量的探针。第22题在提取小表达矩阵时,如exprSet[ids[,2]=='IGKC'],这表示仅保留属于IGKC基因的探针。第23题在R中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论