数据科学导论(山东联盟)智慧树知到期末考试答案2024年_第1页
数据科学导论(山东联盟)智慧树知到期末考试答案2024年_第2页
数据科学导论(山东联盟)智慧树知到期末考试答案2024年_第3页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据科学导论(山东联盟)智慧树知到期末考试答案2024年数据科学导论(山东联盟)将“原始数据”转换为“一次数据”(或“二次数据”)的过程,在数据科学中称为()

A:数据柔术(DataJujitsu)B:数据产品(DataProducts)C:数据打磨(DataWrangling)D:数据改写(DataMunging)答案:数据打磨(DataWrangling)x=c(42,7,64,9)x[-2]的执行结果是()

A:4279B:649C:42649D:427答案:42649m1n1c(m1,n1)执行结果:()

A:928374B:9724C:111111D:987234答案:987234图灵奖获得者JimGray提出了科学研究的第四范式,是指()。

A:需要直接面对所研究的物理对象。B:只需要从大量数据中查找和挖掘所需要的信息和知识。C:模拟仿真要研究的物理对象。D:理论推导物理模型答案:只需要从大量数据中查找和挖掘所需要的信息和知识。如果一个计算机系统在完成某一类任务T的性能P能够随着经验E而改进,则称该系统在从经验E中学习,将此系统称为()。

A:手写体识别系统B:机器学习系统C:机器人驾驶学习系统D:西洋双陆棋对弈系统答案:机器学习系统主要采用分类分析法和趋势分析法,关注的重点是“未来”的数据分析类型是()

A:推断性分析B:规范性分析C:描述性分析D:预测性分析答案:预测性分析K-Means算法聚类的原始数据集假如有150个对象,选择3个对象作为初始聚类中心对象,那么k值是

A:50B:3C:5D:150答案:3()函数可对数据对象进行统计概述。

A:mean()B:max()C:sum()D:summary()答案:summary()通常用于从数据中发现未知的模式信息,当训练集中未带标签信息时,常采用的机器学习算法是()

A:半监督学习B:无监督学习C:随机森林算法D:有监督学习答案:无监督学习在大数据时代,人们对数据的认识与研究视角是()。

A:数据能为我做什么B:如何设计算法和模型C:我能为数据做什么D:如何降低计算复杂度答案:数据能为我做什么data1<-c(1,2,3,NA,4)mean(data1)的执行结果是()

A:NAB:NULLC:2.5D:T答案:NAKNN算法模型中,选择未知样本一定范围内确定个数的K个样本,该K个样本中(),则未知样本判定为该类型。

A:第一个样本属于某一类型B:最后一个样本属于某一类型C:大多数样本属于某一类型D:居中的样本属于某一类型答案:大多数样本属于某一类型向量age1中保存如下值:3,6,7,2,5,4,1,5,8,1,6,9,4,3,7,8,4。哪个命令用于找出25%和75%分位数。

A:Quantile(data1,25%,75%)B:quantile(data1,100)0.25,0.75C:quantile(data1,c(0.25,0.75)D:quantile(data1)0.25,0.75答案:quantile(data1,c(0.25,0.75)数据产品开发具有以数据为中心、多样性、层次性和()等特征。

A:结构性B:功能性C:增值性D:延展性答案:增值性经过一定的转换处理之后,可以用传统的关系型数据库存储和管理的数据是()

A:半结构化数据B:非结构化数据C:结构化数据D:海量数据答案:半结构化数据IBM认为,大数据是拥有以下四个共同特点(又称为"4V"):极大的数据量级、以极快的速度移动、极广泛的数据源类型以及()

A:极高的准确性B:极高的真实性C:极高的多样性D:极高的长久性答案:极高的多样性R程序包加载到内存可以使用()函数。

A:install.packages()B:install.package()C:install()D:library()答案:library()数据集合:3,4,8,7,6,3,2,5,7,1,5,8,3,2,7,6,4,保存向量dd中。哪个命令用于找出25%分位数。

A:quantile(dd)0.25B:quantile(dd,100)0.25C:quantile(dd,0.25)D:Quantile(d'd,25%)答案:quantile(dd,0.25)quantile()函数中默认的分位点是()

A:0%、25%、50%、75%和100%B:0%、20%、40%、60%、80%和100%C:0%和100%D:0%、50%和100%答案:0%、25%、50%、75%和100%seq(from=3,to=21,by=3)执行结果是()

A:36912151821B:35712151821C:36913151921D:3579131721答案:3数据科学需要解决的终极问题是将大数据放在一个完整的生态系统之中去认识与利用,建设“数据生态系统”。

A:错误B:正确答案:正确数据可视化的基础方法建立在视觉编码方法论基础上,应用不仅限于特定领域或任务范围。

A:错误B:正确答案:正确一些在低维度空间上表现较好的算法很可能在高维度空间数据上效果低或效率低,甚至不可行。该现象在机器学习算法的过拟合现象。

A:错误B:正确答案:错误将数据的特征值按比例缩放,使之落入一个特定的区间,这种加工方法称为数据清洗。

A:错误B:正确答案:错误数据工程师需要开发能对数据进行整合、存储和提取的系统,并从软件的应用中获取数据。

A:正确B:错误答案:正确数据产品开发更加强调的是数据加工的增值活动。

A:错误B:正确答案:正确矩阵是包含同种数据的二维数据结构。

A:正确B:错误答案:正确矩阵是包含各种数据的二维数据结构。

A:正确B:错误答案:错误预定义审计的前提条件来源数据带有自描述性信息。

A:对B:错答案:对数据审计、数据清洗、数据变换、数据集成等数据预处理活动并不一定存在互斥关系,多个活动在内涵和外延存在一定的重叠关系,在一项预处理任务中可能采用多种加工方法。

A:错B:对答案:对数据科学以揭示“大数据”的内容、形态、规律为核心内容。

A:正确B:错误答案:正确视觉通道是一种数据可视化的基础方法,在视觉上将目标物体或形象与另一领域的参照物进行相似性对比。

A:正确B:错误答案:错误数据学科是一门通过认识数据问题,用技术的方法解决数据问题的科学。

A:正确B:错误答案:错误黑客Hacker是一个闯入计算机网络系统,目的在于破坏和偷窃信息的个体。

A:正确B:错误答案:错误K-means算法是一个经典的分类算法。

A:错误B:正确答案:错误数据科学中的“计算”包括数据的查询、挖掘、洞见、分析、可视化等更多类型。

A:正确B:错误答案:正确函数knn()返回一个因子向量,为测试数据集中的每一个案例返回一个预测标签值。

A:错误B:正确答案:正确KNN(K-NearestNeighbor)算法是决策树学习的机器学习算法的一种。

A:错误B:正确答案:错误KNN(K-NearestNeighbor)算法是基于实例的学习的机器学习算法的一种。

A:正确B:错误答案:正确write.table()与write.csv()函数可以很方便的将数据写入表格型数据文档。

A:正确B:错误答案:正确数据产品开发是数据科学的重要研究任务之一,关于数据产品开发正确的叙述()。

A:数据产品开发更加强调的是数据加工的增值活动。B:数据产品开发具有以数据为中心、多样性、层次性和增值性等特征。C:数据产品开发能力也是数据科学家的核心竞争力。D:数据科学的学习目的之一是提升自己的数据产品开发能力。答案:数据产品开发具有以数据为中心、多样性、层次性和增值性等特征。###数据产品开发更加强调的是数据加工的增值活动。###数据产品开发能力也是数据科学家的核心竞争力。###数据科学的学习目的之一是提升自己的数据产品开发能力。数据数据科学家的工作包括()。

A:用多种高级算法对数据进行深层分析B:基于数据的管理C:洞悉数据背后的价值D:开发能对数据进行整合、存储和提取的软件,并从软件的应用中获取数据。答案:基于数据的管理;洞悉数据背后的价值;用多种高级算法对数据进行深层分析从理论体系看,数据科学主要以()为理论基础,其主要研究内容包括数据科学基础理论、数据加工、数据计算、数据管理、数据分析和数据产品开发。

A:机器学习B:统计学C:数据可视化D:(某一)领域知识答案:(某一)领域知识###数据可视化###机器学习###统计学数据故事化的情景包括()。

A:虚构情景B:变换情景C:移植情景D:还原情景答案:移植情景###虚构情景###还原情景数据科学项目中的数据工程师负责()

A:负责在具体的软/硬件上部署和实施数据科学家提出的方法与技术方案。B:数据管理策略以及数据处理方法与技术方案的选择。C:管理软硬件系统和基础设施。D:数据产品的研发。答案:数据科学家列表(List)是R中最复杂的数据类型,可包含()类型的数据。

A:数组B:向量C:数据框D:矩阵答案:向量;矩阵;数组;数据框数据加工的目的包括()。

A:提升数据质量B:提升数据计算量C:降低数据计算的复杂度D:提升数据处理的准确性答案:提升数据处理的准确性###提升数据质量###降低数据计算的复杂度关于KNN算法的叙述正确的是()

A:算法的关键在于“计算新增数据特征与已有样本特征之间的相似度”。B:K值是分类的类别值。C:算法应用的前提条件是在训练集及其每个样本的分类标签信息为已知。D:计算特征之间的相似度的方法有很多,最基本且最常用的方法就是距离法。答案:算法的关键在于“计算新增数据特征与已有样本特征之间的相似度”。;算法应用的前提条件是在训练集及其每个样本的分类标签信息为已知。;计算特征之间的相似度的方法有很多,最基本且最常用的方法就是距离法。机器学习是()。

A:实现和优化机器的自我学习。B:一种能够赋予机器学习的能力的方法。C:计算机模拟人的学习行为,通过学习获取知识和技能的系统。D:一个系统自我改进的过程。答案:"AI参考:正确选项是【B,C】。机器学习是一种能够赋予机器学习的能力的方法,通过模拟人类学习行为,通过学习获取知识和技能的系统,是一种实现和优化机器的自我学习的方法。机器学习是计算机科学的一个分支,其目的是使机器能够从数据中学习并利用所学知识做出决策,无需明确编程即可执行预测和决策任务。机器学习的主要任务是通过构建适当的算法和模型来自动从数据中提取有用的信息,以优化机器的性能和适应不同的任务。因此,选项B和C都是正确的答案。选项A和D虽然也涉及到机器学习的一些方面,但不是机器学习的核心概念。"数据可视化是()

A:将数据映射成符合用户视觉感知的可见视图的过程。B:一种洞察统计分析无法发现的结构和细节分析方法。C:本质是视觉编码。D:用来处理统计图形、抽象地理信息或概念模型的空间数据。答案:"A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论