数据工程智慧树知到期末考试答案2024年_第1页
数据工程智慧树知到期末考试答案2024年_第2页
数据工程智慧树知到期末考试答案2024年_第3页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据工程智慧树知到期末考试答案2024年数据工程以下哪个选项不属于可视化交互范式所涉及的范畴:

A:选择+过滤B:平移+缩放C:概览+细节D:焦点+上下文答案:选择+过滤做组内研究时,使用不同工具完成相同任务时往往需要使用不同的数据,这样做的目的是:

A:避免用户记住答案,影响实验结果B:避免重复操作,从而防止用户乏味,影响实验结果C:避免因为数据相同而带来的选择性歧视答案:避免用户记住答案,影响实验结果“编码”交互主要是为了完成什么任务:

A:为数据提供提供不同的可视化视角B:呈现不同的数据子集C:筛选并过滤数据D:改变视觉外观以呈现不同的可视化表达形式答案:改变视觉外观以呈现不同的可视化表达形式在MySQL中,创建名为“education”的数据库的正确语句是()?

A:BUILDDATABASEeducationB:CREATEDATABASEeducationC:CREATEeducationD:BUILDeducation答案:CREATEDATABASEeducation数据标准化(Standardization)和规范化(Normalization)处理属于数据清理中的()。

A:数据转换B:数据解析C:数据审计D:数据填充答案:数据转换一种病毒感染了1.8%的人口。当这种病毒确实存在时,测试可以在95%的情况下检测到它,但当病毒不存在时,它会在3%的情况下返回假阳性。如果从这个人群中随机挑选的一个人被检测出病毒阳性,那么这个人被感染的概率是多少?

A:66%B:37%C:63%D:34%答案:37%假设你的输入是300x300色(RGB)图像,并且使用了一个卷积层,其中包含100个filter,每个filter为5x5。该隐藏层有多少个参数(包括偏置参数)?

A:7600B:2501C:7500D:2600答案:7600一名目击者声称,一辆黑色轿车卷入了一起夜间事故。警方知道,在夜间,目击者识别黑色汽车的正确率为90%,但有30%的时间将其他颜色的汽车错认为黑色。如果城市中有8%的汽车是黑色的,那么一辆黑色的汽车真的发生事故的概率是多少?

A:0.7931B:0.6200C:0.0845D:0.2069答案:0.2069当到达ConvNet的更深层时,通常会看到以下哪项?

A:nH和nW减小,而nC增加B:nH和nW减小,而nC也减小C:nH和nW增大,而nC减小D:nH和nW增加,而nC也增加答案:nH和nW减小,而nC增加假设某个行业中有5%的公司歧视爱荷华州。如果一家公司歧视,它将永远不会从爱荷华州雇用人。假设有20名同等资格的申请人在该行业的公司中求职,其中6名来自爱荷华州。如果该公司从这组申请人中雇用了四人,但没有人来自爱荷华州,那么该公司歧视的可能性是多少?

A:0.2030B:0.7970C:0.4905D:0.5095答案:0.2030MDS投影技术的设计原理是:

A:最大化高维空间中数据点的差异B:最小化高维空间中数据点的差异C:最大化数据点与数据点之间的距离在高、低维空间中的差异D:最小化数据点与数据点之间的距离在高、低维空间中的差异答案:最小化数据点与数据点之间的距离在高、低维空间中的差异在卷积神经网络中,激活函数的引入是为了()

A:加入非线性因素等,将某些特征过滤映射出来B:加速训练C:防止过拟合D:梯度下降答案:加入非线性因素等,将某些特征过滤映射出来当谎言因子>1时,说经可视化设计:

A:夸大了数据事实B:低估了数据事实C:正确表达了数据事实答案:夸大了数据事实以下等式是ResNet块中的计算。上面的两个空白是什么?a[l+2]=g(W[l+2]g(W[l+1]a[l]+b[l+1])+bl+2+_______)+_______

A:分别是0和a[l]B:分别是0和z[l+1],C:分别是z[l]和a[l]D:分别是a[l]和0答案:分别是a[l]和0数据墨水是指:

A:用于绘制数据可视化所消耗的笔墨总量B:用于呈现图表中与数据相关部分的内容所消耗的笔墨总量C:用于展现数据可视化图表中有用信息所消耗的笔墨总量答案:用于呈现图表中与数据相关部分的内容所消耗的笔墨总量数据库中的完整性约束不包括()。

A:日期完整性B:实体完整性C:自定义完整性D:参照完整性答案:日期完整性当需要从中挑选一个特征来构建决策树模型时,以下哪种准则的最大化最合适()

A:P(Y|Xj)B:H(Y|Xj)C:H(Y)-P(Y)D:P(Y)-P(Y|Xj)E:H(Y)-H(Y|Xj)答案:H(Y)-H(Y;Xj)假设你选取了高Gamma值的径向基核(RBF),这表示:

A:模型不会被数据点与超平面的距离影响B:建模时,模型只考虑离超平面近的点C:建模时,模型会考虑到离超平面更远的点答案:模型不会被数据点与超平面的距离影响“具象与抽象”交互主要是为了完成什么任务:

A:从不同的粒度呈现数据B:重新排序或重组视图C:改变视觉外观以呈现不同的可视化表达形式D:为数据提供提供不同的可视化视角答案:从不同的粒度呈现数据下面哪一项用决策树法训练大量数据集最节约时间()

A:减少树的深度B:增加树的深度;增加学习率C:减少树的深度;减少树的个数D:增加学习率答案:减少树的深度你有一个63x63x16的输入大小,并将其与32个分别为7x7,stride为1的filter进行卷积。您想使用“相同”的卷积。那么padding是?

A:2B:3C:7D:1答案:3假定你在神经网络中的隐藏层中使用激活函数X。在特定神经元给定任意输入,你会得到输出「-0.0001」。X可能是以下哪一个激活函数?

A:tanhB:ReLUC:SIGMOID答案:tanh神经网络模型是受人脑的结构启发发明的。神经网络模型由很多的神经元组成,每个神经元都接受输入,进行计算并输出结果,那么以下选项描述正确的是()。

A:每个神经元只有一个单一的输入和单一的输出B:每个神经元有多个输入而只有一个单一的输出C:每个神经元有多个输入和多个输出D:每个神经元只有一个单一的输入而有多个输出答案:每个神经元有多个输入和多个输出以下哪个不属于可视化创建的关键步骤?

A:可视化设计B:可视化渲染C:数据转换D:可视化开发答案:可视化开发在格式塔法则中,哪一种法则下所展现的群组关系最为强烈:

A:近邻原则B:相似原则C:连续性原则D:连通性准则答案:连通性准则MongoDB创建新数据库“education”的正确语句是()。

A:usedatabaseeducationB:useeducationC:createdatabaseeducationD:createeducation答案:useeducation以下哪一项不属于数值型可视化通道:

A:位置B:大小C:色温D:色相答案:色相以下哪一项不可以用来做任务的衡量指标:

A:正确率B:用户在完成任务时系统的延迟等待时间C:完成任务的时间D:用户对任务结果的满意度答案:用户在完成任务时系统的延迟等待时间在word2vec算法中,你估计P(t|c),其中t是目标单词,c是上下文(context)单词。t和c该如何从训练集当中选择?

A:c选择直接在t前面的几个单词B:c选择直接在t前面的一个单词C:c应该选择在t之前的句子当中的所有单词D:c和t应该相邻答案:c和t应该相邻可以用来做可视化渲染的技术包括:

A:CVGB:HTML5CanvasC:WebGLD:SVG答案:SVG;HTML5Canvas;WebGL并行与分布式数据库主要有哪几种信息共享架构?

A:无共享架构B:共享磁盘架构C:共享内存架构D:共享网络架构答案:共享内存架构;共享磁盘架构;无共享架构通常在ConvNet中看到以下哪些内容?

A:多个POOL层,然后接CONV层B:多个CONV层,然后接POOL层C:最后几层是FC层D:前几层是FC层答案:多个CONV层,然后接POOL层;最后几层是FC层为什么要对数据进行可视化?

A:促进数据的交流与沟通B:直观展现信息C:帮助数据分析与推理答案:促进数据的交流与沟通###帮助数据分析与推理###直观展现信息下列操作哪些属于关系数据库的基本操作?

A:Insert操作B:Join操作C:Group操作D:Select操作答案:Select操作;Join操作;Group操作;Insert操作以下哪些是使用ConvNets的开源实现的常见原因(无论是模型还是权重)?

A:在一个计算机视觉任务训练的模型通常可以用于执行数据增强,即使对于其他计算机视觉任务也是如此。B:一些在计算机视觉当中赢得比赛所使用的技术(比如multiplecropattesttime)被广泛应用于convnet实际生产部署当中。C:为一项计算机视觉任务训练的参数通常可用作对其他计算机视觉任务的预训练。D:这是实现复杂的ConvNet架构的便捷方法。答案:这是实现复杂的ConvNet架构的便捷方法。;为一项计算机视觉任务训练的参数通常可用作对其他计算机视觉任务的预训练。可视化图形符号包括哪些形式?

A:空间B:面C:线D:点答案:点;线;面下列哪些属于大数据的特征?

A:数据价值密度低B:数据量大C:数据生成速度快D:数据种类多答案:数据价值密度低;数据量大;数据种类多;数据生成速度快NoSQL数据库主要可以分为哪几类?

A:图数据库B:键值数据库C:文档数据库D:列数据库答案:文档数据库;图数据库;列数据库;键值数据库文档数据库的主要优点包括()。

A:结构灵活B:查询性能高C:不需要预先定义表结构D:具有统一的查询语法答案:结构灵活;不需要预先定义表结构信息可视化中,动画设计需要遵守哪些准则:

A:动画必须与其载体,即所对应的可视化形式保持兼容B:动画的每个步骤必须有具体的含义,动画的产生必须有明确的原因C:一次只展示一个动画;如果需要同时展示多个动画,需要分阶段展示答案:动画的每个步骤必须有具体的含义,动画的产生必须有明确的原因;一次只展示一个动画;如果需要同时展示多个动画,需要分阶段展示;动画必须与其载体,即所对应的可视化形式保持兼容分布式数据库的主要特点有()。

A:数据集中性B:站点自治性C:物理分布性D:逻辑完整性答案:物理分布性;逻辑完整性;站点自治性构造好的决策树的关键在于如何选择好的逻辑判断或属性。

A:错B:对答案:错决策树的生成算法有ID3、CART和C4.5,其中C4.5是以信息增益作为特征划分的标准的。

A:正确B:错误答案:错误划分聚类算法不具备全局目标。

A:正确B:错误答案:错误可以将熵作为判断聚类有效性的内部测度。

A:正确B:错误答案:错误在中介者数据集成模式中,中介者需要保存各个数据源的数据。

A:错误B:正确答案:错误基尼指数反映了从样本集D中随机抽取两个样本,其类别标记不一致的概率,因此越小越好。

A:对B:错答案:错CHAMELEON算法中既包含对图的划分也包含对子图的合并。

A:错误B:正确答案:正确聚类是这样的过程,它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。

A:错B:对答案:错在KMEANS的训练过程中,可以选择不同的K值,比较使绝对误差标准较小的K值,结合聚类业务的可解释性,从而选择合适的K值。

A:错B:对答案:对NewSQL数据库保持了NoSQL数据库的高可扩展和高性能,同时保持了关系模型。

A:正确B:错误答案:正确从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。

A:对B:错答案:错技术进步和应用创新推动了大数据的不断发展。

A:正确B:错误答案:正确MySQL是一个开源数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论