




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据分析与预测技术智慧树知到期末考试答案2024年大数据分析与预测技术关于NameNode和SecondaryNameNode的说法错误的是
A:协议的容器是jettyB:NameNode上实现的NamenodeProtocol用于二者命令通信C:数据的通信使用的是ftp协议(http协议)D:数据通信使用的是http协议答案:数据的通信使用的是ftp协议(http协议)当采用K-距离的方法选择DBSCAN的Eps和MinPts参数时,如果设置的K的值太大,则小簇(尺寸小于K的簇)可能会被标记为
A:边界簇B:核心簇C:其他选项都不对D:噪声答案:噪声人工智能、机器学习、深度学习的包含关系是?
A:人工智能>机器学习>深度学习B:人工智能>深度学习>机器学习C:机器学习>深度学习>人工智能D:深度学习>人工智能>机器学习答案:人工智能机器学习深度学习自然语言处理难点目前有四大类,下列选项中不是其中之一的是?
A:语境B:语言歧义性C:机器性能D:知识依赖答案:机器性能以下决策树说法错误的是哪个
A:相对于神经网络,决策树可解释性好,而且训练效率高。B:决策树的过拟合时因为树的深度比较大引起,因此可以限制分支的最小样本数或控制树的深度解决。C:决策树中没有出现的属性是对分类无用的。D:决策树算法对样本的噪声非常敏感,少数噪声可能引起决策树的很大变化。答案:决策树中没有出现的属性是对分类无用的。DBSCAN之所以难以有效处理高维数据,其主要原因是?
A:簇的大小未知B:数据的形状太复杂C:开销过大D:噪声点过多答案:开销过大在Spark的软件栈中,用于机器学习的是?
A:SparkStreamingB:GraphXC:Mllib答案:Mllib有关基于关联规则的推荐的说法,错误的是哪个?
A:基于关联规则的推荐主要是基于相似客户群体的推荐。B:关联推荐是一种基于物品之间因果关系的推荐方法。C:关联规则用于推荐实质上是一种基于用户的协同推荐。D:关联规则的推荐算法常用的有Apriori和FP树增长等算法。答案:关联推荐是一种基于物品之间因果关系的推荐方法。DBSCAN算法的过程是以下哪个?①删除噪声点。②每组连通的核心点形成一个簇。③将所有点标记为核心点、边界点和噪声点。④将每个边界点指派到一个与之关联的核心点的簇中。⑤为距离在Eps之内的所有核心点之间赋予一条边。
A:①②④⑤③B:③①⑤②④C:③①②④⑤D:①④⑤②③答案:③①⑤②④大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。而哪项技术将继续成为大数据智能分析的核心技术?
A:智能终端B:智能物流C:机器学习D:脑科学答案:机器学习mapreduce计算模型适用于哪种任务?
A:实时数据变化处理B:有关联的行处理C:多线程处理D:批处理答案:批处理大数据时代的到来,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘
A:C4.5B:BayesNetworkC:K-meansD:Apriori答案:Apriori以下的决策树哪个是二叉树?
A:CARTB:ID3C:C4.5D:CHAID答案:CARTApriori算法的加速过程依赖于以下哪个策略
A:并行B:缓冲C:抽样D:剪枝答案:剪枝如果处理以下形状的数据时,适宜采用DBSCAN的是?
A:椭球形B:SS形C:球形D:方形答案:SS形BP神经网络的学习规则是?
A:梯度下降法B:梯度提升法C:梯度上升法D:梯度曲线法答案:梯度下降法机器学习的预测建模任务主要包括哪几大类方法?
A:神经网络B:回归分析C:决策树D:模式发现答案:决策树###神经网络###回归分析设有项目集X,X1是X的一个子集,则下列结论中成立的是
A:如果X1是频繁项目集,则X也是频繁项目集;B:如果X是频繁项目集,则X1也是频繁项目集;C:如果X是非频繁项目集,则X1也是非频繁项目集;D:如果X1是非频繁项目集,则X也是非频繁项目集;答案:如果X是频繁项目集,则X1也是频繁项目集###如果X1是非频繁项目集,则X也是非频繁项目集训练分类机器学习模型时需要避免过拟合和欠拟合的问题,关于这些问题以下说法错误的是
A:复杂的模型时容易发生欠拟合问题B:正则化方法可以减少过拟合问题C:神经网络不会出现过拟合问题D:增加数据量不能减少过拟合问题答案:复杂的模型时容易发生欠拟合问题###神经网络不会出现过拟合问题###增加数据量不能减少过拟合问题Spark适用于那些场景?
A:系统业务受理B:数据量大C:计算量大D:效率要求高答案:计算量大###数据量大传统神经网络主要分为以下哪几类?
A:反馈型神经网络B:自组织神经网络C:反向传播D:前馈型神经网络答案:前馈型神经网络###反馈型神经网络###自组织神经网络关联规则的评价度量主要有哪些?
A:提升度B:支持度C:置信度D:准确度答案:提升度###支持度###置信度下列选项中,是用于数据存储的技术有哪些?
A:HDFSB:MongoDBC:JavaD:MySQL答案:MongoDB###MySQL###HDFS自然语言处理包括以下哪些?
A:句法分析B:词法分析C:语义分析D:机器翻译答案:词法分析###句法分析###语义分析有关可视化分析的方法,下面说法正确的有哪些?
A:可视化分析有多种图形可供选择,每种图形只适用某些场合。B:可视化只是表格数据的另一种简单呈现。C:错误的数据如果不进行处理,可能会影响可视化分析的结果质量。D:可视化分析在分析前,对数据进行一定的变换,可能会提升分析结果的有用性。答案:可视化只是表格数据的另一种简单呈现。下面哪些评测指标可以度量推荐系统的性能?
A:推荐结果的新颖性B:用户调查满意度C:平均绝对误差(MAE)D:覆盖率答案:平均绝对误差(MAE)###覆盖率###推荐结果的新颖性大数据的业务应用处理需要经过哪些流程?
A:数据建模B:数据采集C:数据清洗D:数据加工答案:数据采集###数据清洗###数据建模###数据加工有关决策树对大数据的处理,以下说法正确的是哪些?
A:通过对决策表的每个字段进行数据分片(然后每个字段再按照记录分片),可以实现决策树重要分枝属性的选择。B:可以对决策表的样本进行划分,并行计算每个分片数据各种属性取值对应的类别个数,从而可以合并这些数据得到某个属性在整个数据集的重要性度量。C:决策树的分布式学习可以借助MapReduce计算框架。D:决策树对大数据的处理只能采用批处理的算法。答案:决策树的分布式学习可以借助MapReduce计算框架###可以对决策表的样本进行划分,并行计算每个分片数据各种属性取值对应的类别个数,从而可以合并这些数据得到某个属性在整个数据集的重要性度量###通过对决策表的每个字段进行数据分片(然后每个字段再按照记录分片),可以实现决策树重要分枝属性的选择关于训练样本的描述中,正确的是哪些?
A:如果模型性能不佳,可增加样本多样性进行优化。B:增加数据可以减少模型方差。C:样本越多,模型训练越慢,性能一定越好。D:训练样本越少,模型的方差越大。答案:增加数据可以减少模型方差。###如果模型性能不佳,可增加样本多样性进行优化。###样本越少,模型的方差越大。支持向量机的核函数负责输入变量和分类变量(输出)之间的映射。
A:错B:对答案:对DBSCAN会把所有点划分到各自的簇中。
A:对B:错答案:错误差逆传播算法(ErrorBackPropagation,简称BP)是最成功的训练多层前馈神经网络的学习算法。
A:对B:错答案:对在做聚类时,DBSCAN会删掉它认为是噪声点的数据点。
A:错B:对答案:对决策树剪枝的目的是为了减少训练过程的过拟合,从而提升决策树模型的准确性。
A:对B:错答案:对基于内容的推荐会遇到用户数据稀疏问题和新用户问题。
A:错B:对答案:对过拟合是因为训练样本太多了,把训练样本的规律都拟合进去了,因此检测样本的准确率也很高。
A:对B:错答案:错基于内容的推荐和基于协同的推荐都需要领域知识。
A:对B:错答案:错如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。
A:对B:错答案:错在聚类分析中,簇之间的相似性越大,簇内样本的差别越大,聚类的效果就越好
A:对B:错答案:错信息熵值越小,当前样本集合D的纯度越小,属于同一类别的可能性越大
A:对B:错答案:错朴素贝叶斯分类器对于小样本数据集效果不如决策树好。
A:错B:对答案:错下列说法正确的是哪些?
A:噪声和异常是数据错误这一相同表述的两种叫法。B:离散属性总是具有有限个值。C:离群(异常)点可以是合法的数据对象或者值。D:定量属性可以是整数值或者是连续值。答案:AI参
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鞋类设计师(功能鞋方向)笔试试题及答案
- 2025年MCL(BCL)系列离心压缩机合作协议书
- 2025年宁波象新公交集团有限公司招聘考试笔试试题【答案】
- 2025年事业单位招聘考试公共基础知识仿真模拟考试试卷1(四套)【答案】
- 消化系统疾病患儿的诊疗与护理考核试题与答案
- 消费购销合同范本(3篇)
- 历史教学心得体会
- 消防维保合同签订后的维保流程1
- 襄州区七年级下学期道德与法治3月月考试卷
- 教育领域版权新篇章个性化学习资源的创新应用
- 医院医疗器械临床试验项目资料备案清单
- YDT 5206-2023宽带光纤接入工程技术规范
- 新疆警察学院面试问题及答案
- 小学三到六年级全册单词默写(素材)-2023-2024学年译林版(三起)小学英语
- 铁岭市高校毕业生“三支一扶”计划招募笔试真题2022
- 水利安全生产风险防控“六项机制”右江模式经验分享
- 天然气泄漏事故演练方案及评估
- 《养老机构认知障碍照护专区设置与服务规范》
- 妇科炎症健康教育课件
- 儿科护理学(高职)全套教学课件
- 干眼门诊建设计划书
评论
0/150
提交评论