下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
MOOC大数据解析与应用导论-浙江大学中国大学慕课答案第一周作业第一周测验1、问题:下列场景适用于回归分析的是选项:A、水果分拣B、天气预报C、人脸识别D、信息浓缩正确答案:【天气预报】2、问题:下列属于多元统计方法的为选项:A、决策树B、神经网络C、主元分析D、回归分析正确答案:【主元分析#回归分析】3、问题:多元统计分析的图表示法有选项:A、轮廓图B、雷达图C、调和曲线图D、散布图矩阵正确答案:【轮廓图#雷达图#调和曲线图#散布图矩阵】4、问题:聚类分析也可以称为判别分析。选项:A、正确B、错误正确答案:【错误】5、问题:多元统计分析不仅变量的波动,还要研究变量间的耦合性。选项:A、正确B、错误正确答案:【正确】6、问题:完整的数据分析过程,包括数据采集、数据清洗和数据分析。选项:A、正确B、错误正确答案:【正确】第二周作业第二周测验1、问题:下列哪种方法不是数据填补的手段选项:A、替换填充法B、回归填充法C、均值标准化D、插值填充法正确答案:【均值标准化】2、问题:一般常见的缺失值处理的方法有选项:A、替换填充法B、最近邻插补填充法C、回归填充法D、插值填充正确答案:【替换填充法#最近邻插补填充法#回归填充法#插值填充】3、问题:一般常见的数据归一化的方法有选项:A、替换填充法B、最小最大规范化C、零均值规范化D、回归填充法正确答案:【最小最大规范化#零均值规范化】4、问题:少量的异常值完全不会影响数据分析。选项:A、正确B、错误正确答案:【错误】5、问题:一般初步收集到的数据可能是带有异常值的。选项:A、正确B、错误正确答案:【正确】6、问题:主成分分析可以降低数据维度。选项:A、正确B、错误正确答案:【正确】第三周作业第三周测验1、问题:SVM的中文全称叫什么?选项:A、最大向量分类器B、最小向量分类器C、支持向量机D、支持向量回归机正确答案:【支持向量机】2、问题:SVM算法的最小时间复杂度是O(n2),基于此,以下哪种规格的数据集并不适该算法?选项:A、不受数据集的大小影响B、中等数据集C、小数据集D、大数据集正确答案:【大数据集】3、问题:费舍尔判别分析通过不同类别数据投影后中心点间的距离来衡量类间分离程度。选项:A、正确B、错误正确答案:【正确】4、问题:拉格朗日乘子法可用于线性可分SVM的模型求解。选项:A、正确B、错误正确答案:【正确】5、填空题:曼哈顿距离是各变量之差的()之和。正确答案:【绝对值】第四周作业第四周测验1、问题:最小二乘方法的拟合程度衡量指标是选项:A、拟合残差B、残差平方和C、残差和D、均值差正确答案:【残差平方和】2、问题:最典型的两种拟合不佳的情况是选项:A、欠拟合B、过拟合C、强拟合D、弱拟合正确答案:【欠拟合#过拟合】3、问题:岭回归适用于样本很少,但变量很多的回归问题。选项:A、正确B、错误正确答案:【正确】4、问题:维数灾难是指当变量指标、特征逐步增加时导致计算量、计算难度成指数爆炸性增长,而模型准确性却在降低的情况。选项:A、正确B、错误正确答案:【正确】5、填空题:主元回归分析是基于()算法的结果进行后续回归建模分析。正确答案:【主成分分析】第五周作业第五周测验1、问题:闵可夫斯基距离是一组距离的定义,下列距离中属于闵可夫斯基距离的有选项:A、欧式距离B、马氏距离C、切比雪夫距离D、曼哈顿距离正确答案:【欧式距离#切比雪夫距离#曼哈顿距离】2、问题:在利用EM算法估计高斯混合模型参数的时候,需要预先设定的参数有选项:A、高斯元的均值B、高斯元的方差C、高斯元的权重系数D、类别个数正确答案:【高斯元的均值#高斯元的方差#高斯元的权重系数#类别个数】3、问题:在区分某个算法是否是聚类算法时,往往可以通过该算法是否需要预先设定明确的类中心来判断选项:A、正确B、错误正确答案:【正确】4、问题:如果两个变量的相关系数为0,则说明两个变量是独立的。选项:A、正确B、错误正确答案:【错误】5、问题:样本的顺序会影响K均值聚类算法的结果。选项:A、正确B、错误正确答案:【错误】6、填空题:GMM模型是借助多个()分布的线性累加去估计任意的分布。正确答案:【高斯】7、填空题:GMM模型需要预先设定高斯元个数去确定()个数。正确答案:【类别】第六周作业第六周测验1、问题:在Bootstrap自助采样法中,真实的情况是选项:A、在每一次采样中,样本之间不重复;在完成n次采样之后,所有样本都会被采集到B、在每一次采样中,样本之间可能有重复;在完成n次采样之后,所有样本都会被采集到C、在每一次采样中,样本之间不重复;在完成n次采样之后,有些样本可能没有被采集到D、在每一次采样中,样本之间可能有重复;在完成n次采样之后,有些样本可能没有被采集到正确答案:【在每一次采样中,样本之间可能有重复;在完成n次采样之后,有些样本可能没有被采集到】2、问题:对于离散型随机变量X,它的熵取决于选项:A、X的取值范围B、X取每个值的概率C、X的期望D、X的分布函数正确答案:【X取每个值的概率】3、问题:随机森林只能选择决策树作为基分类器。选项:A、正确B、错误正确答案:【错误】4、问题:随机森林的各个基分类器之间是互相独立的,在训练的时候可以并行训练。选项:A、正确B、错误正确答案:【正确】5、问题:决策树算法只能处理具有离散特征属性的数据集,对于连续特征属性的数据集无能为力。选项:A、正确B、错误正确答案:【错误】第七周作业第七周测验1、问题:CCA算法在求解时,分别在两组变量中选取具有代表性的综合变量Ui,Vi,每个综合变量是原变量的线性组合,选择综合变量时的目标是选项:A、最小化两者的相关系数B、最大化两者的相关系数C、最小化两者的距离D、最大化两者的距离正确答案:【最大化两者的相关系数】2、问题:相比于普通CCA算法,KernelCCA选项:A、能分析两组随机变量之间的非线性关系B、将标签信息融入到CCA框架中C、只考虑临近点的影响D、使用了自编码器正确答案:【能分析两组随机变量之间的非线性关系】3、问题:关于典型相关分析CCA与主成分分析PCA,下面说法错误的是选项:A、考虑了变量的相关性信息B、PCA可以视为一种降维技术,CCA不可以视为一种降维技术C、都基于变量的线性变换D、是否进行归一化,都不影响分析结果正确答案:【PCA可以视为一种降维技术,CCA不可以视为一种降维技术#是否进行归一化,都不影响分析结果】4、问题:典型相关分析适用于分析两组变量之间的关系选项:A、正确B、错误正确答案:【正确】5、问题:对数据进行归一化操作会影响典型相关分析的结果选项:A、正确B、错误正确答案:【错误】第八周作业第八周测验1、问题:关于卷积神经网络CNN,以下说法错误的是:选项:A、CNN由卷积层、池化层和全连接层组成,常用于处理与图像有关的问题。B、由于卷积核的大小一般是3*3或更大,因此卷积层得到的特征图像一定比原图像小。C、CNN中的池化层用于降低特征图维数,以避免过拟合。D、CNN中的全连接层常用softmax作为激活函数。正确答案:【由于卷积核的大小一般是3*3或更大,因此卷积层得到的特征图像一定比原图像小。】2、问题:相较于传统RNN,LSTM引入了独特的门控机制。以下哪些是LSTM中包含的门结构:选项:A、输入门B、输出门C、更新门D、遗忘门正确答案:【输入门#输出门#遗忘门】3、问题:关于卷积神经网络CNN与循环神经网络RNN,下面说法正确的有:选项:A、CNN适用于图像处理,而RNN适用于序列数据处理。B、CNN和RNN都属于神经网络,因此二者的训练方式完全一致,均采用BP算法。C、CNN和RNN都采用了权值共享机制以减少网络中的参数量。D、在同一个网络中,CNN结构和RNN结构不能同时使用。正确答案:【CNN适用于图像处理,而RNN适用于序列数据处理。#CNN和RNN都采用了权值共享机制以减少网络中的参数量。】4、问题:神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。它通过训练调整内部节点之间相互连接的关系,从而达到处理信息的目的。选项:A、正确B、错误正确答案:【正确】5、问题:为了提高预测结果的精度,网络结构设置得越复杂越好,不必考虑训练网络时所花费的时间。选项:A、正确B、错误正确答案:【错误】第九周作业第九周测验1、问题:关于去噪自编码器DAE,以下说法错误的是:选项:A、DAE一般以含噪声数据作为输入,并输出重构的去噪数据B、DAE训练时需要保证训练数据的完整性C、DAE的Loss函数用于最小化预测结果与噪声数据间的误差D、DAE中假设所有含噪样本的损坏过程一致正确答案:【DAE的Loss函数用于最小化预测结果与噪声数据间的误差】2、问题:在稀疏自编码器中,假设神经元采用tanh作为激活函数,则:选项:A、当神经元的输出接近1的时候,认为它被激活。B、当神经元的输出接近0的时候,认为它被抑制。C、当神经元的输出接近0的时候,认为它被激活。D、当神经元的输出接近-1的时候,认为它被抑制。正确答案:【当神经元的输出接近1的时候,认为它被激活。#当神经元的输出接近-1的时候,认为它被抑制。】3、问题:关于变分自编码器VAE,以下说法正确的有:选项:A、VAE是一类生成模型,可用于训练出一个样本的生成器B、VAE广泛用于生成图像C、VAE的变分下界由KL散度项和模型重建误差项组
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 布料订货合同范本
- 幼儿安全协议合同
- 2026年泉州鲤城区新步实验小学春季招聘合同制顶岗教师1人模拟笔试试题及答案解析
- 儿童羽毛球考级合同(2025年)
- 5G+医学教育学习共同体的实践策略研究
- 2025年四川省岳池银泰投资(控股)有限公司公开招聘急需紧缺专业人才备考题库带答案详解
- 首都医科大学附属北京胸科医院2026年派遣岗位招聘31人备考题库及完整答案详解1套
- 九年级上册第五单元单元解读课件
- 2025年中国人民人寿保险股份有限公司那曲市中心支公司招聘8人备考题库完整参考答案详解
- 2026届西北铝业有限责任公司秋季招聘18人备考题库及完整答案详解一套
- 2026年动物检疫检验员考试试题题库及答案
- 中国淋巴瘤治疗指南(2025年版)
- 2025年云南省人民检察院聘用制书记员招聘(22人)考试笔试模拟试题及答案解析
- 疗伤旅馆商业计划书
- 桥下空间施工方案
- 临床肿瘤诊疗核心技巧
- 2025年广西公需科目答案6卷
- 国开电大《人文英语4》一平台机考总题库珍藏版
- 人教部编版语文七年级上册1-5单元测试卷含答案
- 风电机安装安全管理规定
- 北京林业大学 研究生 学位考 科技论文写作 案例-2023修改整理
评论
0/150
提交评论