版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《数据科学导论》20春期末考核《数据科学导论》20春期末考核一、单选题一、单选题共15题,30分12分下面不是分类的常用方法的有()AK近邻法AK近邻法BB朴素贝叶斯CC决策树D条件随机场222分BFR聚类用于在()欧氏空间中对数据进行聚类A高维BB中维CC低维DD中高维332分聚类是一种()。AA有监督学习B无监督学习CC强化学习DD半监督学习442分数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新AA异常值BB缺失值C不一致的值DD重复值552分某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。AA产量每增加一台,单位成本增加100元BB产量每增加一台,单位成本减少1.2元C产量每增加一台,单位成本平均减少1.2元DD产量每增加一台,单位平均增加100元662分在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。AA减小,减小B减小,增大CC增大,减小DD增大,增大772分在回归分析中,自变量为(),因变量为()。AA离散型变量,离散型变量BB连续型变量,离散型变量CC离散型变量,连续型变量D连续型变量,连续型变量882分ASESASESBSSECRMSECRMSEDMSEDMSE992分特征选择的四个步骤中不包括()AA子集产生BB子集评估C子集搜索DD子集验证10102分AA误差BB方差CC测差D残差11112分K-means聚类适用的数据类型是()。A数值型数据BB字符型数据CC语音数据DD所有数据12122分以下哪些不是缺失值的影响()AA数据建模将丢失大量有用信息BB数据建模的不确定性更加显著C对整体总是不产生什么作用DD包含空值的数据可能会使建模过程陷入混乱,导致异常的输出13132分下列两个变量之间的关系中,哪个是函数关系()。AA人的性别和他的身高BB人的工资与年龄C正方形的面积和边长DD温度与湿度14142分考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5项,采用合并策略,由候选产生过程得到4-项集不包含()A1,2,3,4A1,2,3,4B1,2,3,5B1,2,3,5C1,2,4,5D1,3,4,5D1,3,4,515152分单层感知机模型属于()模型。A二分类的线性分类模型BB二分类的非线性分类模型CC多分类的线性分类模型DD多分类的非线性分类模型二、多选题二、多选题共5题,10分12分系统日志收集的基本特征有()A高可用性B高可靠性C可扩展性DD高效率222分距离度量中的距离可以是()A欧式距离B曼哈顿距离CLp距离DMinkowski距离332分K-means聚类中K值选取的方法是()。A密度分类法B手肘法CC大腿法DD随机选取442分多层感知机的学习过程包含()。A信号的正向传播BB信号的反向传播CC误差的正向传播D误差的反向传播552分一元回归参数估计的参数求解方法有()。A最大似然法B距估计法C最小二乘法DD欧式距离法三、判断题三、判断题共15题,30分12分Jaccard系数只关心个体间共同具有的特征是否一致这个问题。A对BB错222分标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。AA对B错332分使用SVD方法进行图像压缩不可以保留图像的重要特征。AA对B错442分特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。A对BB错552分一个人的身高与体重之间具有函数关系。AA对B错662分AA对B错772分数据科学可以回答复杂的问题,发现世界中隐藏的联系并预测和指导未来。A对BB错882分k误差”会增大,预测结果会对近邻的点实例点非常敏感。A对BB错992分利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。AA对B错10102分对于项集来说,置信度没有意义。A对BB错11112分每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。A对BB错12122分当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。AA对B错13132分利用K近邻法进行分类时,k值过小容易发生过拟合现象。A对BB错14142分聚合方法是自底向上的方法。A对BB错15152分平均减少的不纯度越大,则特征重要度越高。A对BB错四、主观填空题四、主观填空题共5题,10分12分感知机足以解决任何复杂的分类问题。1、学生作答:双隐藏层1、学生作答:双隐藏层222分判定系数取值范围为[0,1],判定系数越接近,表明变量之间的相关性越强。1、学生作答:-11、学生作答:-1332分在线性回归分析中,当输入特征的维度从一维增加到d维(d>1),则该问题为问题。1、学生作答:多元线性回归1、学生作答:多元线性回归442分多元线性回归中,在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的对y的作用。1、学生作答:越大1、学生作答:越大552分在k近邻法中,通常采用来选取最优的k值。1、学生作答:交叉验证法1、学生作答:交叉验证法五、简答题五、简答题共2题,20分110分单层感知机和多层感知机分别解决的是哪类问题?单层感知器(SingleLayerPerceptron)是最简单的神经网络。它包含输入层和输出层,而输
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 车队长岗位安全培训通知课件
- 车队安全培训新闻报道课件
- 垂径定理及其推论提高试题
- 《滑轮和滑轮组》物理授课课件
- 2026年某某项目安全生产自查自纠报告
- 银行客户关系维护制度
- 车间生产安全培训插排课件
- 2026年电力系统工作总结常用版(二篇)
- 车间安全线路培训记录课件
- 机电工程管理与实务二级建造师考试试卷及答案指导
- 快递行业运营部年度工作总结
- 《苏教版六年级》数学上册期末总复习课件
- 上海市二级甲等综合医院评审标准(2024版)
- 油漆班组安全晨会(班前会)
- 消费类半固态电池项目可行性研究报告
- 山东省济南市2024年1月高二上学期学情期末检测英语试题含解析
- 口腔门诊医疗质控培训
- (正式版)JBT 9229-2024 剪叉式升降工作平台
- HGT4134-2022 工业聚乙二醇PEG
- 小学教职工代表大会提案表
- ESC2023年心脏起搏器和心脏再同步治疗指南解读
评论
0/150
提交评论