版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)数据科学导论在线作业试卷总分:100 得分:100一、单选题 (共 20 道试题,共 40 分)根据映射关系的不同可以分为线性回归和()。对数回归非线性回归逻辑回归多元回归答案:B2.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。减小,减小减小,增大增大,减小增大,增大答案:B3.我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。自上而下自下而上自左而右自右而左答案:B4.对于k近邻法,下列说法错误的是()。不具有显式的学习过程适用于多分类任务k
2、值越大,分类效果越好通常采用多数表决的分类决策规则答案:C5.在回归分析中,自变量为(),因变量为()。离散型变量,离散型变量连续型变量,离散型变量离散型变量,连续型变量连续型变量,连续型变量答案:D6.聚类是一种()。有监督学习无监督学习强化学习半监督学习答案:B7.考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含()1,2,3,41,2,3,51,2,4,51,3,4,5答案:C8.设X=1,2,3是频繁项集,则可由X产生()个关联规则。456
3、7答案:C9.以下哪个不是处理缺失值的方法()删除记录按照一定原则补充不处理随意填写答案:D10.在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或()。最优回归线最优分布线最优预测线最佳分布线答案:A11.维克托?迈尔-舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )K-meansBayes NetworkC4.5Apriori答案:D12.为了解决任何复杂的分类问题,使用的感知机结构应至少包
4、含()个隐含层。1234答案:B13.下列两个变量之间的关系中,哪个是函数关系()。人的性别和他的身高人的工资与年龄正方形的面积和边长温度与湿度答案:C14.K-means聚类适用的数据类型是()。数值型数据字符型数据语音数据所有数据答案:A15.单层感知机拥有()层功能神经元。一二三四答案:A16.在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。越小越大无关不确定答案:B17.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()。产量每增加一台,单位成本增加100元产量每增加一台,单位成本减少1.2元产量每增加一
5、台,单位成本平均减少1.2元产量每增加一台,单位平均增加100元答案:C18.下面不是分类的常用方法的有()K近邻法朴素贝叶斯决策树条件随机场答案:D19.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。1,线性2,线性1,非线性2,非线性答案:A20.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()异常值缺失值不一致的值重复值答案:C二、多选题 (共 10 道试题,共 20 分)21.相关性的分类,按照相关的方向可以分为()。正相关负相关左相关右相关答案:AB22.系统日志收
6、集的基本特征有()高可用性高可靠性可扩展性高效率答案:ABC23.聚类的主要方法有()。划分聚类层次聚类密度聚类距离聚类答案:ABC24.K-means聚类中K值选取的方法是()。密度分类法手肘法大腿法随机选取答案:AB25.多层感知机的学习过程包含()。信号的正向传播信号的反向传播误差的正向传播误差的反向传播答案:AD26.什么情况下结点不用划分()当前结点所包含的样本全属于同一类别当前属性集为空,或是所有样本在所有属性上取值相同当前结点包含的样本集为空还有子集不能被基本正确分类答案:ABC27.Apriori算法的计算复杂度受()影响。支持度阈值项数事务数事务平均宽度答案:ABCD28.层
7、次聚类的方法是()聚合方法分拆方法组合方法比较方法答案:AB29.k近邻法的基本要素包括()。距离度量k值的选择样本大小分类决策规则答案:ABD30.距离度量中的距离可以是()欧式距离曼哈顿距离Lp距离Minkowski距离答案:ABCD三、判断题 (共 20 道试题,共 40 分)31.贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布 有关。答案:正确32.在树的结构中,特征越重要,就越远离根节点。答案:错误33.使用SVD方法进行图像压缩不可以保留图像的重要特征。答案:错误34.给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面
8、的两侧,则称该数据集是线性可分数据集。答案:错误35.Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。答案:正确36.探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。答案:正确37.BFR聚类簇的坐标可以与空间的坐标保持一致。答案:错误38.决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布答案:正确39.当特征为离散型时,可以使用信息增益作为评价统计量。答案:正确40.随着特征维数的增加,样本间区分度提高。答案:错误41.K-means算法采用贪心策略,通过迭代优化来近似求解。答案:正确42.多元线性回归模型中,标准化偏回归系数没有单位。答案:正确43.关联规则可以用枚举的方法产生。答案:正确44.获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。答案:错误45.sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。答案:错误46.当训练集较大的时候,标准BP算法通常会更快的获得更好的解。答案:正确47
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年福建江夏学院单招职业适应性测试模拟试题及答案解析
- 临床用药安全监管工作汇报
- 2026年江苏旅游职业学院单招职业适应性考试模拟试题及答案解析
- 2026年郑州澍青医学高等专科学校单招职业适应性考试模拟试题及答案解析
- 医院内部绩效激励措施
- 医院内部信息化管理与数据应用
- 口腔医学前沿技术
- 医疗机构内部质量改进策略
- 眼科疾病诊疗策略与护理
- 精神科精神分裂症防治
- JBT 7387-2014 工业过程控制系统用电动控制阀
- A课堂惩罚游戏
- 《合同能源管理介绍》课件
- 整理收纳师行业分析
- GB/T 228.1-2021金属材料拉伸试验第1部分:室温试验方法
- 氢能与燃料电池-课件-第五章-制氢技术
- 科研伦理与学术规范-课后作业答案
- 2023QC小组活动基础知识培训
- 生理学期末考试复习试题库及答案
- 旅游地理学 国家公园建设与管理
- JJF(石化)036-2020漆膜附着力测定仪(划圈法)校准规范
评论
0/150
提交评论