南开大学22年春学期《数据科学导论》在线作业-00003_第1页
南开大学22年春学期《数据科学导论》在线作业-00003_第2页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-本页为预览页PAGE13-本页为预览页-本页为预览页22春学期(高起本1709-1803、全层次1809-2103)数据科学导论在线作业-00003第1题. 根据映射关系的不同可以分为线性回归和()。选项A:对数回归选项B:非线性回归选项C:逻辑回归选项D:多元回归参考答案:B第2题. 为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。选项A:1选项B:2选项C:3选项D:4参考答案:B第3题. 具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。选项A:1,线性选项B:2,线性选项C:1,非线性选项D:2,非线性参考答案:A第4题. 以下哪个不是处理

2、缺失值的方法()选项A:删除记录选项B:按照一定原则补充选项C:不处理选项D:随意填写参考答案:D第5题. K-means聚类适用的数据类型是()。选项A:数值型数据选项B:字符型数据选项C:语音数据选项D:所有数据参考答案:A第6题. 单层感知机模型属于()模型。选项A:二分类的线性分类模型选项B:二分类的非线性分类模型选项C:多分类的线性分类模型选项D:多分类的非线性分类模型参考答案:A第7题. 数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()选项A:异常值选项B:缺失值选项C:不一致的值选项D:重

3、复值参考答案:C第8题. 某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()。选项A:产量每增加一台,单位成本增加100元选项B:产量每增加一台,单位成本减少1.2元选项C:产量每增加一台,单位成本平均减少1.2元选项D:产量每增加一台,单位平均增加100元参考答案:C第9题. 下列两个变量之间的关系中,哪个是函数关系()。选项A:人的性别和他的身高选项B:人的工资与年龄选项C:正方形的面积和边长选项D:温度与湿度参考答案:C第10题. 维克托?迈尔-舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调了一个观点:大数据时代的到来,使我们无

4、法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘( )选项A:K-means选项B:Bayes Network选项C:C4.5选项D:Apriori参考答案:D第11题. 通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()选项A:简单函数变换选项B:规范化选项C:属性构造选项D:连续属性离散化参考答案:C第12题. 只有非零值才重要的二元属性被称作:( ),其中购物篮数据就属于这种属性。选项A:计数属性选项B:离散属性选项C:非对称的二

5、元属性#对称属性参考答案:C第13题. 设X=1,2,3是频繁项集,则可由X产生()个关联规则。选项A:4选项B:5选项C:6选项D:7参考答案:C第14题. 手肘法的核心指标是()。选项A:SES选项B:SSE选项C:RMSE选项D:MSE参考答案:B第15题. 单层感知机是由()层神经元组成。选项A:一选项B:二选项C:三选项D:四参考答案:B第16题. 特征选择的四个步骤中不包括()选项A:子集产生选项B:子集评估选项C:子集搜索选项D:子集验证参考答案:C第17题. 以下哪一项不是特征选择常见的方法()选项A:过滤式选项B:封装式选项C:嵌入式选项D:开放式参考答案:D第18题. 层次

6、聚类对给定的数据进行()的分解。选项A:聚合选项B:层次选项C:分拆选项D:复制参考答案:B第19题. 层次聚类适合规模较()的数据集选项A:大选项B:中选项C:小选项D:所有参考答案:C第20题. 实体识别的常见形式()选项A:同名异义选项B:异名同义选项C:单位不统一选项D:属性不同参考答案:D第21题. 多层感知机的学习过程包含()。选项A:信号的正向传播选项B:信号的反向传播选项C:误差的正向传播选项D:误差的反向传播参考答案:A,D第22题. 系统日志收集的基本特征有()选项A:高可用性选项B:高可靠性选项C:可扩展性选项D:高效率参考答案:A,B,C第23题. K-means聚类中

7、K值选取的方法是()。选项A:密度分类法选项B:手肘法选项C:大腿法选项D:随机选取参考答案:A,B第24题. Apriori算法的计算复杂度受()影响。选项A:支持度阈值选项B:项数选项C:事务数选项D:事务平均宽度参考答案:A,B,C,D第25题. k近邻法的基本要素包括()。选项A:距离度量选项B:k值的选择选项C:样本大小选项D:分类决策规则参考答案:A,B,D第26题. 一元回归参数估计的参数求解方法有()。选项A:最大似然法选项B:距估计法选项C:最小二乘法选项D:欧式距离法参考答案:A,B,C第27题. 对于多层感知机,()层拥有激活函数的功能神经元。选项A:输入层选项B:隐含层

8、选项C:输出层参考答案:B,C第28题. 数据科学具有哪些性质()选项A:有效性选项B:可用性选项C:未预料选项D:可理解参考答案:A,B,C,D第29题. 关联规则的评价度量主要有:()。选项A:支持度选项B:置信度选项C:准确率选项D:错误率参考答案:A,B第30题. 距离度量中的距离可以是()选项A:欧式距离选项B:曼哈顿距离选项C:Lp距离选项D:Minkowski距离参考答案:A,B,C,D第31题. 啤酒与尿布的故事是聚类分析的典型实例。选项A:对选项B:错参考答案:B第32题. 赤池信息准则是衡量统计模型拟合优良性的一种标准。选项A:对选项B:错参考答案:A第33题. 随着特征维

9、数的增加,样本间区分度提高。选项A:对选项B:错参考答案:B第34题. 探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。选项A:对选项B:错参考答案:A第35题. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。选项A:对选项B:错参考答案:A第36题. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。选项A:对选项B:错参考答案:A第37题. BFR聚类簇的坐标可以与空间的坐标保持一致。选项A:对选项B:错参考答案:B第38题. 在一元线性回归中,输入只包含一个单独

10、的特征。选项A:对选项B:错参考答案:A第39题. 为了更加准确地描述变量之间的线性相关程度,可以通过计算相关系数来进行相关分析。选项A:对选项B:错参考答案:A第40题. K均值(K-Means)算法是密度聚类。选项A:对选项B:错参考答案:B第41题. 数据分析师的任务:用模型来回答具体问题,了解数据,其来源和结构选项A:对选项B:错参考答案:B第42题. 交叉表被广泛用于调查研究,商业智能,工程和科学研究选项A:对选项B:错参考答案:A第43题. 获取数据的方式有多种,可以从网页、测量、数据库、传统媒体、监控等等方式选项A:对选项B:错参考答案:A第44题. 如果一个候选集至少有一个子集是非频繁的,根据支持度的反单调属性,这样的候选项集肯定是非频繁的。选项A:对选项B:错参考答案:A第45题. 对于项集来说,置信度没有意义。选项A:对选项B:错参考答案:A第46题. 神经网络中误差精度的提高可以通过增加隐含层中的神经元数目来实现。选项A:对选项B:错参考答案:A第47题. 给定关联规则AB,意味着:若A发生,B也会发生。选项A:对选项B:错参考答案:B第48题. 随着特征维数的增加,特征空间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论