大数据建模练习(习题卷1)_第1页
大数据建模练习(习题卷1)_第2页
大数据建模练习(习题卷1)_第3页
大数据建模练习(习题卷1)_第4页
大数据建模练习(习题卷1)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:大数据建模练习大数据建模练习(习题卷1)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据建模练习第1部分:单项选择题,共39题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.UNIQUE惟一索引的作用是()A)保证各行在该索引上的值都不得重复B)保证各行在该索引上的值不得为NULLC)保证参加惟一索引的各列,不得再参加其他的索引D)保证惟一索引不能被删除答案:A解析:[单选题]2.以下表达降序排序的是()A)ASCB)ESCC)DESCD)DSC答案:C解析:[单选题]3.SQL是一种()语言。A)函数型B)高级算法C)关系数据库D)人工智能答案:C解析:[单选题]4.标准的大数据服务平台在大数据体系当中起到承上启下的作用,是一个统一的可授权、可做多维访问控制的全周期平台。以下关于大数据服务平台描述不正确的是()A)不支持第三方注册B)可以将数据资源转变为数据服务C)可以用服务构建服务D)可以统管模型答案:A解析:[单选题]5.Python内置函数()可以返回列表、元组、字典、集合、字符串以及range对象中元素个数A)dimB)lenC)setD)compute答案:B解析:[单选题]6.SQL语言是()的语言,轻易学习。A)导航式B)过程化C)格式化D)非过程化答案:D解析:[单选题]7.表达式eval('500/10')的结果是:A)?500/10?B)500/10C)50D)50.0答案:D解析:[单选题]8.SQL语句中的条件用以下哪一项来表达()A)THENB)WHILEC)WHERED)IF答案:C解析:[单选题]9.近年来,随着新科技的不断普及,愈来愈多的个人数据被采集和存储了下来,个人信息网络化和透明化已经成为不可阻挡的趋势。那么,最突出的大数据环境是?A)物联网B)互联网C)综合国力D)自然资源答案:B解析:[单选题]10.以下选项中,不是建立字典的方式是A)d={[1,2]:1,[3,4]:3}B)d={(1,2):1,(3,4):3}C)d={'张三':1,'李四':2}D)d={1:[1,2],3:[3,4]}答案:A解析:[单选题]11.按照班级进行分组()A)ORDERBYCLASSESB)DORDERCLASSESC)GROUPBYCLASSESD)GROUPCLASSES答案:C解析:[单选题]12.以下关于字典类型的描述,正确的是:A)字典类型可迭代,即字典的值还可以是字典类型的对象B)表达式forxind:中,假设d是字典,则x是字典中的键值对C)字典类型的值可以是任意数据类型的对象D)字典类型的键可以是列表和其他数据类型答案:C解析:[单选题]13.连接算子用于把两张(或两张以上)表按照内连接和外连接(左连接、右连接、全连接)这四种逻辑连接起来。只返回两个标准连接字段相等的行,取两表的交集是其中的A)内连接B)全连接C)左连接D)右连接答案:A解析:[单选题]14.仪表板中的多个图表,可以设置统一的筛选器,在BI工具中可以通过()功能实现A)全局设置B)联动设置C)筛选器D)布局设置答案:A解析:[单选题]15.Python中对变量描述错误的选项是:A)Python不需要显式声明变量类型,在第一次变量赋值时由值决定变量的类型B)变量通过变量名访问C)变量必须在创建和赋值后使用D)变量PI与变量Pi被看作相同的变量答案:D解析:[单选题]16.图表中可定义字段与字段间计算规则的功能是?()A)新增分组字段B)新增计算字段C)筛选器D)条件样式答案:B解析:[单选题]17.?2022-1-31?可以用什么算子转换成?2022-01-31?格式A)值映射B)字段值替换C)缺失值处理D)类型转换答案:D解析:[单选题]18.以下选项中,不是pip工具进行第三方库安装的作用的是:A)安装一个库B)卸载一个已经安装的第三方库C)列出当前系统已经安装的第三方库D)脚本程序转变为可执行程序答案:D解析:[单选题]19.为数据表创建索引的目的是()A)提高查询的检索性能B)归类C)创建唯一索引D)创建主键答案:A解析:[单选题]20.pandas提供了对各种格式数据文件的读取和写入工具,其中不包括哪种?A)CSV文件B)文本文件C)工作簿文件D)EXE文件答案:D解析:[单选题]21.下列()不属于连接种类A)左外连接B)内连接C)中间连接D)交叉连接答案:C解析:[单选题]22.从GROUPBY分组的结果集中再次用条件表达式进行筛选的子句是()A)FROMB)ORDERBYC)HAVINGD)WHERE答案:C解析:[单选题]23.以下删除表正确的()A)Delete*fromempB)DropdatabaseempC)Drop*fromempD)deletedatabaseemp答案:B解析:[单选题]24.在Excel中,数据透视表是汇总、分析、浏览和呈现汇总数据的方法。创建数据透视表后,可以通过添加和排列数据透视表的()来更改其设计。A)字段B)数据C)文本D)公式答案:A解析:[单选题]25.数据库管理系统,通常称为(),是数据库系统的核心组成部分,主要完成对数据库的操作与管理功能,实现数据库对象的创建、数据库存储数据的查询、添加、修改与删除操作和数据库的用户管理、权限管理等。A)DBAB)DBMSC)OSD)NoSQL答案:B解析:[单选题]26.文件book.txt在当前程序所在目录内,其内容是一段文本:book,下面代码的输出结果是:txt=open("book.txt","r")print(txt)txt.close()A)book.txtB)txtC)bookD)以上答案都不对答案:D解析:[单选题]27.下面不属于软件需求分析阶段主要工作的是A)需求评审B)需求获取C)需求变更申请D)需求分析答案:C解析:[单选题]28.以下对Python程序设计风格描述错误的选项是:A)Python中允许把多条语句写在同一行B)Python语句中,增加缩进表示语句块的开始,减少缩进表示语句块的退出C)Python可以将一条长语句分成多行显示,使用续航符?\?D)Python中不允许把多条语句写在同一行答案:D解析:[单选题]29.以下关于列表操作的描述,错误的是:A)通过append方法可以向列表添加元素B)通过extend方法可以将另一个列表中的元素逐一添加到列表中C)通过insert(index,object)方法在指定位置index前插入元素objectD)通过add方法可以向列表添加元素答案:D解析:[单选题]30.可以在创建表时用()来创建唯一索引,也可以用()来创建唯一索引A)Createtable,CreateindexB)设置主键约束,设置唯一约束C)设置主键约束,CreateindexD)以上都可以答案:C解析:[单选题]31.以下哪项用来分组()A)ORDERBYB)ORDEREDBYC)GROUPBYD)GROUPEDBY答案:D解析:[单选题]32.修改数据库表结构用以下哪一项()A)UPDATEB)CREATEC)UPDATEDD)ALTER答案:D解析:[单选题]33.在用Excel处理数据时,若需要根据某个判断来得到一个值,或另外一个值,这个时候就需要使用if函数。单元格中保存的公式为"=IF(1=2,3,4)",显示的结果是A)1B)2C)3D)4答案:D解析:[单选题]34.在SQL语言中的视图VIEW是数据库的()A)外模式B)存储模式C)模式D)内模式答案:A解析:[单选题]35.如需在出入境表中,筛选18岁以上的男性。其中的筛选条件之间的关系应该为A)与B)或C)与和或D)与或或答案:A解析:[单选题]36.关于赋值语句,以下选项中描述错误的是:A)赋值语句采用符号?=?表示B)赋值与二元操作符可以组合,例如&=C)a,b=b,a可以实现a和b值的互换D)a,b,c=b,e,a是不合法的答案:C解析:[单选题]37.在建模过程中,身份证号字段有10个数据,其中6个是规范化的数据,4个是脏数据,可通过()算子清洗出符合规则的6个数据,也可以根据实际需要清洗出不符合规则的4个脏数据进行补全。A)过滤B)无效数据过滤C)添加字段D)值映射答案:B解析:第2部分:多项选择题,共27题,每题至少两个正确答案,多选或少选均不得分。[多选题]38.在下列关于关系的叙述中,正确的是()A)C)行在表中的顺序无关紧要B)A)表中任意两行的值不能相同C)D)列在表中的顺序无关紧要D)B)表中任意两列的值不能相同答案:ABC解析:[多选题]39.机器学习中做特征选择时,可能用到的方法有?()A)卡方B)信息增益C)平均互信息D)期待交叉熵答案:ABCD解析:[多选题]40.Hadoop提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎。它是一个能够对大量数据进行分布式处理的软件框架,并且是以一种可靠、高效、可伸缩的方式进行处理,以下哪些属于Hadoop架构的优点?A)高可靠性B)高可扩展性C)高容错性D)支持多种编程语言答案:ABCD解析:[多选题]41.?showdatabaseslike?student%??命令可以显示出以下数据库()A)student_myB)studentyC)mystudentD)student答案:ABD解析:[多选题]42.下面不属于机器学习的先天本能是?()A)人们依据现有数据抽象出来的数学模型B)学习trainingdataset中输入输出数据间的关系C)举一反三学习trainingdataset中数据D)优化输入数据和输出数据的映射关系/函数好坏的评价函数答案:BCD解析:[多选题]43.下列关于Ridge回归,说法正确的是()?A)若λ=0,则等价于一般的线性回归B)若λ=0,则不等价于一般的线性回归C)若λ=+∞,则得到的权重系数很小,接近于零D)若λ=+∞,则得到的权重系数很大,接近与无穷大答案:AC解析:[多选题]44.数据从结构上划分,涉及多种类型,如各类数据库表、XML文件、各类办公文件、文本、音频、视频、图片等。数据的结构一般有哪几种形态?A)结构化B)半结构化C)非结构化D)多结构化答案:ABC解析:[多选题]45.在其他条件不变的前提下,以下哪些做法不容易引起机器学习中的过拟合问题()A)增加训练集量B)减少神经网络隐藏层节点数C)删除稀疏的特征D)SVM算法中使用高斯核/RBF核代替线性核答案:ABC解析:[多选题]46.在工作表中以列或行的形式排列的数据可以绘制为面积图。面积图可用于绘制随时间发生的变化量,用于引起人们对总值趋势的关注。通过显示所绘制的值的总和,面积图还可以显示部分与整体的关系。A)堆积面积图B)三维堆积面积C)图百分比堆积面积图D)三维百分比堆积面积图答案:ABCD解析:[多选题]47.我们知道二元分类的输出是概率值。一般设定输出概率大于或等于0.5,则预测为正类;若输出概率小于0.5,则预测为负类。那么,如果将阈值0.5提高,例如0.6,大于或等于0.6的才预测为正类。则准确率(Precision)和召回率(Recall)会发生什么变化()?A)准确率(Precision)增加或者不变B)准确率(Precision)减小C)召回率(Recall)减小或者不变D)召回率(Recall)增大答案:AC解析:[多选题]48.对于显示操作以下说法正确的是()A)showdatabase;显示所有数据库B)showtable;显示所有表C)showtables;显示所有表D)showdatabases;显示所有数据库答案:BD解析:[多选题]49.机器学习中L1正则化和L2正则化的区别是?()A)使用L1可以得到稀疏的权值B)使用L1可以得到平滑的权值C)使用L2可以得到稀疏的权值D)使用L2可以得到平滑的权值答案:AD解析:[多选题]50.在数据库管理系统中,有不同种类的存储特定信息并支持特定功能的数据库对象。数据库对象主要包括()和索引、约束、存储过程、触发器等。A)表B)查询C)视图D)页答案:AC解析:[多选题]51.从旅客住宿信息表中通过关联可以找出和某个人一同进入某个宾馆住宿的人身份证号,在挖掘犯罪人员团伙和在疫情期间追踪同住人员都很有效。关联时用到的配置是?A)证件号码不等于证件号码B)证件号码等于证件号码C)旅店编码不等于旅店编码D)旅店编码等于旅店编码答案:AD解析:[多选题]52.关系型数据库和常见的表格比较相似,关系型数据库中表与表之间是有很多复杂的关联关系的。常见的关系型数据库有Mysql,SqlServer等,虽然关系型数据库有很多,但是大多数都遵循SQL标准,常见的数据库操作包括()等。A)SELECTB)INSERTC)DELETED)UPDATE答案:ABCD解析:[多选题]53.以下属于聚类算法的是()A)K均值B)DBSCANC)AprioriD)Jarvis-Patrick(JP)答案:ABD解析:[多选题]54.有效抑制机器学习过拟合的方法是?()A)加大数据量B)减少数据量C)重新设计损失函数,引入平滑函数D)平滑损失函数答案:ACD解析:[多选题]55.MicrosoftExcel为对话框工作表提供了多个控件,启用?开发工具?选项卡后,这些控件可用于从列表中选择项目。在Excel中能插入以下哪些表单控件?A)组合框B)复选框C)数值调节钮D)列表框答案:ABCD解析:[多选题]56.我们希望减少数据集中的特征数量。你可以采取以下哪一个步骤来减少特征()?A)使用正向选择法(ForwardSelection)B)使用反向消除法(BackwardElimination)C)逐步选择消除法(Stepwise)D)计算不同特征之间的相关系数,删去相关系数高的特征之一答案:ABCD解析:[多选题]57.影响基本K-均值算法的主要因素有()A)样本输入顺序B)模式相似性测度C)聚类准则D)初始类中心的选取答案:ABD解析:[多选题]58.下列哪些属于CRF模型对于HMM和MEMM模型的优势()A)特征灵活B)速度快C)可容纳较多上下文信息D)全局最优答案:ACD解析:[多选题]59.数据清理中,处理缺失值的方法是?A)估算B)整例删除C)变量删除D)成对删除答案:ABCD解析:[多选题]60.下列哪种方法可以用来减小过拟合?()A)更多的训练数据B)L1正则化C)L2正则化D)减小模型的复杂度答案:ABCD解析:[多选题]61.以下哪些是mySQL数据类型()A)BIGINTB)TINYINTC)INTEGERD)INT答案:ABCD解析:[多选题]62.下列哪一个逻辑运算符的优先级排列不正确()A)AND/NOT/ORB)NOT/AND/ORC)OR/NOT/ANDD)OR/AND/NOT答案:ACD解析:[多选题]63.以下哪项是事务特性()A)独立性B)持久性C)原子性D)一致性答案:ABCD解析:[多选题]64.下列方法中,可以用于特征降维的方法包括?()A)主成分分析PCAB)线性判别分析LDAC)AutoEncoderD)矩阵奇异值分解SVDE)最小二乘法LeastSquares答案:ABCD解析:第3部分:判断题,共21题,请判断题目是否正确。[判断题]65.假如你在训练一个线性回归模型,如果数据量较少,容易发生过拟合A)正确B)错误答案:对解析:[判断题]66.假设random模块已导入,那么表达式random.sample(range(10),7)的作用是生成7个不重复的整数A)正确B)错误答案:对解析:[判断题]67.()INSERT语句所插入的数据行数据可以来自另外一个SELECT语句的结果集。A)正确B)错误答案:对解析:[判断题]68.假如现在有个神经网络,激活函数是ReLU,若使用线性激活函数代替ReLU,该神经网络能表征XNOR函数A)正确B)错误答案:对解析:[判断题]69.()当一个表中所有行都被delete语句删除后,该表也同时被删除了。A)正确B)错误答案:错解析:[判断题]70.假设有非空列表x,那么x.append(3)、x=x+[3]与x.insert(0,3)在执行时间上基本没有太大区别A)正确B)错误答案:错解析:[判断题]71.()xbetweenyandz等同于x>y&&x<z。A)正确B)错误答案:错解析:[判断题]72.字符串属于Python有序序列,和列表、元组一样都支持双向索引A)正确B)错误答案:对解析:[判断题]73.只可以动态为对象增加数据成员,而不能为对象动态增加成员方法A)正确B)错误答案:错解析:[判断题]74.?过拟合?只在监督学习中出现,在非监督学习中,没有?过拟合?A)正确B)错误答案:错解析:[判断题]75.计算机病毒(ComputerVirus)指编制或者在计算机程序中插入的破坏计算机功能或者破坏数据,影响计算机正常使用并且能够自我复制的一组计算机指令。A)正确B)错误答案:对解析:[判断题]76.时序预测回归预测一样,也是用已知的数据预测未来的值,但这些数据的区别是变量所处时间的不同A)正确B)错误答案:错解析:[判断题]77.用线性代数的方式描述函数或者方程的好处之一是书写方便A)正确B)错误答案:对解析:[判断题]78.噪声和伪像是数据错误这一相同表述的两种叫法A)正确B)错误答案:错解析:[判断题]79.数据仓库系统的组成部分包括数据仓库,仓库管理,数据抽取,分析工具等四个部分A)正确B)错误答案:错解析:[判断题]80.回归分析通常用于挖掘关联规则A)正确B)错误答案:错解析:[判断题]81.流程控制主要分为顺序、选择和循环,在Java和PHP中都有for\where\do--where循环,if条件/which语句,那么Python语言也都具有如上特性。A)正确B)错误答案:错解析:[判断题]82.()为了让MySQL较好地支持中文,在安装MySQL时,应该将数据库服务器的缺省字符集设定为gb2312。A)正确B)错误答案:错解析:[判断题]83.Python只能使用内置数据库SQLite,无法访问MSSQLServer、ACCESS或Oracle、MySQL等数据库A)正确B)错误答案:错解析:[判断题]84.分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于关联规则挖掘问题A)正确B)错误答案:对解析:[判断题]85.对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响A)正确B)错误答案:对解析:第4部分:问

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论