数据库与数据挖掘智慧树知到课后章节答案2023年下南京邮电大学

上传人：题*** IP属地：浙江上传时间：2023-11-08 格式：DOCX 页数：8 大小：13.24KB 积分：6 举报 版权申诉

已阅读5页，还剩3页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

数据库与数据挖掘智慧树知到课后章节答案2023年下南京邮电大学南京邮电大学

第一章测试

下列属于关系模型的性质的是()

A:不同列的列名可以相同B:行列的顺序可以任意交换C:分量必须取原子值D:列是同质的

答案:行列的顺序可以任意交换;分量必须取原子值;列是同质的

根据实体完整性规则，下列说法正确的是()

A:主键可以无意义B:非主键字段也必须非空C:主键非空D:主键可以取空值

答案:主键非空

下列做法最有可能违背用户定义完整性的是()

A:时间数据出现0:00B:日期数据出现2月30日C:百分制考试数据出现99D:姓名数据出现叶良辰

答案:日期数据出现2月30日

以下操作应用场景主要是获取两个集合的相对补集的是(）

A:并操作B:笛卡尔积C:差操作D:交操作

答案:差操作

从关系R中选择出若干属性组成新的关系属于(）

A:选择操作B:投影操作C:除运算D:连接操作

答案:连接操作

ER图中菱形表示的是(）

A:实体B:运算C:属性D:联系

答案:联系

系统中的成绩联系属于（）

A:联系B:多对多关系C:一元联系D:一对多关系

答案:联系;多对多关系

下列说法错误的是(）

A:AP原则系统不容忍时间延迟B:CP原则系统通用性不高C:CA原则系统扩展性较弱

答案:AP原则系统不容忍时间延迟

分布式系统可以同时满足CAP原则

A:对B:错

答案:错

下列不属于关系型数据库局限性的是（）

A:大数据场景下的I/O较高B:无法存储数据结构C:表结构扩展不方便D:数据格式不完备

答案:数据格式不完备

第二章测试

Hive中删除管理表不会删除表所指向的数据文件

A:对B:错

答案:错

Hive会在数据读取时进行数据类型验证

A:错B:对

答案:对

Hive在strict(严格)模式下查询分区表时，WHERE子句必须要加上分区过滤。

A:错B:对

答案:对

下列语句可以显示数据库test中的表名的包括()

A:SHOWtest.TABLES;B:SHOWTABLESINtest;C:USEtest;SHOWTABLES;

答案:SHOWTABLESINtest;;USEtest;SHOWTABLES;

Hive可以向视图(VIEW)中导入数据。

A:对B:错

答案:错

若分区表test包含的分区字段为(a,b),如何查看分区a=1下的所有分区()

A:SELECTPARTITIONSFROMtestPARTITION(a=1);B:SHOWPARTITIONStestPARTITION(a=1);C:SELECTbFROMtestWHEREa=1;

答案:SHOWPARTITIONStestPARTITION(a=1);

以下命令可以查询date_records中约会成功匹配(match=1)次数的是()

A:SELECTmatchFROMdate_recordsWHEREmatch=1;B:SELECTcount(*)FROMdate_recordsWHEREmatch=1;C:SELECTsum(match)FROMdate_records;D:SELECTsum(id)FROMdate_recordsWHEREmatch=1;

答案:SELECTcount(*)FROMdate_recordsWHEREmatch=1;;SELECTsum(match)FROMdate_records;

Hive使用右外连接(RIGHTOUTERJOIN)来连接两张表进行查询时，JOIN操作符右边的表如果没有符合ON后面连接条件的记录时，右边表指定选择的列的值将不会显示。

A:错B:对

答案:对

Hive中使用ORDERBY关键字进行的排序是全局有序的。

A:错B:对

答案:对

UNIONALL既可以合并多个表，也可以用于同一源表的合并。

A:对B:错

答案:对

第三章测试

Hive中要尽量把对同一张表的查询任务汇总到一步操作中，以节约计算成本。

A:对B:错

答案:对

下列不属于Hadoop常用的压缩解码器的是()

A:winzipB:GzipC:BZip2D:Snappy

答案:winzip

下列压缩编解码器的压缩文件可分割的是（）

A:SnappyB:LZOC:BZip2D:Gzip

答案:LZO;BZip2

BZip2和Gzip的压缩率要高于LZO和Snappy。

A:对B:错

答案:对

Hadoop默认的压缩编解码器是()

A:SnappyB:GzipC:BZip2D:winzip

答案:Gzip

下列最适合用在中间压缩时的压缩编解码器是()

A:winzipB:GzipC:BZip2D:Snappy

答案:Snappy

事务隔离中级别最高的是()

A:读提交数据B:读未提交数据C:可串行化D:可重复读

答案:可串行化

允许事务读已提交数据属于哪个级别的事务隔离()

A:读提交数据B:读未提交数据C:可串行化D:可重复读

答案:读提交数据

下列与权限管理有关的关键字有()

A:CREATEB:REVOKEC:GRANTD:SELECT

答案:REVOKE;GRANT

第四章测试

下面哪个不是RDD的特点

A:可修改B:可分区C:可序列化D:可持久化

答案:可修改

Spark的四大组件下面哪个不是

A:GraphxB:MlibC:SparkStreaming

D:SparkR

答案:SparkR

Spark提供的算法包括

A:聚类B:分类C:回归D:推荐

答案:聚类;分类;回归;推荐

RDD（ResilientDistributedDataset）叫做分布式数据集，是spark中最基本的数据抽象，它代表一个不可变，可分区，里面的元素可以并行计算的集合

A:错B:对

答案:对

Spar提供了两种有限的共享变量：广播变量和累加器

A:对B:错

答案:对

第五章测试

关于Logistic回归和SVM，以下说法错误的是

Logistic回归的目标函数是最小化后验概率B:Logistic回归可用于预测事件发生概率的大小C:SVM可以有效避免模型过拟合D:SVM的目标的结构风险最小化

答案:

Logistic回归的目标函数是最小化后验概率

以下有关特征数据归一化的说法错误的是：

A:特征数据归一化加速梯度下降优化的速度B:特征数据归一化有可能提高模型的精度C:线性归一化适用于特征数值分化比较大的情况D:概率模型不需要做归一化处理

答案:线性归一化适用于特征数值分化比较大的情况

应GradientBoostingtree算法，以下说法正确的是:

A:当我们减少训练单个学习器的样本个数，我们可以降低biasB:当增加最小样本分裂个数，会导致过拟合C:当增加最小样本分裂个数，我们可以抵制过拟合D:当我们减少训练单个学习器

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数据库与数据挖掘智慧树知到课后章节答案2023年下南京邮电大学

文档简介

温馨提示

最新文档

评论

数据库与数据挖掘智慧树知到课后章节答案2023年下南京邮电大学

文档简介

温馨提示

最新文档

评论

相关文档