大数据采集与存储知到章节答案智慧树2023年山东交通学院

上传人：题*** IP属地：浙江上传时间：2023-05-12 格式：DOCX 页数：11 大小：13.23KB 积分：6 举报 版权申诉

免费预览已结束，剩余6页可下载查看

下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

大数据采集与存储知到章节测试答案智慧树2023年最新山东交通学院第一章测试

关系模式学生信息（学号，姓名，年龄，性别，籍贯），其中的主键是（）

参考答案:

学号

Oracle是一个开源、免费的中小型关系型数据库管理系统。（）

参考答案:

错

NoSQL的全称是（）

参考答案:

NotOnlySql

键值数据库，是基于key-value模式，它使用简单的键值方法来存储数据。（）

参考答案:

对

（）是最原始的SQLOnHadoop的解决方案，它是基于Hadoop实现的分布式数据仓库。

参考答案:

Hive

图数据库，以“图”数据结构存储和查询数据，使用节点表示数据模型中的实体，节点之间的边表示实体之间的关系。（）

参考答案:

对

第二章测试

关于数据模型，下列说法正确的是（）。

参考答案:

数据模型的三要素是数据结构、数据操作和数据完整性约束

关于学生关系，下列哪一个属性适合作为候选码（）。

参考答案:

学号。

有学生表Student(S#char(8),Snamechar(10),Ssexchar(2),Sageinteger,D#char(2),Sclasschar(6))。要检索学生表中“所有年龄小于等于19岁的学生的年龄及姓名”，SQL语句正确的是（）

参考答案:

SelectSage,SnameFromStudentWhereSage＜=19

有学生表Student(S#char(8),Snamechar(10),Ssexchar(2),Sageinteger,D#char(2),Sclasschar(6))。若要“检索名字为姓张的所有同学姓名”，SQL语句正确的是（）

参考答案:

SelectSnameFromStudentWhereSnameLike‘张%’

SQL语言中，删除一个表的命令是（）

参考答案:

DROP

在下列关于视图的叙述中，正确的是（）

参考答案:

当修改某一视图时，导出该视图的基本表也随之修改。

查询时，若要输出无重复的记录，SELECT子句中使用的保留字是：（）

参考答案:

DISTINCT

查询结果输出时要求按“总评成绩”降序排列，相同者按“性别”升序，正确的子句是（）

参考答案:

ORDERBY总评成绩DESC,性别

参照完整性规则是指表的（）必须是另一个表主键的有效值，或者是空值。

参考答案:

外键

下面有关HAVING子句，说法不正确的是（）

参考答案:

使用HAVING子句的同时不能使用WHERE子句

第三章测试

MongoDB是一个开源、高性能、无模式的文档型数据库。（）

参考答案:

对

MongoDB通过（）来描述和存放数据。

参考答案:

BSON

查看当前正在使用的数据库命令（）

参考答案:

查找kate同学的专业，使用指令（）完成。

参考答案:

null

MongoDB中，用户可以将_id字段上的索引删除。（）

参考答案:

错

关系型数据库遵循BASE和CAP理论。（）

参考答案:

错

第四章测试

大数据采集，又称大数据获取，是指从（）等获取数据的过程。

参考答案:

传感器

;企业系统

;其它智能设备

;社交网络

网络爬虫的步骤是

1）选取一部分种子URL；

2）从待抓取URL队列中取出待抓取的URL，解析DNS，得到主机的IP地址，并将URL对应的网页下载下来，存储到已下载网页库中。此外，将这些URL放进已抓取URL队列；

3）将这些URL放到待抓取URL中；

4）分析已抓取URL队列中的URL，分析其中的其他URL，并且将这些URL放入待抓取URL队列，从而进入下一个循环。（）

参考答案:

1）3）2）4）

数据完整性指的是数据具有一个实体描述的所有必需的部分。（）

参考答案:

对

在大数据预处理中，需要数据清洗的主要类型包括以下几类（）

参考答案:

异常值数据

;重复值数据

;缺失值数据

数据清洗时重复值数据不能够删除。（）

参考答案:

错

在数据离散化中，常见的离散化方法有（）

参考答案:

基于卡方分箱的方法

;基于熵的离散化

;等频划分

;聚类划分

;等宽划分

第五章测试

爬虫就是能够实现网页数据爬取的程序。（）

参考答案:

对

Python中提供的requests库的get()方法能够实现爬取网页信息的功能。（）

参考答案:

对

在使用requests库获取网页资源过程中，最重要的两个对象就是Request和Response，（）负责将客户端的请求发送给服务器。

参考答案:

Request

HTML语言使用“标签对”来标记信息。其中，＜html＞……＜/html＞标记一个HTML文件中标题的开始和结束。（）

参考答案:

错

以下程序段的运行结果是

frombs4importBeautifulSoup

htmlText='＜p＞解析页面＜/p＞'

soup=BeautifulSoup(htmlText,'html.parser')

print(soup.p)（）

参考答案:

null

如果有网络爬虫频繁的访问服务器，则容易引发（）问题。

参考答案:

网站的性能下降

任何网站都有自己的Robots协议，用来保护网站的信息不会被恶意访问。（）

参考答案:

错

第六章测试

Kettle是一种常用的ETL工具，它支持图形化的GUI设计界面。（）

参考答案:

对

在数据清洗中，“输入”功能主要是实现ETL的数据抽取、加载、格式转换。（）

参考答案:

错

Kettle能够支持多种格式的数据输出，但不支持下面（）文件格式。

参考答案:

word

kettle中的以下组件中，属于基本数据清洗的是（）

参考答案:

连接字段

;数据替换

;数据排序

;删除数据

Kettle让我们在可视化的界面中，通过拖拽实现数据处理。无需掌握复杂的编程技术也可以帮助我们完成数据的ETL处理。（）

参考答案:

对

Kettle中的job作业是指定时完成一系列指定的数据转换，并将结果以邮件的方式告知给我们。（）

参考答案:

对

第七章测试

在本案例中，数据采集是通过（）获取。

参考答案:

网络爬虫

在数据采集后，python中使用（）库把数据存储到cs

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大数据采集与存储知到章节答案智慧树2023年山东交通学院

文档简介

温馨提示

最新文档

评论

大数据采集与存储知到章节答案智慧树2023年山东交通学院

文档简介

温馨提示

最新文档

评论

相关文档