数据采集1+初级模拟练习题(附答案)_第1页
数据采集1+初级模拟练习题(附答案)_第2页
数据采集1+初级模拟练习题(附答案)_第3页
数据采集1+初级模拟练习题(附答案)_第4页
数据采集1+初级模拟练习题(附答案)_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级模拟练习题(附答案)

一、单选题(共40题,每题1分,共40分)

1、关于Python函数作用的描述,以下选项中错误的是()

A、提高代码执行速度

B、复用代码

C、增强代码的可读性

D、降低编程复杂度

正确答案:A

2、下列标识符中哪个是合法的?()

A、i'm

B、_

C、3Q

D、for

正确答案:B

3、下列协议属于应用层的是()

A、TCP

B、UDP

C、FTP

D、IP

正确答案:C

4、搜索引擎优化和网络营销的缩写分别是()

A、SEO和UE0

B、SE0和SEM

C、SEM和SEO

D、UE0和SEM

正确答案:B

5、Scrapy中,用于自定义所有Scrapy组件的行为的是()。

A、pipline

B、Item

C、settings

D>Spider

正确答案:C

6、使用Xpath获取一篇HTML文档中所有超链接的href属性,Xpath代

码为()。

A、/a/@href

B、/a/href

C、//a/@href

D>//@href

正确答案:C

7、XPath使用()在XML文档中选取节点?

A、step

B、步

C、节点

D、路径表达式

正确答案:D

8、在查询SQL语句中,用来表示分组的是()

A、GROUPBY

B、ORDERBY

C、DISTINCT

D、HAVING

正确答案:A

9、ELK技术栈中,用于展示数据的技术是()

A、Kibana

B、Logstash

C、Elasticsearch

D、Echart

正确答案:A

10、服务器端响应状态码中,表示“NOTFOUND未找到”的是

A、200

B、404

C、302

D、304

正确答案:B

11、FTP的主要特点不包括()。

A、只提供文件传送的一些基本的服务

B、使用UDP的运输服务

C、使用客户服务器方式,可同时为多个客户进程提供服务

D、可减少或消除在不同操作系统下处理文件的不兼容性

正确答案:B

12、Python中,下面代码的输出结果是()print(0.1+0.2==0.3)

A、False

B、false

C、true

D、True

正确答案:A

13、以下选项中,不是Python语言特点的是

A、黏性扩展:Python语言能够集成C、C.++等语言编写的代码

B、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系

C、变量声明:Python语言具有使用变量需要先定义后使用的特点

D、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执

正确答案:C

14、在SQLServer中删除触发器用()

A、DELETE

B、DROP

C、DELALLOCATE

D、ROLLBACK

正确答案:B

15、Elasticsearch使用什么语言开发

A、HTML

B、C

C、.Net

D、Java

正确答案:D

16、对表结构的修改可以通过执行SQL语句()来实现。

A、updatetable

B、altertable

C、selecttable

D、droptable

正确答案:B

17、运算符T’表示什么?

A、取元素节点的交集

B、以上都不对

C、返回所有拥有俩元素的节点集

D、返回拥有俩元素的节点集

正确答案:C

18、数据采集是数据分析前的重要且首要环节,数据采集需要符合哪些

特性()

A、全面性、多维性、高效性

B、单一化、低维度、低并发

C、多维性、灵活性、高延迟

D、低维度、高并发、高速率

正确答案:A

19、创建数据库使用以下哪项()

A、createmytest

B、createtablemytest

C、databasemytest

D、createdatabasemytest

正确答案:D

20、以下不属于常用的日志框架的是()

A、vue

B、Logback

C、Slf4j

D、Log4j

正确答案:A

21、Apache的主配置文件路径为()

A、httpd/conf/httpd.conf

B、/etc/httpd/conf/httpd.conf

C、conf/httpd.conf

D>conf

正确答案:B

22、Scrapy中,用于对Item进行清理、验证,并定义其输出的是

A、Item

B、pipline

C、settings

D>Spider

正确答案:B

23、国家网信办持续重拳出击,依法查处网上违法违规行为,集中清理

淫秽色情、虚假欺诈等违法违规信息,对违法违规公众账号和误导公众、

影响恶劣的网络名人账号予以关闭或暂停。对此,下列说法正确的是

A、网络空间自由,不应关闭

B、网络空间不是法外之地,不得传播违法信息

C、信息只在朋友圈中传播,属于个人行为隐私

D、个人兴趣爱好,不应处罚

正确答案:B

24、获取页面中title标签的内容,xpath代码为()

A、//title/text()

B、//title/@text()

C>//title/text

D、//title/@text

正确答案:A

25、Logstash正则匹配模式中,用于匹配日志中IP地址的是()

A>HOSTNAME

B、IPORI1OST

C、WORD

D、HTTPDUSER

正确答案:B

26、re模块的常用方法中用于将输入的字符串整个扫描并返回第一个成

功的匹配的是()。

A、compile

B、split

C、search

D>sub

正确答案:C

27、re模块所提供的方法中,用于搜索整个字符串,返回一个列表包含

全部能匹配的子串的方法是()

A、findall

B、match

C、finditer

D>search

正确答案:A

28、BeautifulSoup中,能够获取标签内容的是

A、text()

B、string

C、string()

D、text

正确答案:B

29、以下不属于JavaScript基本数据类型的是()

A、Object

B>Boolean

C、String

D、Number

正确答案:A

30、ARP协议主要作用是()。

A、IP地址到域名地址的解析

B、物理地址到IP地址的解析

C、域名地址到IP地址的解析

D、IP地址到物理地址的解析

正确答案:D

31、在re模块中,以下哪种方法()能够返回多个符合规则的字符串

A、finditer

B、findall

C、match

D、search

正确答案:B

32、Apache服务器中检验配置是否有语法错误代码为()

A、apachectl

B、testlog

C、apachectlconfigtestOl

D、apachectlconfigtest

正确答案:D

33、HTML中能够定义表单提交位置的属性是

A、name

B、title

C、action

D、method

正确答案:c

34、数据库管理系统能实现建立数据库、建立表等操作的数据库语言称

为(),其主要包括CREATEDATABASE>CREATETABLE等。

A、DDL(数据定义语言)

B、DML(数据操纵语言)

C、DCL(数据控制语言)

D、DQL(数据查询语言)

正确答案:A

35、下列表达式的值为True的是()

A、5+4j>2-3j

B、3>2>2

C、(3.2)<("a〃.〃b")

D>"abc">"xyz”

正确答案:C

36、在MySQL中,创建完数据表之后,如果需要查看该表是否已经成功

创建,可以在指定的数据库中使用()命令查看表。

A、updatetable;

B、showtables;

C、showtable;

D、selecttable;

正确答案:B

37、Scrapy中,用于封装数据的类是

A、Spider

B、settings

C>pipline

D>Item

正确答案:D

38、Python语言语句块的标记是()

A、分号

B、逗号

C、缩进

D、

正确答案:C

39、Android系统是基于Linux操作系统开发的手机系统,因此在进行刷

机、删除系统自带软件时需要获得管理员账户()的权限

A、liveuser

B、admin

C、root

D、administrator

正确答案:c

40、ERP核心业务功能不包括()

A、质量管理

B、销售管理

C、生产计划

D、外勤签到

正确答案:D

二、多选题(共20题,每题1分,共20分)

1、在HTML中,<form>标签的属性有()。

A、enctype属性设置表单资料的编码方式

B、name属性定义表单的名称

C、method属性定义表单结果从浏览器传送到服务器的方法

D、action属性用来定义表单处理程序(ASP,CGI等程序)的位置(相对地

址或绝对地址)

正确答案:ABCD

2、—new—和—init―的区别,说法正确的是()?

A、_new_是一个静态方法.而—init—是一个实例方法

B、—new—方法会返回一个创建的实例,而—init—什么都不返回

C、只有在_new_返回一个cis的实例时,后面的_init_才能被调用

D、当创建一个新实例时调用—new一.初始化一个实例时用initO

正确答案:ABCD

3、Xpath表达式的返回值可以返回什么类型?

A、布尔类型

B、节点值

C、数字

D、字符串

正确答案:ABCD

4、linux中安装软件可使用命令0。

A、yuminstall

B、setup

C、rpm

D、源代码安装

正确答案:ACD

5、正则表达式,又称规则表达式,在代码中可简写为()?

A、R

B、regexp

C、RE

D、regex

正确答案:BCD

6、什么途径可以找到同行业的优质的友情链接

A、查找竞争对手的链接

B、空白

C、站长论坛寻找

D、购买的链接

正确答案:AC

7、下面哪个不是Python合法的标识符()

A、40XL

B、3self

C、_name_

D、int32

正确答案:AB

8、《民法总则》中规定自然人的个人信息受法律保护。任何组织和个人

需要获取他人个人信息的,应当()

A、依法取得并确保信息安全

B、不得非法买卖、提供或者公开他人个人信息

C、不得非法收集、使用、加工、传输他人个人信息

D、可以任意公开他人信息

正确答案:ABC

9、有关IPV6协议说法正确的是()

A、不允许协议继续扩充

B、具备更大的地址空间,地址空间达到128位

C、支持资源的预分配

D、灵活的首部格式

正确答案:BCD

10、以下属于半结构化数据的是

A、MySQL中的数据表

B、JS0N格式文档

C、XML文档

D、日志文件

正确答案:BCD

11、sql语言分为以下()几类

A、DQL

B、DML

C、DCL

D、DDL

正确答案:ABCD

12、下列哪些可以匹配英文和汉字?

A、[A-Za-z0-9]+$

B、"[A-Za-zO-9]{4.40}

C、[A_Za_zO_9]+$

D、'[A-Za-zO-9]{4.40}$

正确答案:CD

13、下列属于数据操纵语言中典型的语句有()

A、UPDATE

B、SELECT

C、DELETE

D、INSERT

正确答案:ABCD

14、《中华人民共和国网络安全法》中规定()

A、不得提供专门用于从事侵入网络、干扰网络正常功能及防护措施、窃

取网络数据等危害网络安全活动的程序、工具

B、任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、

窃取网络数据等危害网络安全的活动

C、明知他人从事危害网络安全的活动的,不得为其提供技术支持、广告

推广、支付结算等帮助

D、可以提供危害网络安全活动的程序、工具

正确答案:ABC

15、计算机网络按照交换方式分类,可以分为()。

A、报文交换网

B、混合交换网

C、分组交换网

D、电路交换网

正确答案:ABCD

16、在操作系统中,进程是指一个程序以及其数据在处理器上执行时发

生的所有活动,是系统资源分配和调度的一个独立单位。以下属于进程

特征的是()。

A、异步性

B、独立性

C、并发性

D、动态性

正确答案:ABCD

17、以下哪些是Python的保留字和关键字()。

A、import

B、Global

C>class

D、Def

正确答案:AC

18、项目是()或者()?

A、无

B、无

C、节点

D、基本值

正确答案:CD

19、关于select语句下列说法正确的是()

A、select(name,age)frompersonwhereage=12andname="aa";

and并且

B、select(name)fromtablepersonwhereage=12;查找age=12的

记录的那个字段的值

C>select(name)fromtableperson:所有记录的name字段的值

D>select(name)frompersonwhereage=12orname="aa”;or或者

正确答案:AD

20、爬虫的基本流程主要包括()。

A、获取响应内容

B、解析内容

C、发起请求

D、保存数据

正确答案:ABCD

三、判断题(共30题,每题1分,共30分)

1、采集数据时,文档、图片、图像、音频、视频等都属于非结构化数据。

A、正确

B、错误

正确答案:A

2、Python源代码程序编译后的文件扩展名为.py

A、正确

B、错误

正确答案:B

3、ARP协议可以通过IP地址获取对应主机的物理地址,是网络层协议。

A、正确

B、错误

正确答案:A

4、使用关键字with时,open()返回的文件对象只在with代码块内

可用。如果要在with代码块外访问文件的内容,可在with代码块内

将文件的各行存储在一个列表中,并在with代码块外使用该列表。

A、正确

B、错误

正确答案:A

5、堆叠是用专用的端口把交换机连接起来,当作一个交换机使用。

A、正确

B、错误

正确答案:A

6、Python语言语句块的标记分号

A、正确

B、错误

正确答案:B

7、不经用户同意,电信业务经营者、互联网信息服务提供者可以收集、

使用用户个人信息

A、正确

B、错误

正确答案:B

8、查看变量内存地址的Python内置函数是id()

A、正确

B、错误

正确答案:A

9、“在传输、存储信息或数据的过程中,确保信息或数据不被未授权的

用户篡改或在篡改后能够迅速被发现”这一叙述属于信息安全的完整性

要素

A、正确

B、错误

正确答案:A

10、数据采集以人工录入方式为主,避免使用自动化的手段。

A、正确

B、错误

正确答案:B

11、Windows操作系统在其运行的生命周期中会记录其大量的日志信息,

这些日志信息包括:Windows事件日志(EventLog),Windows服务器系

统的HS日志,FTP日志,ExchangeServer邮件服务,MSSQLServer

数据库日志等。

A、正确

B、错误

正确答案:A

12、网站SEO优化时,关键词密度根本不用考虑,只要不堆积就行。

A、正确

B、错误

正确答案:B

13、catfilename.txt|more可实现分页地查看一个大文件的内容。

A、正确

B、错误

正确答案:A

14、Python语言是脚本语言

A、正确

B、错误

正确答案:A

15、正则表达式的主要应用对象是文本,因此在所有文本编辑器都有应

用。

A、正确

B、错误

正确答案:B

16、Tomcat是Apache软件基金会推出的一个收费的Servlet容器

A、正确

B、错误

正确答案:B

17、Apache默认端口是8080,通过修改httpd.conf可以修改其端口

A、正确

B、错误

正确答案:B

18、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论