数据采集1+初级试题与答案_第1页
数据采集1+初级试题与答案_第2页
数据采集1+初级试题与答案_第3页
数据采集1+初级试题与答案_第4页
数据采集1+初级试题与答案_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级试题与答案

1、Apache服务器是实现()网络协议的服务器。

A、FTP

B、DHCP

C、HTTPD

D、HTTP

答案:D

2、以下数据中,非结构化数据不包括()

A、图片

B、音频

C、图像

D、日志文件

答案:D

3、下面哪个不是Python合法的标识符()

A、int32

B、40XL

C、self

D、_name_

答案:B

4、在Windows中,对文件夹进行复制时会复制哪些内容

A、只复制文件夹名,不复制其内容

B、复制文件夹名的其下所有的文件和子文件夹

C、只复制文件夹名和其下的文件,不复制其下的文件夹

D、复制文件夹名和其下所有的文件和子文件夹,但不复制子文件夹下的文

答案:B

5、以下选项中符合Python语言变量命名规则的是

A、*i

B、3_1

C、AI!

D^Templist

答案:D

6、以下xpath代码中,能够获取页面中title标签的内容的是()。

A、//title/@text

B^//title/text

C、//title/text

D、//title/@text

答案:B

7、Xpath中的()可用来选取未知的XML元素?

A、节点

B、属性

C、表达式

D、通配符

答案:D

8、删除数据表文件的命令是()

A、DELETETABLE

B、DROPTABLE

C、DROP

D、DELETE

答案:B

9、如果要在python中只用正则表达式,则需要引入哪个模块

A、re

B、Ixml

C、etree

D、xml

答案:A

10、python编写爬虫过程中,需要将爬取的网页内容转换为哪种类型的对

象才可以使用etree模块的xpath方法()

A、D0M

B、HTML

C、Element

D、Response

答案:C

11、XPath使用()在XML文档中选取节点?

A、节点

B、步

C、路径表达式

D、step

答案:C

12、在select语句的where子句中,使用正则表达式过滤数据的关键字是

A、like

B、against

C、match

D、regexp

答案:D

13、什么是正则表达式?

A、任何在Python中可能的正确表达式

B、程序员经常使用的编程语言表达式的集合

C、用来匹配文本字符串(如特定字符、单词或字符模式)的一种工具

D、从Python字典中快速获取数据的一种算法

答案:C

14、数据库系统的最大特点是

A、数据的三级抽象和二级独立性

B、数据共享性

C、数据的结构化

D、数据独立性

答案:A

15、下列命令中可以起到对文件进行重命名作用的命令是()

A、1s

B、cp

C、mv

D、rm

答案:C

16、ATM的基本单位是信元,其长度为。

A、5字节

B、53字节

C、48字节

D、32字节

答案:B

17、ELK技术栈中,用于展示数据的技术是()

A、Elasticsearch

B、Logstash

C、Kibana

D>Echart

答案:C

18、在select语句的where子句中,使用正则表达式过滤数据的关键字是

()

A、like

B、against

C、match

D、regexp

答案:D

19>使用xpath,选取属于body子节点下的最后一个div节点的表达式为

()

A、/html/body/divfirst]

B、/html/body/divlast]

C、/html/body/divpositon=last]

D^/html/body/divpositon=first]

答案:B

20、Python语言中用来定义函数的关键字是

A、return

B、def

C、function

D、define

答案:B

21、Log4j定义的日志概念里不包含哪个()

A、Logger

B、writer

C、Appender

D、Level

答案:B

22、正则表达式“[a-z」”表示的含义是()

A、取所有小写英文字母以及一中的任意多个。

B、取“a、一、z、中的任意多个。

C、取“a、-、z、中的任意一个。

D、取所有小写英文字母以及一中的任意一个。

答案:D

23、使用scrapy的()命令可以创建一个scrapy项目

A、startproject

B、genspider

C、runspider

D>generatescrapy

答案:A

24、使用scrapy的命令创建的scrapy项目中,哪个程序是用于封装爬取

数据的,类似于Java中的JavaBean对象

A、middle,py

B、init.py

C、items,py

D、scrapy.cfg

答案:C

25、HTTPS协议的默认端口号是

A、80

B、8080

C、443

D、88

答案:C

26、Tomcat默认发布项目的位置为()

A、apps

B、webapps

C、WEB-INF

D>classes

答案:B

27、以下哪一项与网站优化关键词排名无关。

A、网站开发语言

B、网站域名

C、网站程序复杂度

D、网站空间稳定性

答案:A

28、数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等

操作的数据库语言称为()

A、数据定义语言(DDL)

B、数据管理语言

C、数据操纵语言(DML)

D、数据控制语言

答案:C

29、以下聚合函数中,用来统计平均值的函数为()

A、count

B、min

C、avg

D、sum

答案:C

30、json模块中,()方法可以将python的字典和列表转换为json字符

A、load

B、loads

C、dump

D>dumps

答案:D

31、下列哪个语句在Python中是非法的?()

A>x=y=z=1

B>x=y=z+1

C>x.y=y.x

D>x+=y

答案:B

32、在Python中,关于全局变量和局部变量,以下选项中描述不正确的是

0

A、一个程序中的变量包含两类:全局变量和局部变量

B、全局变量不能和局部变量重名

C、全局变量一般没有缩进

D、全局变量在程序执行的全过程有效

答案:B

33、检查网络联通性的命令是()

A、ipconfig

B、route

C>telnet

D、ping

答案:D

34、下列哪些属于()规范数据信息收集的方式与要求

A、自然人的个人信息受法律保护

B、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使

用用户个人信息

C、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营

者予以更正

D、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保

护制度

答案:A

35、网站SEO优化时,网站进行友情链接多少个为适中()。

A、「5个

B、20~30个

C、30~40个

D、40个以上

答案:B

36、Hub是一种网络设备,它的中文名称叫

A、调制解调器

B、路由器

C、集线器

D、网桥

答案:C

37、以下不是修改表操作的是()

A、droptableuser

B、altertableuseraddremarkvarchar20

C、altertableusercharactersetutf8

D>altertableuserdropremark

答案:A

38、以下BeautifulSoup4的描述中,错误的是

A、BeautifulSoup可以进行html文档的解析,但不能实现对网页的抓取

B、默认使用的是标准库解析器

C、使用IxmlHTML解析器对文档的纠错能力强,但解析速度较慢

D、自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。

答案:C

39、re模块的常用方法中用于将输入的字符串整个扫描并返回第一个成功

的匹配的是()。

A、sub

B、split

C、search

D>compile

答案:c

40、能够实现数据链路层的互联设备有()

A、网管

B、网桥

C、中继器

D、路由

答案:B

41、自由软件的含义是()

A、用户不需要付费

B、软件可以自由修改和发布

C、只有软件作者才能向用户收费

D、软件发行商不能向用户收费

答案:B

42、以下不属于jQuei~y选择器的是()。

A、id选择器

B、.class选择器

C、元素选择器

D、css选择器

答案:D

43、下列不属于ELK范畴的是()

A、Logstash

B、Lucene

C、ElasticSearch

D>Kibana

答案:B

44、网络层以上的中继系统是()

A、转发器

B、网桥

C、路由器

D、网关

答案:D

45、re模块中能够返回多个符合规则的字符串的方法是()

A、search

B、match

C、findall

D>finditer

答案:C

46、以下不属于JavaScript引用数据类型的是()

A、Function

B、Object

C、Array

D、答案:D

47>以下CSS中,不属于font属性的是()

A、font-size

B、font-weight

C、size

D>font-style

答案:c

48、数据库结构的描述和定义是DBMS运行的基本依据,它们存储于()

A、封锁表

B、数据字典

C、索引

D、日志

答案:B

49、下列表达式的值为True的是()

A、5+4j>2-3j

B、3>2>2

C、3.2<〃a"."b"

D、"abc">"xyz”

答案:C

50、Python文件的后缀名是()。

A、go

B、py

C>do

D、php

答案:B

51、数据采集是数据分析前的重要且首要环节,数据采集需要符合哪些特

性()

A、多维性、灵活性、高延迟

B、全面性、多维性、高效性

C、低维度、高并发、高速率

D、单一化、低维度、低并发

答案:B

52、使用httpd命令查看Apache软件的安装版本信息,命令为()

A、httpd-v

B、httpd-version

C^httpd

D、http

答案:A

53、以下哪个网站是常用的站长工具

A、www.google,com

B、too.chinaz.com

C、www.sohu.com

D>www.seozz.net

答案:B

54、Python不支持的数据类型有()

A、char

B、int

C^float

D、list

答案:A

55、以下选项中,不是Python对文件的打开模式的是()

A、'r'

B、'+'

C、'w'

D、'c'

答案:D

56、OpenSSH服务进程默认使用的端口号是()。

A、21

B、22

C、24

D、25

答案:B

57、Java应用系统中常用的日志框架不包括()

A、Log4j

B、Logback

C、Log4j2

D、loguru

答案:D

58、Scrapy中,用于创建项目的命令是

A、createproject

startproject

C、openproject

D、beginproject

答案:B

59、使用scrapy框架编写爬虫,setting.py文件中有些配置项需要修改,

比如R0B0TSTXT_0BEY的值一般情况下设置为

A、True

B、0

C、False

D、1

答案:C

60、服务器端响应状态码中,表示“NOTMODIFIED文档未修改”的是

A、302

B、404

C、304

D、200

答案:C

61、urllib.request,urlopen()方法的返回值是一个Response类型的对象,

此对象具有的属性有

A、msg

B、version

C、status

D、reason

答案:ABCD

62、CRM主要应用于哪些方面()

A、客户档案有序管理

B、合同管理

C、销售报表

D、外勤签到

E、预测销售业绩

答案:ABCDE

63、以下属于JavaScript核心对象的是()

A、String对象

B、Math对象

C、Array对象

D、Date对象

答案:ABCD

64、在HTML中,〈form〉标签的属性有()。

A、name属性定义表单的名称

B、method属性定义表单结果从浏览器传送到服务器的方法

C、action属性用来定义表单处理程序ASP,CGI等程序的位置相对地址或

绝对地址

D、enctype属性设置表单资料的编码方式

答案:ABCD

65、以下哪几项是设计手机用户界面时应注意的问题

A、设计风格保持一致

B、界面设计与程序逻辑的分离

C、根据不同型号手机的屏幕解析度、尺寸和纵横比各不相同,自动调整界

面上部分控件的位置和尺寸,避免因为屏幕信息的变化而出现显示错误

D、能够合理利用较小的屏幕显示空间,构造出符合人机交互规律的用户界

答案:ABCD

66、以下属于DML语句的是()。

A、INSERT

B、ALTER

C、DROP

D、DELETE

答案:AD

67、若当前目录中只有一个名为file的文件,下列那些命令可以创建一个

名为newfile新文件()。

A、vimnewfile

B、catnewfile

C、cpfilenewfile

D^catfile>newfile

答案:ACD

68、关于socket编程,对于服务端编程的主要步骤包括()

A、打开socket

B、绑定到一个地址和端口

C、监听客户端连接

D、读写数据

答案:ABCD

69、以下属于jQuery特点的是()

A、是一个轻量级JavaScript库

B、兼容各种浏览器

C、容易扩展,插件丰富

D、可以方便的为网站提供ajax交互

答案:ABCD

70、以下关于索引的说法正确的是0。

A、可以加快数据的检索速度

B、可以加快表与表之间的连接

C、唯一性索引可以保证数据记录的唯一性

D、索引不需要花费代价占用存储空间就可以实现检索速度的提高

答案:ABC

71、Python中,关于re模块描述正确的是()

A、re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,

则匹配失败,函数返回None

B、re模块使Python语言拥有全部的正则表达式功能

C、re.search匹配整个字符串,直到找到一个匹配

D、以上描述都不正确

答案:ABC

72、在Python中提供了哪些技术用于获取网页数据()

A、Urllib模块

B、Requests模块

C、BeautifulSoup库

D、Ixml库

答案:BC

73、根据《中华人民共和国网络安全法》,下列说法不正确的是()

A、网络产品、服务具有收集用户信息功能的,其提供者不需要向用户明示

B、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保

护制度

C、国家不允许网络运营者之间在网络安全信息收集、分析、通报和应急处

置等方面进行合作

D、为了获得更多有利数据,可以侵入他人网络、干扰他人网络正常功能、

窃取网络数据

答案:ACD

74、下列属于Linux操作系统特点的是()。

A、性能高安全性强

B、便于定制和再开发

C、与unix兼容

D、源码公开

答案:ABCD

75、按照数据发生的主体不同,数据采集范围主要包括0。

A、数据库采集

B、系统日志采集

C、网络数据采集

D、感知设备数据采集

答案:ABCD

76、Python中函数是对象,描述正确的是()

A、函数可以赋值给一个变量

B、函数可以作为元素添加到集合对象中

C、函数可以作为参数值传递给其他函数

D、函数可以当作函数的返回值

答案:ABCD

77、linux中安装软件可使用命令()。

A、setup

B、yuminstall

C>rpm

D、源代码安装

答案:BCD

78、TCP/IP在应用层的协议主要包括()

A、ICMP

B、FTP

C、HTTP

D^Telnet

答案:BCD

79、下列哪些可以匹配英文和汉字?

A、A-Za-z0-9]+$

B、A-Za-z0-9]+$

C、^A-Za-zO-9]{4.40}$

D、*A-Za-zO-9]{4.40}

答案:AC

80、在xpath中,元素节点可有()个子节点。

A、零个

B、一个

C、多个

D、都不对

答案:ABC

81、支持中文的字符编码包括

A、IS0-8859-1

B、GBK

C、UTF-8

D、UNICODE

答案:BC

82、以下哪几项是设计手机用户界面时应注意的问题

A、设计风格保持一致

B、界面设计与程序逻辑的分离

C、根据不同型号手机的屏幕解析度、尺寸和纵横比各不相同,自动调整界

面上部分控件的位置和尺寸,避免因为屏幕信息的变化而出现显示错误

D、能够合理利用较小的屏幕显示空间,构造出符合人机交互规律的用户界

答案:ABCD

83^scrapy框架包含的几个关键python包有

A、Ixml

B、twisted

C、w31ib

D、Parsel

答案:ABCD

84、以下属于常用的日志框架的是()。

A^Log4j

B、Slf4j

C、Logback

D、VUE

答案:ABC

85、ELK由_(1)_._(2)_._(3)_三个开源工具组成O。

A、ElasticSearch

Logstash

C、Kibana

D、Logflow

答案:ABC

86、CRM主要应用于哪些方面()

A、客户档案有序管理

B、合同管理

C、销售报表

D、外勤签到

E、预测销售业绩

答案:ABCDE

87、对于日志类型的数据采集,常用的采集工具有

A、filebeat

B、logstash

C、scrapy

D、beautifulSoup

答案:AB

88、以下关于scrapy框架的描述,正确的有()

A、Scrapy是一个开放源码的协作框架

B、scrapy框架是一种快速、简单、可扩展的方式从网站中提取所需要的

数据

C、Scrapy是用纯Python编写的

D、scrapy框架包含的python包中不包括Ixml

答案:ABC

89、以下属于jQuery选择器的是()

A、id选择器

B、.class选择器

C、元素选择器

D、过滤选择器

答案:ABCD

90、Python中,下面属于合法语句的包括()

A、a=b=c=l

B、a.b=b.a

C、a+=b

D、a=b=c+l

答案:ABC

91、决定局域网特性的主要技术是传输介质、拓扑结构和介质访问控制方

法,其中最重要的是传输介质

A、正确

B、错误

答案:B

92、DESC命令可以列出表结构

A、正确

B、错误

答案:A

93、视图是由一个或若干基表产生的数据集合,但视图不占存储空间。建

立视图可以保护数据安全(仅让用户查询修改可以看见的一些行列)、简化查

询操作、保护数据的独立性

A、正确

B、错误

答案:A

94、SLF4J不是一个真正的日志实现,而是一个抽象层,它允许你在后台

使用任意一个日志类库。

A、正确

B、错误

答案:A

95、避免产生错误的方法就是在符号之前加上一个斜杠,构成转义字符。

A、正确

B、错误

答案:B

96、HTTP请求报文结构包含请求行、请求头部、空行和请求数据4部分。

A、正确

B、错误

答案:A

97、子类初始化时需要首先初始化父类的属性,初始化父类的语句是

super()._init_()

A、正确

B、错误

答案:A

98、在数据库中,有三种经典的数据模型,分别是树状数据模型、网状数

据模型、关系数据模型。

A、正确

B、错误

答案:B

99、在“全局配置”模式下删除VLAN10的命令为delVLANlOo

A、正确

B、错误

答案:B

100、0SI参考模型共划分为7层,从下到上依次为:物理层、网络层、数

据链路层、传输层、表示层、会话层和应用层。

A、正确

B、错误

答案:B

101、某些情况下,单向通信也能有反方向的交互

A、正确

B、错误

答案:B

102、某些情况下,单向通信也能有反方向的交互

A、正确

B、错误

答案:B

103、静态路由是手工添加,适用于小型网络,动态路由是自动生成路径,

适用于大型网络。

A、正确

B、错误

答案:A

104、Linux操作系统的特性有:开放性、多用户、多任务、良好的用户界

面等。

A、正确

B、错误

答案:A

105、在TCP/IP网络中,每一台主机必须有一个域名。

A、正确

B、错误

答案:B

106、位置路径可以是绝对的,也可以是相对的。

A、正确

B、错误

答案:A

107、Python中,del命令只可以删除列表中的一个元素,不能删除整个列

表。

A、正确

B、错误

答案:B

108、SpringBoot集成了原有Spring框架的优秀基因,省去了Spring繁

琐的配置,使用SpringBoot很容易创建一个独立运行(运行jar,内嵌

Servlet容器)、准生产级别的基于Spring框架的项目。

A、正确

B、错误

答案:A

109、在Select语句中查询条件必须有。在Select语句中查询条件必须有

A、正确

B、错误

答案:B

110、一个网站获取的反向链接越多越好,说明被认同的范围越广,所以反

向链接追求高数量,对质量要求低

A、正确

B、错误

答案:B

111、定义listl=[1,1,1,3,4],可执行list(set(listl)),去掉重复

元素

A、正确

B、错误

答案:A

112、查看变量内存地址的Python内置函数是id()

A、正确

B、错误

答案:A

113、优先级是进程调度的重要依据,一旦确定不能改变。

A、正确

B、错误

答案:B

114、如果需要修改数据表的字段类型,其语法格式为:altertable表名

modify字段名新数据类型;

A、正确

B、错误

答案:A

115、Linux系统管理员的权限和普通用户的权限相同。

A、正确

B、错误

答案:B

116、网页中一个id可以用很多次

A、正确

B、错误

答案:B

117、常用的关系型数据库包括Oracle,MySQL,SQLServer等。

A、正确

B、错误

答案:A

118、静态路由是手工添加,适用于小型网络,动态路由是自动生成路径,

适用于大型网络。

A、正确

B、错误

答案:A

119、request响应模块,用来处理客户端发送请求的服务器响应。

A、正确

B、错误

答案:B

120、Tomcat作为独立服务器:请求来自于web浏览器

A、正确

B、错误

答案:A

121、JavaScript语言不区分大小写。

A、正确

B、错误

答案:B

122、允许空值的字段上可以定义主键约束

A、正确

B、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论