数据采集1+x初级考试试题库及答案_第1页
数据采集1+x初级考试试题库及答案_第2页
数据采集1+x初级考试试题库及答案_第3页
数据采集1+x初级考试试题库及答案_第4页
数据采集1+x初级考试试题库及答案_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+X初级考试试题库及答案

1、“Python中,设s='HappyNewYear".则$[3:8]的值为():〃

A、ppyNe

B、〃pyNe〃

C、〃ppyN〃

D、〃pyNew”

答案:B

2、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使

用用户个人信息属于()方面的行为

A、自然人的个人信息受法律保护

B、限定数据信息收集的对象与范围

C、规范数据信息收集的方式与要求

D、明确数据信息收集的政府责任

答案:B

3、random库中,用于生成随机小数的函数是()

A、random

randint

C、getrandbits

D、randrange

答案:A

4、0S(参考模型共划分为7层,从下到上依次为Oc

A、物理层、数据链路层、网络层、传输层、会话层、表示层和应用层

B、物理层、网络层、传输层、会话层、数据链路层、表示层和应用层

C、物理层、数据链路层、传输层、会话层、网络层、表示层和应用层

D、物理层、数据链路层、网络层、传输层、表示层、应用层和会话层

答案:A

5、Java应用系统中常用的日志框架不包括()

A、Log4j

Logback

C、Log4j2

Dsloguru

答案:D

6、re模块所提供的方法中,用于搜索整个字符串,返回一个列表包含全

部能匹配的子串的方法是()

A、findall

B、finditer

C、search

D、match

答案:A

7、关于异步请求的说法错误的是

A、通常用于获取页面局部的数据,但需要对页面整体进行刷新

B、能够提升用户的体验

C、通过XMLHttpRequest对象可以实现与服务器的异步交互

D、通常使用JSON格式进行数据的交互,但也有可能是其它格式

答案:A

8、将一个使用GBK编码的字节序列解码为字符串格式,应使用的方法是

“A、encode,,utf-8,/

B、decode,zutf-8x

C、encode”gbk〃

D、decode"gbk〃〃

答案:D

9、哪个符号匹配0次或者1次?

A、+

B、?

C、*

D、o

答案:B

10、在OSI的七层参考模型中,工作在第二层上的网间连接设备是()

A、交换机

B、网关

C、路由器

D、集线器

答案:A

11、使用Xpath获取一篇HTML文档中所有超链接的href属性,Xpath代

码为()O

A、/a/href

B、//a/©href

C^/a/@href

Ds//©href

答案:B

12、Android系统是基于Linux操作系统开发的手机系统,因此在进行刷

机、删除系统自带软件时需要获得管理员账户()的权限

A、administrator

B、root

C、admin

D、liveuser

答案:B

13、re模块中能够返回多个符合规则的字符串的方法是()

A、search

B、match

C、findall

D、finditer

答案:C

14、Logstash的数据输出中,标准输出是下列哪个选项

A、stdout

B、file

C、csv

D、elasticsearch

答案:A

15、哪个表达式用来选取属性?

A、/

B、@

C、.

D、..

答案:B

16、()法律中说明“国家支持网络运营者之间在网络安全信息收集、分析、

通报和应急处置等方面进行合作,提高网络运营者的安全保障能力。”

A、《中华人民共和国网络安全法》

B、《民法总则》

C、《电信和互联网用户个人信息保护规定》

D、《中华人民共和国安全法》

答案:A

17、在Linux环境下的Tomcat容器数据的采集中,启动Tomcat容器的代

码是()。

A、httpd

B、startup,sh

C、filebeat

D、logstash

答案:B

18、使用Xpath获取一篇HTML文档中所有超链接的href属性,Xpath代

码为()。

A、/a/href

13、//a/@href

C、/a/@href

D、//©href

答案:B

19、Elasticsearch是一个构建在()之上分布式可扩展的实时搜索和分

析引擎。

A、ApacheLucene

B、HDFS

C、Hadoop

D、Hbase

答案:A

20、()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要

为门户站点、搜索引擎和大型Web服务提供商采集数据。

A、深层页面爬虫

B、增量式网络爬虫

C、聚焦网络爬虫

D、通用网络爬虫

答案:D

21、中被誉为工厂函数的是()

A、$

B、function

C^ready

D、以上都不对

答案:A

22>Elasticscarch使用什么语言开发

A、C

Bs.Net

C、HTML

D、Java

答案:D

23、FTP的主要特点不包括()。

A、只提供文件传送的一些基本的服务

B、可减少或消除在不同操作系统下处理文件的不兼容性

C、使用客户服务器方式,可同时为多个客户进程提供服务

D、使用UDP的运输服务

答案:D

24、我们可以使用()命令来测试我们的正则表达式?

A、gre

B、grep

C、rep

D、都不对

答案:B

25、向数据表中插入一条记录用以下哪一项

A、CREATE

B、INSERT

C、SAVE

D、UPDATE

答案:B

26、Linux操作系统的创始人是()

A^Lunis

B、Linux

C^Linus

DsLunix

答案:C

27、关于Python赋值语句,以下选项中不合法的是()。

A、x=l

y=i

B、x=y=l

C、x=y=l

D^x.y=y.x

答案:C

28、DBMS指的是

A、数据库

B、数据库管理系

C、关系型数据库

D、数据库应用

答案:B

29、这些软件对计算机系统的资源进行控制、管理,并为用户使用和其他

程序的运行提供服务。以上描述符合()的定义?

A、操作系统

13、支撑软件

C、应用软件

D、系统软件

答案:A

30、属于应用层协议的是()

A、IP

B、UDP

C、TCP

D、FTP

答案:D

31、什么是正则表达式?

A、任何在Python中可能的正确表达式

B、程序员经常使用的编程语言表达式的集合

C、用来匹配文本字符串(如特定字符、单词或字符模式)的一种工具

D、从Python字典中快速获取数据的一种算法

答案:C

32>在SQLServer中删除触发器用()

A、ROLLBACK

B、DROP

C、DELALLOCATE

D、DELETE

答案:B

33、创建链接文件的命令为

A、linkfile

B、hard1ink

C、In

D^softlink

答案:C

34、Tomcat容器运行的界面为()。

A、php

B、asp

C^c

D、jsp

答案:D

35、日志优先级别不包括()

A、TRACE

B、INFO

C、DEBUG

D、NORMAL

答案:D

36、运算符“I”表示什么?

A、返回拥有俩元素的节点集

B、取元素节点的交集

C、返回所有拥有俩元素的节点集

D、以上都不对

答案:C

37、以下中间件,用于进行数据采集的工具为()

A、java

B、filebeat

C^tomcat

D、apache

答案:B

38、在Python中,爬虫框架很多,以下不是常见的爬虫框架的是

A、xpath框架

Scrapy框架

C^Pyspider框架

D、CoB框架

答案:A

39、选择html页面上所有class属性为“cis”的div标签,Xpath代码

为()。

A^//divclass=,cis)]

//div@class=,cls,]

C、/div@class=,cis*]

D、//div@class-cls]

答案:B

40、()是进行数据清洗的工具。

logstash

B、tomcat

C、apache

D、filebeat

答案:A

41、搜索引擎优化和网络营销的缩写分别是;)

A、SE0和UEO

B、SEM和SEO

C、UE0和SEM

D、SE0和SEM

答案:D

42、使用httpd命令查看Apache软件的安装版本信息,命令为()

A、httpd-v

B、httpd-version

C、httpd

D、http

答案:A

43、在符合标准的网页设计中,以下哪一项不属于网页前端设计的3种基

本语言之一O

A、HTML

B、CSS

C、jQucry

D、JavaScript

答案:C

44、使用scrapy的命令创建的scrapy项目中,哪个程序是用于封装爬取

数据的,类似于Java中的JavaBean对象

A、middle,py

B、init.py

C^items,py

Dsscrapy.cfg

答案:C

45、TCP/IP协议将整个通信功能划分为四个层次,处于最底层的是()

A、数据链路层

B、网络接口层

C、物理层

D、网络层

答案:B

46、以下不是修改表操作的是()

A、droptableuser

13、altertableuseraddremarkvarchar20

C、altertableusercharactersetutf8

D、altertableuserdropremark

答案:A

47、通过在路径表达式中使用()运算符,您可以选取若干个路径?

A、/

B、I

C、空白

D、.

答案:A

48、明知他人从事危害网络安全的活动的,不得为其提供广告推广、支付

结算和()等帮助。

A、技术支持

B、拓展服务

C、使用服务

D、网络推广

答案:A

49、下面代码的输出结果是()print(round10.1+0.2.1)==0.3)

A、True

B、0

C、1

D、False

答案:A

50>Tomcat的默认端口是()。

A、80

B、7070

C、8080

D、8089

答案;C

51、在re中,哪个符号匹配一次或者多次前面的字符?()

A^+

B、?

C、.

D、*

答案:A

52、下面哪个不是Python合法的标识符()

A、int32

B、40XL

C、self

D、_name_

答案:B

53、启动Apache服务命令为()。

A^Servicehttpdstart

B、Servicestart

C、ServiceHttpstart

D、Httpdstart

答案:A

54、HTTP协议是

A、应用层协议

B、会话层协议

C、网络层协议

D、传输层协议

答案:A

55、在SQL语言中提交事务的操作是通过()语句实现的

A、CREATE

B、REVOKE

C、COMMIT

D、ROLLBACK

答案:C

56、“内容为一个URL,标识用户从该URL代表的页面出发访问当前请求

的页面”以上描述所指的消息头是()o

A^Accept

B、Referer

C、User-Agent

D、Connection

答案:B

57、数据库结构的描述和定义是DBMS运行的基本依据,它们存储于(:

A、封锁表

B、数据字典

C、索引

D、日志

答案:B

58对于给定的一个LRL:http://localhost:8080/index.html,其中是

协议名称的是

A、/index,html

B、http

C、8080

D、localhost

答案:B

59、用以表示网页服务潜超文本传输协议响应状态的3位数字代码,通常

称之为HTTP状态码,其中表示请求成功的是()

A、201

B、200

C、404

D、500

答案:B

60、()不是用来查询、添加、修改和删除数据库中数据的语句

A、SELECT

B、INSERT

C、UPDATE

D、DROP

答案:D

61、关于Python类,说法正确的是()

A、类的实例方法必须创建对象前才可以调用

B、类的实例方法必须创建对象后才可以调用

C、类的类方法可以用对象和类名来调用

D、类的静态属性可以用类名和对象来调用

答案:BCD

62、网站网络推广的方向有哪些()

A、搜索引擎推广

B、电子邮件推广

C、网络广告推广

D、资源合作推广

E、快捷网址推广

答案:ABCDE

63、TCP/IP在应月层的协议主要包括()

A、ICMP

B、FTP

C、HTTP

D、Telnet

答案:ACD

64、以下是Python城市运行方式的是()

A、交互式

B、通过程序调用

C、文件式

D、图形操作

答案:AC

65、以下属于Python保留字的是()

A、pass

finally

C、yield

D、def

答案:ABCD

66、爬虫的基本流程主要包括()。

A、发起请求

B、获取响应内容

C、解析内容

D、保存数据

答案:ABCD

67、数据采集,从网页或各业务系统中来抽取数据,并进行本地存储,其

具体步骤包括()。

A、分析数据

B、采集数据

C、清洗数据

D、存储数据

答案:BCD

68、日志主要包拈哪几种()

A^系统日志

B、安全日志

C、攻击日志

D、应用程序日志

答案:ABD

69、python提供了哪些技术用于获取网页数据

A、Urllib模块

B、Requests模块

C^BeautifulSoup库

D、Ixml库

答案:BC

70、以下哪些是Python的保留字和关键字

A、class

B、import

C、Global

D、Def

答案:AB

71、数据库操作中,下列哪些列类型是数值型的数据()o

A、DOUBLE

B、INT

C、SET

D、FLOAT

答案:ABD

72、AndroidStudio由以下哪几项组成

A、IntelliJIDE

B、Eclipse

C^AndroidStudioplugin

D^Androidplugin

答案:AC

73、元素节点可有()个子?

A、零个

B、一个

C、多个

D、都不对

答案:ABC

74、正则表达式中,下列哪些可以匹配由英文字母组成的字符串0。

A、Z]+$

B、a-z]+$

C、"A-Za-z]+$

D、^A-Za-z]

答案:ABC

75、在下面的代码中,哪些语句会输出1、2、3三个数字()?

A、foriinrange3:printi

B、aList=0.1.2]foriinaList:printi+1

C.i=1whilei<3:printii+=l

D、foriinrange3:printi+1

答案:BD

76、Python中函数是对象,描述正确的是()

A、函数可以赋值给一个变量

B、函数可以作为元素添加到集合对象中

C、函数可以作为参数值传递给其他函数

D、函数可以当作函数的返回值

答案:ABCD

77、以下属于常用爬虫框架的是0。

A、Spring框架

B、Scrapy框架

C、Pyspider框架

D、CoB框架

答案:BCD

78、《民法总则》中规定自然人的个人信息受法律保护。任何组织和个人

需要获取他人个人信息的,应当()

A、依法取得并确保信息安全

B、不得非法收集、使用、加工、传输他人个人信息

C、不得非法买卖、提供或者公开他人个人信息

D、可以任意公开他人信息

答案:ABC

79、―new—和—init—的区别,说法正确的是()?

A、―new—是一个静态方法.而_init_是一个实例方法

B、—new—方法会返回一个创建的实例,而_init—什么都不返回

C^只有在—new_返回一个cis的实例时,后面的—init—才能被调用

D、当创建一个新实例时调用—new—.初始化一个实例时用init

答案:ABCD

80、有关IPV6协议说法正确的是()

A、灵活的首部格式

B、具备更大的地址空间,地址空间达到128位

C、不允许协议继续扩充

D、支持资源的预分配

答案:ABD

81、数据库操作中,下列哪些列类型是数值型的数据()o

A、DOUBLE

B、INT

C、SET

D、FLOAT

答案:ABD

82、sql语言分为以下()儿类

A、DCL

B、DDL

C、DML

D、DQL

答案:ABCD

83、requests模块向服务器发送请求的方法有()

A、get

post

C^put

D、delete

答案:ABCD

84、AndroidEmulator有如下限制

A、不支持USB连接

B、不支持蓝牙

C、不支持SD卡

D、不支持拨打或接听真实电话

答案;ABD

85、根据不同系统结构出现的时间不同分类,操作系统结构可以分为()。

A、整体式结构

B、模块化结构

C、层次结构

D、微内核结构

答案:ABCD

86、下列哪些函数属于聚合函数()

A、sum

count

C、max

D、str

答案:ABC

87、scrapy框架包含的几个关键python包有

A、Ixml

twisted

C、w31ib

D、Parsel

答案:ABCD

88、关于文件的打开方式,以下选项中描述错误的是()

A、文件只能选择二进制或文本方式打开

B、所有文件都可能以二进制方式打开

C、文本文件只能以文本方式打开

D、所有文件都可能以文本方式打开

答案:ACD

89、HTML中盒子模型的的属性包括()

A^margin

B、border

C^padding

D、text

答案:ABC

90、衡量网络性能的主要指标包括()

A、路由

B、转发

C、带宽

D、延迟

答案:CD

91、shell中while结构化语句必须以elihw作为语句的结束。

A、正确

B、错误

答案:B

92、在Select语句中查询条件必须有。在Select语句中查询条件必须有

A、正确

B、错误

答案:B

93、xpath中,元素的索引是从0开始的

A、正确

B、错误

答案:B

94、能改变用户工作目录到根目录的命令是:cd.

A、正确

B、错误

答案:B

95、基于交换机的端口划分VLAN是静态VLAN。

A、正确

B、错误

答案:A

96、type()函数是可以查看变量类型的Python内置函数

A、正确

B、错误

答案:A

97、关键词需要考虑密度,不能堆积

A、正确

B、错误

答案:A

98、Apache默认端口是8080,通过修改httpd.conf可以修改其端口

A、正确

B、错误

答案:B

99、urlllb.request,urlopcn。主要用来返回请求对缘.,返Fl请求对象包

含的方法和属性。

A、正确

B、错误

答案:A

100、CRM是指利月计算机网络实现的以“资源”为中心的系统。

A、正确

B、错误

答案:B

10k创建表用createtable关键字

A、正确

B、错误

答案:A

102、response请求模块,用来处理客户端发送到服务器端的请求。

A、正确

B、错误

答案:B

103、数据采集以手动方式为主,避免使用自动化的手段。

A、正确

B、错误

答案:B

104>HTML中通过<scriptX/script》标签引入JavaScript程序

A、正确

B、错误

答案:A

105、根据类来创建对象称作实例化

A、正确

B、错误

答案:A

106、在传输层有两个性质不同的协议:TCP和UDP。

A、正确

B、错误

答案:A

107、响应状态码500表示的含义是“对被请求页面的访问被禁止。”

A、正确

B、错误

答案:B

108、Python安装扩展库常用的工具是install工具

A、正确

B、错误

答案:B

109、Scrapy框架的运行流程中,DownLoader组件一般情况下不起作用

A、正确

B、错误

答案:B

110、定义listl=[1,2,3,4,5],可执行tuple(listl),将其强制转换为

元组

A、正确

B、错误

答案:A

111、设备控制器是计算机和中央处理器(CPU)之间的接口,它会接收

CPU的指令,然后去实现对设备的控制

A、正确

B、错误

答案:A

112、JavaScript语言不区分大小写。

A、正确

B、错误

答案:B

113、在传输层有两个性质不同的协议:TCP和UDP。

A、正确

B、错误

答案:A

114、jQuery中,hide。可以隐臧元素,show。可以显示隐藏的元素

A、正确

B、错误

答案:A

115、在数据库的概念设计中,最常用的数据模型是实体联系模型

A、正确

B、错误

答案;A

116、进程具备多种特性,如:动态性、顺序性、独立性和同步性

A、正确

B、错误

答案:B

117、ADSL为用户提供的上行和下行带宽是对称的

A、正确

B、错误

答案:B

118、数据库操作中,删除表用droptable语句。

A、正确

B、错误

答案:A

119、搜索引擎可以分为关键词检索型和目录浏览型两种

A、正确

B、错误

答案:A

120、SQL语言中,删除某表中某个索引的命令是dropindex表名on索

引名;

A、正确

B、错误

答案:B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论