数据采集1+x初级试题与参考答案_第1页
数据采集1+x初级试题与参考答案_第2页
数据采集1+x初级试题与参考答案_第3页
数据采集1+x初级试题与参考答案_第4页
数据采集1+x初级试题与参考答案_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集1+x初级试题与参考答案一、单选题(共41题,每题1分,共41分)1.()不是用来查询、添加、修改和删除数据库中数据的语句A、SELECTB、INSERTC、UPDATED、DROP正确答案:D2.关于Python语言的注释,以下选项中描述错误的是A、Python语言的单行注释以单引号’开头B、Python语言的多行注释以’’'(三个单引号)开头和结尾C、Python语言的单行注释以#开头D、Python语言有两种注释方式:单行注释和多行注释正确答案:A3.SQL语句中的条件用以下哪一项来表达()A、IFB、THENC、WHILED、WHERE正确答案:D4.Python源程序执行的方式()A、直接执行B、解析执行C、边编译边执行D、编译执行正确答案:B5.分析以下SQL命令:SELECTpriceFROMinventoryWHEREpriceBETWEEN1AND50AND(priceIN(55.30.95);命令执行后的最可能的输出结果是A、55B、30C、95D、51正确答案:B6.以下选项中不是Python对文件的写操作方法的是()A、writetextB、writeC、write和seekD、writelines正确答案:A7.在xpath中,哪个轴可以选取当前节点的所有属性?()A、childB、attributeC、descendantD、attr正确答案:B8.以下中间件,用于进行数据采集的工具为()A、apacheB、filebeatC、tomcatD、java正确答案:B9.下列运算符中表示任意字符的是A、*B、%C、_D、LIKE正确答案:B10.以下数据中,非结构化数据不包括()A、日志文件B、音频C、图片D、图像正确答案:A11.外链和反链的区别,说法正确的是()A、两者含义相同,只是不同名字而已B、外链对SEO有帮助,反链没有任何帮助C、外链是对于全站而言,反链只是指首页的链接D、外链是指外部的网站指向本网站,反链则是指向本页面的内部或外部链接正确答案:B12.搜索引擎优化和网络营销的缩写分别是()A、SEM和SEOB、SEO和SEMC、UEO和SEMD、SEO和UEO正确答案:B13.对于给定的一个URL:http://localhost:8080/index.html,其中是协议名称的是A、httpB、/index.htmlC、8080D、localhost正确答案:A14.网站SEO优化时,网站进行友情链接多少个为适中()。A、1~5个B、20~30个C、30~40个D、40个以上正确答案:B15.Java系统使用的日志框架中,不包含哪个()A、Log4jB、Slf4jC、LogbackD、Log4C正确答案:D16.半结构数据,是介于结构化数据与非结构化之间的数据,下面不属于半结构化数据的是()A、HTMLB、XMLC、MPEG-1D、JSON正确答案:C17."给出如下代码,下述代码的输出结果是()s="Alice"print(s[::–1])"A、ALICEB、ecilAC、AlicD、Alice正确答案:B18.在Python中,关于全局变量和局部变量,以下选项中描述不正确的是()A、全局变量不能和局部变量重名B、全局变量在程序执行的全过程有效C、全局变量一般没有缩进D、一个程序中的变量包含两类:全局变量和局部变量正确答案:A19.()是通过爬虫程序监测某网站数据更新的情况,以便可以爬取到该网站更新的新数据,对于未发生内容变化的网页,则不会爬取。A、通用网络爬虫B、聚焦网络爬虫C、深层页面爬虫D、増量式网络爬虫正确答案:D20.在网络中,属于应用层协议的是()A、IPB、UDPC、TCPD、FTP正确答案:D21.HTML中能够定义表单提交位置的属性是A、titleB、nameC、methodD、action正确答案:D22.每一个表只能拥有一个()索引。A、主B、唯一C、候选D、普通正确答案:A23.Linux操作系统的创始人是()A、LunixB、LunisC、LinusD、Linux正确答案:C24.“内容为一个URL,标识用户从该URL代表的页面出发访问当前请求的页面”以上描述所指的消息头是()。A、AcceptB、RefererC、User-AgentD、Connection正确答案:B25.Hub是一种网络设备,它的中文名称叫A、调制解调器B、集线器C、网桥D、路由器正确答案:B26.以下选项中符合Python语言变量命名规则的是A、*iB、3_1C、AI!D、Templist正确答案:D27.logstash默认端口号为()。A、8080B、5044C、8089D、7070正确答案:B28.Tomcat容器数据采集中检查JDK的版本命令为()A、java-versionB、javacC、javaversionD、checkversion正确答案:A29.下列表达式的值为True的是()A、(3.2)<("a"."b")B、3>2>2C、5+4j>2-3jD、"abc">"xyz"正确答案:A30.在OSI的七层参考模型中,工作在第二层上的网间连接设备是()A、交换机B、网关C、路由器D、集线器正确答案:A31.以下哪项用来分组A、ORDERBYB、ORDEREDBYC、GROUPBYD、GROUPEDBY正确答案:D32.层次型、网状型和关系型数据库划分原则是()A、记录长度B、联系的复杂程度C、数据之间的联系D、文件的大小正确答案:C33.在Internet上浏览时,浏览器和WWW服务器之间传输网页使用的协议是:A、WWWB、telnetC、HTTPD、ARP正确答案:C34.Apache的主配置文件路径为()A、httpd/conf/httpd.confB、/etc/httpd/conf/httpd.confC、conf/httpd.confD、conf正确答案:B35.关于数据类型,说法不正确的是()A、结构化数据是指具有固定格式的数据B、非结构化数据的结构不规则或不完整,没有预定义的数据模型C、半结构化数据介于结构化数据和非结构化数据之间D、以上说法都不正确正确答案:D36.Python语言中用来定义函数的关键字是A、returnB、defineC、defD、function正确答案:C37.将网络认为局域网、城域网、广域网三种,是按照哪种方式进行分类的A、按拓扑结构分B、按使用范围分C、按传输技术分D、按地理范围分正确答案:D38.HTML中用于标记表单的是标签是()A、<frame>B、<form>C、<tab>D、<table>正确答案:B39.在MySQL中,创建完数据表之后,如果需要查看该表是否已经成功创建,可以在指定的数据库中使用()命令查看表。A、showtables;B、updatetable;C、showtable;D、selecttable;正确答案:A40.哪个轴可以选取当前节点的所有属性?A、attributeB、descendantC、child正确答案:A41.Elasticsearch是一个构建在()之上分布式可扩展的实时搜索和分析引擎。A、ApacheLuceneB、HDFSC、HadoopD、Hbase正确答案:A二、多选题(共21题,每题1分,共21分)1.以下属于表单<form>常用属性的是()A、methodB、actionC、sizeD、name正确答案:ABD2.WWW的主要特点是A、使用超文本技术B、使用HTML语言C、采用C/S模式D、不够方便灵活,功能强大正确答案:ABC3.Scrapy架构中,中间件包括()A、DownloaderMiddlewaresB、SchedulerMiddlewaresC、SpiderMiddlewaresD、PipelineMiddlewares正确答案:AC4.业务系统中产生的数据会有两种保存方式:_(1)_和_(2)_。A、数据库数据B、图像数据C、文本快照D、日志数据正确答案:AD5.以下,属于Python语言应用领域的包括()A、自动化运维B、爬虫开发C、科学计算D、Web开发正确答案:ABCD6.下面哪个不是Python合法的标识符()A、40XLB、__name__C、int32D、3self正确答案:AD7.关于insert语句下列说法正确的有()A、insertinto表名values(字段名1对应的值,字段名2对应值);B、insertinto表名values(字段名1对应的值);C、insertinto表名(字段名1)value(字段名1对应的值);D、insertinto表名(字段名1,字段名2)values(字段名1对应的值,字段名2对应值);正确答案:AD8.requests模块向服务器发送请求的方法有()A、deleteB、postC、getD、put正确答案:ABCD9.sql语言分为以下()几类A、DCLB、DDLC、DMLD、DQL正确答案:ABCD10.正则表达式中的“?”表示的含义是A、匹配前面的子表达式零次或一次。B、匹配前面的子表达式一次或多次。C、当该字符紧跟在任何一个其他限制符(*.+.?.{n}.{n.}.{n.m})后面时,匹配模式是非贪婪的。D、当该字符紧跟在任何一个其他限制符(*.+.?.{n}.{n.}.{n.m})后面时,匹配模式是贪婪的。正确答案:AC11.《中华人民共和国网络安全法》中规定()A、任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动B、可以提供危害网络安全活动的程序、工具C、明知他人从事危害网络安全的活动的,不得为其提供技术支持、广告推广、支付结算等帮助D、不得提供专门用于从事侵入网络、干扰网络正常功能及防护措施、窃取网络数据等危害网络安全活动的程序、工具正确答案:ACD12.在操作系统中,进程是指一个程序以及其数据在处理器上执行时发生的所有活动,是系统资源分配和调度的一个独立单位。以下属于进程特征的是()。A、动态性B、独立性C、并发性D、异步性正确答案:ABCD13.下列哪些是DML语句是()A、INSERTB、ALTERC、UPDATED、DELETE正确答案:ACD14.数据采集的主要特点包括()。A、以自动化采集手段为主,尽量不用人工方式B、采集数据要明确采集内容,有针对性的采集局部精确数据C、摆脱对数据进行采样的方式,采集内容以全量采集为主D、除采集基本数据外,采集方式和内容要更多样化、丰富化,正确答案:ACD15.爬虫的基本流程主要包括()。A、发起请求B、解析内容C、获取响应内容D、保存数据正确答案:ABCD16.根据《中华人民共和国网络安全法》,下列说法正确的是()A、网络运营者在一定条件下可以泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息B、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正C、网络运营者应当采取技术措施和其他必要措施,确保其收集的个人信息安全,防止信息泄露、毁损、丢失D、第四十条网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度正确答案:BCD17.在HTML中,<form>标签的属性有()。A、name属性定义表单的名称B、method属性定义表单结果从浏览器传送到服务器的方法C、action属性用来定义表单处理程序(ASP,CGI等程序)的位置(相对地址或绝对地址)D、enctype属性设置表单资料的编码方式正确答案:ABCD18.完整的日志具有哪些作用()A、信息查找B、数据分析C、业务拓展D、服务诊断正确答案:ABD19.requests库发送请求的方法包括()等。A、GETB、POSTC、DELETED、PUT正确答案:ABCD20.根据《中华人民共和国网络安全法》,下列说法不正确的是()A、网络产品、服务具有收集用户信息功能的,其提供者不需要向用户明示B、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度C、国家不允许网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作D、为了获得更多有利数据,可以侵入他人网络、干扰他人网络正常功能、窃取网络数据正确答案:ACD21.vim文本编辑器有哪些模式()A、引用模式B、末行模式C、命令模式D、输入模式正确答案:BCD三、判断题(共37题,每题1分,共37分)1.数据报是面向无连接服务,而虚电路作为面向连接的服务A、正确B、错误正确答案:A2.vi命令模式中a是从光标所在位置后面开始新增内容。A、正确B、错误正确答案:A3.数据加密DES的保密性仅取决于对密钥的保密,而算法是公开的。A、正确B、错误正确答案:A4.Tomcat是Apache软件基金会推出的一个收费的Servlet容器A、正确B、错误正确答案:B5.不经用户同意,电信业务经营者、互联网信息服务提供者可以收集、使用用户个人信息A、正确B、错误正确答案:B6.HTTP的head消息“referer”的作用是告知服务器是从哪个资源转到当前资源上来的。A、正确B、错误正确答案:A7.Python标准库中的re模块提供正则表达式的全部功能,可以直接引入。A、正确B、错误正确答案:A8.Apache默认端口是8080,通过修改httpd.conf可以修改其端口A、正确B、错误正确答案:B9.Linux中终止进程的命令可以用kill。A、正确B、错误正确答案:A10.HTTP请求报文结构包含请求行、请求头部、空行和请求数据4部分。A、正确B、错误正确答案:A11.Linux下实时查看日志可运行命令:tail-fcatalina.outA、正确B、错误正确答案:A12.关键词需要考虑密度,不能堆积A、正确B、错误正确答案:A13.在re模块中,避免产生错误的方法就是在符号之前加上一个斜杠,构成转义字符。A、正确B、错误正确答案:B14.正则表达式只能处理字符串数据A、正确B、错误正确答案:A15.查看数据表的结构信息,可以在指定的数据库中使用“describe表名;”语句,通常简写为“desc表名;”A、正确B、错误正确答案:A16.xpath中,使用/表示从头开始提取A、正确B、错误正确答案:A17.创建数据库使用createdatabasemytest语句A、正确B、错误正确答案:A18.网络备份和负载均衡在冗余设计的物理结构上完全一致,但是完成的功能完全不同。A、正确B、错误正确答案:A19.在数据库中,有三种经典的数据模型,分别是树状数据模型、网状数据模型、关系数据模型。A、正确B、错误正确答案:B20.操作系统中,绝对路径名都是从根目录开始。A、正确B、错误正确答案:A21.假设列表对象aList的值为[3,4,5,6,7,9,11,13,15,17],那么切片aList[3:7]得到的值是[6,7,9,11]A、正确B、错误正确答案:A22.国家网信部门应当统筹协调有关部门加强网络安全信息收集、分析和通报工作,按照规定统一发布网络安全监测预警信息A、正确B、错误正确答案:A23.重写父类的方法,可在子类中定义一个这样的方法,即它与要重写

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论