版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据采集1+x中级习题(附参考答案解析)一、单选题(共30题,每题1分,共30分)1.HBase的特点不包括()。A、容量巨大B、列存储C、稀疏性D、支持join操作正确答案:D答案解析:HBase不支持join操作。它主要具有容量巨大、列存储、稀疏性等特点。HBase是一个分布式的、面向列的开源数据库,适合于存储和处理大规模结构化数据。它在设计上侧重于高并发读写、可扩展性和对稀疏数据的高效存储,但不具备传统关系型数据库中的join操作能力。2.明确数据信息收集主体的资格与责任,下列哪些()中提及过A、《中华人民共和国网络安全法》《电信和互联网用户个人信息保护规定》《电信和互联网用户个人信息保护规定》共3个B、《中华人民共和国网络安全法》C、《电信和互联网用户个人信息保护规定》D、《民法总则》正确答案:A答案解析:《中华人民共和国网络安全法》《电信和互联网用户个人信息保护规定》中均提及过明确数据信息收集主体的资格与责任,所以答案选A。《中华人民共和国网络安全法》规定了网络运营者收集、使用个人信息的规则等内容,明确了其相关责任;《电信和互联网用户个人信息保护规定》也对电信和互联网用户个人信息收集主体的资格与责任有具体规定。3.Java应用系统中常用的日志框架不包括()A、Log4jB、LogbackC、Log4j2D、loguru正确答案:D答案解析:在Java应用系统中,常用的日志框架有Log4j、Logback、Log4j2。而loguru是Python的一个日志库,不是Java常用的日志框架。4.数据采集相关法律中规范数据信息收集的方式与要求是哪个法律()。A、《中华人民共和国网络法》B、《电信和互联网用户个人信息保护规定》C、《中华人民共和国安全法》D、《民法总则》正确答案:D5.以下不属于input标签定义按钮的是()A、<inputname=“控件名”type=“button"/>B、<inputname=“控件名”type=“submit/>C、<inputname=“控件名”type=“reset"/>D、<inputname=“控件名”type=“radio"/>正确答案:D答案解析:选项D中type为“radio”表示单选框,不是按钮。选项A中type为“button”定义的是普通按钮;选项B中type为“submit”定义的是提交按钮;选项C中type为“reset”定义的是重置按钮。6.jQuery中,定义array的语法错误的是()A、newArray(size);B、newArray(ele0.ele1.....ele);C、newArray();D、newArray[];正确答案:D答案解析:在JavaScript和jQuery中,创建数组的正确语法是使用`newArray()`,后面可以跟参数表示数组的初始元素或数组长度。选项A表示创建一个指定大小的数组;选项B表示创建一个包含指定元素的数组;选项C表示创建一个空数组。而选项D的语法是错误的,不应该写成`newArray[]`这种形式。7.关键词分布中对SEO有危害的是A、标题B、锚节点C、隐藏文字D、左导航正确答案:C答案解析:隐藏文字是对SEO有危害的关键词分布形式。搜索引擎的目标是为用户提供有价值、真实且相关的内容,如果网站使用隐藏文字来堆积关键词,这属于作弊行为。搜索引擎一旦发现,会对网站进行降权等处罚,严重影响网站在搜索结果中的排名和流量,损害网站的SEO效果。而标题、锚节点、左导航等正常合理地分布关键词有助于提升网站的相关性和可访问性,对SEO是有积极作用的。8.Tomcat的默认端口是()。A、80B、7070C、8080D、8089正确答案:C答案解析:Tomcat的默认端口是8080。当我们安装好Tomcat后,在启动相关服务时,如果没有特别指定端口,默认使用的就是8080端口来进行网络通信等操作。9.构成TCP/IP模型的四个层次是A、网络接口层、数据链路层、传输层、应用层B、数据链路层、传输层、会话层、应用层C、网络接口层、网际层、传输层、应用层D、网络接口层、网络层、会话层、应用层正确答案:C答案解析:TCP/IP模型的四个层次分别是网络接口层、网际层、传输层、应用层。网络接口层负责接收和发送物理帧;网际层负责将数据包从源主机传输到目的主机;传输层提供端到端的可靠通信;应用层为用户提供应用程序接口。10.当字符串用双引号(“”)括起来时,SHELL将()A、解释引号内的特殊字符B、结束进程C、不解释引号内的特殊字符D、执行引号内的命令正确答案:A11.检查网络联通性的命令是()A、ipconfigB、pingC、routeD、telnet正确答案:B12.哪个匹配带1-2位小数的正数或负数?A、^(-)?d+(.d[1.2])?$B、^(-)?d+(.d[1.2])$C、^(-)?d+(.d{1.2})?D、^(-)?d+(.d{1.2})?$正确答案:D答案解析:正则表达式“^(-)?d+(.d{1.2})?$”,“^”表示字符串开头,“(-)?”表示可选的负号,“d+”表示一位或多位数字,“(.d{1.2})?”表示可选的小数点后1到2位数字,“$”表示字符串结尾,整体可以匹配带1-2位小数的正数或负数。选项A中“(.d[1.2])?”错误,不应该是中括号;选项B没有问号,不能匹配可选情况;选项C“(.d{1.2})?”位置不对,应该紧跟在数字部分后用于表示小数部分。13.如果要退出路由器或者交换机当前的模式,输入的命令是()A、exitB、noconfig-modeC、conftD、over正确答案:A答案解析:要退出路由器或者交换机当前的模式,通常使用exit命令。noconfig-mode不是标准的退出当前模式的命令;conft是进入全局配置模式的命令;over不是退出模式的正确命令。14.盒子模型具备的属性有几个()A、4B、3C、2D、1正确答案:A答案解析:盒子模型具备的属性有内容区(content)、内边距(padding)、边框(border)、外边距(margin)等,超过4个,所以选A。15.国家网信办持续重拳出击,依法查处网上违法违规行为,集中清理淫秽色情、虚假欺诈等违法违规信息,对违法违规公众账号和误导公众、影响恶劣的网络名人账号予以关闭或暂停。对此,下列说法正确的是()A、网络空间自由,不应关闭B、个人兴趣爱好,不应处罚C、信息只在朋友圈中传播,属于个人行为隐私D、网络空间不是法外之地,不得传播违法信息正确答案:D答案解析:国家网信办依法查处网上违法违规行为,清理违法违规信息,关闭或暂停违法违规账号,这充分说明网络空间不是法外之地,在网络上传播违法信息是不被允许的,必须遵守法律法规,D选项正确。网络空间自由是相对的,要在法律和道德允许的范围内,违法违规行为就应受到处罚,A、B选项错误;即使信息在朋友圈传播,若涉及违法违规也不是个人行为隐私,也要承担法律责任,C选项错误。网络空间是社会公共空间的延伸,每个人都有维护健康、有序网络环境的责任和义务,不能因各种借口而传播违法信息。16.Linux中,完成定期备份时,可以使用什么命令A、chmodB、chownC、scheduleD、crontab正确答案:D答案解析:在Linux中,`crontab`命令用于设置系统的定时任务。通过编辑`crontab`文件,可以指定在特定的时间执行特定的命令,从而实现定期备份等任务。而`chmod`用于改变文件或目录的权限,`chown`用于改变文件或目录的所有者,并没有`schedule`这样用于定期任务设置的标准命令。17.多个进程的实体能存在于同一内存中,在一段时间内都得到运行。这种性质称作进程的()A、动态性B、并发性C、调度性D、异步性正确答案:B答案解析:进程的并发性是指多个进程实体能存在于同一内存中,在一段时间内都得到运行。动态性是指进程具有生命周期,从创建到消亡;调度性是指操作系统对进程进行调度以决定哪个进程何时运行;异步性是指进程的执行顺序和执行时间是不确定的。所以这里描述的性质是并发性,答案选B。18.下面哪个HTTP状态码是搜索引擎返回的抓取正常的状态码A、500B、301C、200D、404正确答案:C答案解析:在HTTP状态码中,200表示成功,搜索引擎抓取正常时返回的状态码通常是200,所以大于200表示抓取正常,选项C正确。500系列状态码表示服务器内部错误;301表示永久重定向;404表示请求的资源不存在,这些都不符合抓取正常的状态。19.正则表达式中,下列()表达式是求整数?A、^-?d+$B、^-?d+C、^-?d$D、^-d+$正确答案:A答案解析:^表示字符串开始,-?表示可出现一个负号或者不出现,d+表示一个或多个数字,$表示字符串结束,所以^-?d+$能匹配整数。选项B少了结束符,选项C只能匹配一位数字,选项D少了负号的可选性。20.启动Android系统的内置的Web浏览器,需要在Intent中指定的ACTION为()A、ACTION_PICKB、ACTION_SEARCHC、ACTION_WEBD、ACTION_VIEW正确答案:D答案解析:启动Android系统的内置Web浏览器,需要使用Intent的ACTION_VIEW动作,并在数据部分指定要加载的网页URL。例如:Intentintent=newIntent(Intent.ACTION_VIEW,Uri.parse(""));然后使用startActivity(intent)方法启动浏览器并加载指定的网页。ACTION_PICK用于从数据中选择一项,ACTION_SEARCH用于执行搜索操作,而Android系统中并没有ACTION_WEB这个标准的Intent动作。21.关于urlopen方法,描述错误的是A、可以使用Request对象作为参数B、默认发送GET请求C、可以向服务器发送参数数据D、可以发送HTTPhead消息正确答案:D22.下列语句中查询姓李的学生的语句是()。A、select*from表名where姓名=‘李’B、select*from表名where姓名like‘李%’C、select*from表名where姓名like‘%李%’D、select*from表名where姓名like‘李’正确答案:B答案解析:在SQL中,要查询姓李的学生,使用like关键字进行模糊匹配,‘李%’表示以李开头的任意字符串,所以select*from表名where姓名like‘李%’可以查询出姓李的学生。选项A中姓名=‘李’只能查询出姓名恰好是“李”的记录,不能查询姓李的所有记录;选项C中‘%李%’表示包含李的任意字符串,会查询出姓名中包含李的所有记录,不只是姓李的;选项D中‘李’没有通配符,无法进行模糊匹配,不能达到查询姓李学生的目的。23.若系统在运行过程中,由于某种硬件故障,使存储在外存上的数据部分损失或全部损失,这种情况称为A、介质故障B、系统故障C、运行故障D、事务故障正确答案:A答案解析:介质故障是指系统在运行过程中,由于某种硬件故障,使存储在外存上的数据部分损失或全部损失。事务故障是事务内部的故障。系统故障是系统在运行过程中,由于某种原因,造成系统停止运行,致使事务在执行过程中以非正常方式终止。运行故障是一个比较宽泛的概念,这里准确说的是介质故障导致的数据损失情况。24.下列哪项功能可在交换网络中通过合并多个交换机端口来支持更高的吞吐量?A、网络直径B、链路聚合C、收敛D、冗余链路正确答案:B答案解析:链路聚合是一种将多个物理链路捆绑成一个逻辑链路的技术,通过链路聚合可以合并多个交换机端口,从而增加链路的带宽,支持更高的吞吐量。收敛主要是指网络拓扑结构从初始状态到稳定状态的变化过程;冗余链路是为了提高网络可靠性,当一条链路出现故障时能切换到备用链路;网络直径指的是网络中任意两个节点之间的最大跳数。所以能实现通过合并多个交换机端口支持更高吞吐量功能的是链路聚合。25.关于JavaScript基本规范,描述不正确是是()A、switch必须带有default分支B、函数应该有返回值C、命名要有意义,使用驼峰命名法D、使用=或!=来比较两个对象,返回true/false正确答案:D答案解析:选项D描述不正确。在JavaScript中,不能直接使用`==`或`!=`来比较两个对象是否相等,这通常不是用来判断对象相等性的可靠方式。应该使用`Object.is()`方法或通过比较对象的属性值来确定对象是否相等。选项A中,`switch`语句不一定必须带有`default`分支;选项B中,函数不一定要有返回值;选项C中,使用驼峰命名法来命名是一种良好的规范。26.求负整数的表达式是哪个?A、^d+$B、^d+$?C、^-?d+$D、d+$正确答案:A27.以下关于网络层次与主要设备对应关系的描述中,配对正确的是()A、网络层——集线器B、数据链路层——网桥C、传输层——路由器D、会话层——防火墙正确答案:B答案解析:网络层的主要设备是路由器,集线器是物理层设备,所以A选项错误;数据链路层的主要设备有网桥、交换机等,B选项正确;传输层主要负责端到端的可靠数据传输,路由器工作在网络层,C选项错误;会话层主要负责建立、维护和管理会话,防火墙主要用于网络安全防护,工作在网络层等,D选项错误。28.匹配长度为3-20的所有字符?A、^.{3,20}$B、{3,20}$C、^.{3.20}D、^.{320}$正确答案:A29.获取html页面中的所有id属性为"content的div标签,xpath代码为"A、/div[@id='content']B、//div[@id='content']C、/div[id='content']D、//div[id='content']正确答案:B答案解析:在XPath中,使用`//`表示从文档的任意位置开始查找,`>`表示直接子元素关系,`div[@id='content']`表示查找id属性为`content`的`div`标签,所以`//div[@id='content']`能获取html页面中的所有id属性为`content`的`div`标签。选项A中`>`表示直接子元素关系,不能获取所有符合条件的`div`;选项C中`id='content'`没有用`@`符号表示属性;选项D中`id='content'`同样没有用`@`符号表示属性,所以A、C、D选项都不正确。30.()是一种专业的网络文件存储设备,它基于LAN.按照TCP/IP协议进行通信,以文件的I/O方式进行数据传输。A、NASB、NAC、NASSD、NS正确答案:A答案解析:NAS是一种专业的网络文件存储设备,它基于LAN,按照TCP/IP协议进行通信,以文件的I/O方式进行数据传输。而NA一般指网络访问、网络地址等,与题意不符;NASS这种表述不准确;NS通常指的是名称服务器等,也不符合该描述。所以正确答案是A。二、多选题(共20题,每题1分,共20分)1.下列哪些是《电信和互联网用户个人信息保护规定》中规定的直接面向用户的服务性工作()A、互联网信息服务提供者B、互联网信息服务提供者委托他人代理技术服务C、电信业务经营者D、互联网信息服务提供者委托他人代理市场销售正确答案:BCD2.Linux系统中,下列属于进程类命令的是()A、pstreeB、killC、topD、nice正确答案:ABCD答案解析:pstree用于展示进程树状结构,属于进程类命令;kill用于终止进程,是进程类命令;top用于实时显示系统中各个进程的资源占用情况,属于进程类命令;nice用于调整进程的优先级,也属于进程类命令。3.定义类如下:classhello():defshowInfo(sef):print(self.x)下面描述正确的是()A、在pycharm工具中会出现语法错误,说self没有定义B、该类可以实例化,并且能正常通过对象调用showInfo()C、该类不可以实例化D、该类可以实例化正确答案:AC4.JSON模块中,能够将Python列表或字典转换为JSON字符串或JSON格式的文件的方法是A、dumpsB、loadC、loadsD、dump正确答案:AD5.C/S是一种()。A、游戏B、网络模型C、主从式网络模型D、客户机服务器模型正确答案:BCD6.按照数据发生的主体不同,数据采集范围主要包括()。A、系统日志采集B、感知设备数据采集C、网络数据采集D、数据库采集正确答案:ABCD答案解析:数据库采集是从已有的数据库中获取数据;系统日志采集能够收集系统运行过程中产生的各类日志信息;网络数据采集可抓取网络上的各种数据;感知设备数据采集则是采集来自传感器等感知设备的数据,这四种采集方式都属于按照数据发生主体不同的数据采集范围。7.在Windows系统中申请、查看、释放IP地址分别使用什么命令()。A、ipconfig/refreeB、ipconfig/releaseC、ipconfig/renewD、ipconfig/all正确答案:BCD8.Linux系统的特点包括()。A、高效安全稳定B、支持多种硬件平台C、强大的网络功能D、支持多任务、多用户正确答案:ABCD答案解析:Linux系统具有高效、安全、稳定的特点,能够长时间稳定运行且性能表现出色。它支持多种硬件平台,可在不同架构的计算机上良好运行。具备强大的网络功能,能方便地搭建各种网络服务。同时支持多任务、多用户,多个用户可以同时使用系统,并且能并行处理多个任务。9.下列属于数据操纵语言中典型的语句有()A、INSERTB、SELECTC、UPDATED、DELETE正确答案:ABCD答案解析:INSERT用于向表中插入数据;SELECT用于从表中查询数据;UPDATE用于更新表中的数据;DELETE用于删除表中的数据,它们都是数据操纵语言(DML)中典型的语句。10.XPath用于在XML文档中通过()和()进行导航?A、属性值B、属性C、节点D、元素正确答案:BD11.以下属于HTTP请求消息头中的内容的是A、User-AgentB、RefererC、AcceptD、Accept-Encoding正确答案:ABCD答案解析:1.**User-Agent**:它包含了客户端的浏览器类型、版本、操作系统等信息,用于服务器识别客户端环境。2.**Referer**:记录了当前请求的来源页面URL,有助于服务器了解请求的上下文。3.**Accept**:用于告知服务器客户端能够接受的资源类型,比如文本、图像、音频等。4.**Accept-Encoding**:告诉服务器客户端支持的编码方式,例如gzip、deflate等,以便服务器进行相应的压缩传输。12./etc/passwd文件中包含的信息有()。A、uidB、gidC、用户主目录D、shell正确答案:ABCD答案解析:/etc/passwd文件中每行记录包含了用户的基本信息,依次为用户名、用户ID(uid)、组ID(gid)、用户描述信息、用户主目录、用户登录后使用的shell。所以包含了选项中的所有信息。13.关于形参和实参的描述,以下选项中错误的是()A、程序在调用时,将形参复制给函数的实参B、参数列表中给出要传入函数内部的参数,这类参数称为形式参数,简称形参C、函数定义中参数列表里面的参数是实际参数,简称实参D、函数调用时,实参默认采用按照位置顺序的方式传递给函数,Python也提供了按照形参名称输入实参的方式正确答案:ABC14.下面对count(),index().find()方法描述错误的是()A、count()方法用于统计字符串里某个字符出现的次数B、find()方法检测字符串中是否包含子字符串str如果包含子字符串返回开始的索引值,否则会报一个异常C、index()方法检测字符串中是否包含子字符串str,如果str不在返回-1D、以上都错误正确答案:BC15.正则表达式中,下列哪些可以匹配由26个英文字母组成的字符串()。A、^[A-Z]+$B、^[a-z]+$C、^[A-Za-z]+$D、^[A-Za-z]正确答案:ABC16.爬取网页数据时,以下属于HTTP请求消息头中的内容的是()A、User-AgentB、RefererC、AcceptD、Accept-Encoding正确答案:ABCD答案解析:1.**User-Agent**:它是一个关于浏览器、操作系统、设备等信息的标识。服务器可以通过它了解客户端的环境,从而返回适合该客户端显示的内容。例如,不同版本的浏览器,其User-Agent是不同的。2.**Referer**:记录了当前请求的来源页面URL。服务器可以根据这个信息进行一些统计分析,比如了解用户是从哪个页面跳转过来的,对于追踪用户行为路径很有帮助。3.**Accept**:用于告诉服务器客户端能够接收的内容类型。比如可以接收HTML、JSON、XML等不同格式的数据,服务器会根据客户端的这一需求返回相应格式的数据。4.**Accept-Encoding**:告知服务器客户端支持的编码方式,例如gzip、defl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025 网络基础之无线传感器网络与环境监测大数据网络课件
- 统编版语文四年级下册第一单元 质量提优卷(含答案)
- 国际贸易中心项目可行性研究报告
- 猩红热的诊断和抗生素治疗
- 2026年及未来5年市场数据中国共享办公行业市场深度分析及投资策略研究报告
- 2025 高中信息技术数据与计算之算法的常微分方程数值解法课件
- 化学检验高级工题库试卷及答案
- 永辉超市之超级合伙人课件
- 2026年数据治理合同范本编制规范
- 2026年幼儿园全日托半日托计时托多元化招托渠道拓展
- 2026年医院年度经济运营分析报告
- 2026广东中山市神湾镇神湾社区居民委员会招聘1人考试参考题库及答案解析
- 2026西藏林芝巴宜区人民检察院司法警务辅助人员招聘3人笔试备考题库及答案解析
- 档案数字化项目立项申请书
- (正式版)DB51∕T 2787-2021 《研学旅行实践活动设计规范》
- 2026年温州永嘉县国有企业面向社会公开招聘工作人员12人笔试参考题库及答案解析
- 2026年六安职业技术学院单招职业适应性测试题库含答案详解(能力提升)
- (新教材)2026年春期教科版二年级下册科学教学计划及进度表
- 2025年贵州省中考物理试题【含答案、解析】
- 高等学校辅导员管理规定
- 高二心理健康教教育课完整版
评论
0/150
提交评论