




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据采集1+x中级试题(附参考答案)一、单选题(共63题,每题1分,共63分)1.Apache服务器中检验配置是否有语法错误代码为()A、apachectlconfigtestB、apachectlconfigtest01C、apachectlD、testlog正确答案:A2.使用Web浏览器访问FTP时A、只能下载文件,不能上传文件B、用b浏览根本无法访问TPC、只能上传文件,不能下载文件D、既能上传文件,也能下载文件正确答案:A3.scrapy框架的运行流程中,()组件是scrapy框架的核心组件A、DownLoaderB、ScrapyEngineC、SchedulerD、Spiders正确答案:B4.Apache服务器运行后会生成的日志文件,在()目录中A、/etc/httpd/logs1/B、/etc/httpd/log/C、/etc/httpd/logs/D、httpd/logs/正确答案:C5.操作系统中,系统管理员常用的二进制命令文件,一般放置在()目录下。A、/usr/sbinB、/sbinC、/bootD、/root正确答案:B6.使用Xpath获取一篇HTML文档中所有超链接的href属性,Xpath代码为()。A、/a/@hrefB、//a/@hrefC、//@hrefD、/a/href正确答案:B7.从传统的公司网络架构迁移到完全融合网络后,很可能产生什么影响?A、可将本地模拟电话服务完全外包给收费更低的提供商B、以太网VLAN结构会简化C、会形成共享的基础架构,因此只需管理一个网络D、语音数据流和视频数据流争夺带宽的问题会减轻正确答案:C8.以下可用于日志数据采集的工具是()。A、八爪鱼采集器B、filebeatC、logstashD、Wireshark正确答案:B9.Python中,下列标识符中哪个是合法的?()A、3QB、i'mC、_D、for正确答案:C10.关于网络数据采集,描述正确的是()A、可通过网络爬虫技术从公开网站或API获取数据信息B、网页抓取过程中,会抓取所有满足条件的URLC、爬取的数据经适当处理后进行存储D、以上都正确正确答案:D11.哪个表达式用来选取当前节点的父节点?A、..B、/C、.D、@正确答案:A12.假设某字段所要存储的数值介于0~100,且不具备小数,则此字段采用哪种数据类型最合适A、数值类型B、双精度类型C、浮动数据类型D、整型类型正确答案:D13.以下选项中,不是Python对文件的打开模式的是()A、'w'B、'c'C、'+'D、'r'正确答案:B14.数字法表示的权限中数字5代表()A、写运行B、读写运行C、读运行D、读写正确答案:C15.在OSI的七层参考模型中,工作在第三层上的网络设备是()A、集线器B、网关C、交换机D、路由器正确答案:D16.数据采集是利用一种装置或程序从系统外部采集数据并输入到系统内部的一个()A、接口B、方式C、语言D、模型正确答案:A17.数据传输可靠性的指标是()A、频带利用率B、误码率C、信息容量D、传输率正确答案:B18.密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线)是哪个?A、^[a-zA-Z]w{5.17}B、^[a-zA-Z]{5.17}$C、^[a-zA-Z]w{5.17}$D、^[a-zA-Z]w{6.18}$正确答案:C19.以下选项中,不符合Python语言变量命名规则的是A、_33keywordB、keyword33_C、33_keywordD、keyword_33正确答案:C20.以下关于xpath的描述,不正确的是A、使用Xpath技术可以获取整个网页的内容B、它能在XML和HTML的树状结构中寻找结点C、XPath(XMLPath)是一种查询语言D、用XPath从HTML源代码中提取信息可以大大提高效率正确答案:A21.关于/etc/fstab文件下边哪个描述是正确的()A、用于设置命名规则,是否使用可以用tab来命名一个文件B、用于管理文件系统信息C、系统启动后,由系统自动产生D、保存硬件信息正确答案:B22.公司中有多个部门和多名职员,每个职员只能属于一个部门,一个部门可以有多名职员,从部门到职员的联系类型是()A、多对一B、一对一C、一对多D、多对多正确答案:C23.关于lambda函数,以下选项中描述错误的是()A、lambda函数也称为匿名函数B、定义了一种特殊的函数C、lambda不是Python的保留字D、lambda函数将函数名作为函数结果返回正确答案:C24.用"useraddstd命令添加一个用户,这个用户的主目录是()"A、/etc/stdB、/home/stdC、/var/stdD、/bin/std正确答案:B25.以下选项中不可用作Python标识符的是A、NameB、PiC、姓名D、3.14正确答案:D26.在XPath中,有()种类型的节点?A、七B、八C、九D、六正确答案:A27.HTML文档结构中,用于定义文档显示哪些内容的标签是()A、<frame></frame>B、<head></head>C、<HTML></HTML>D、<body></body>正确答案:D28.以下数据库中,不是关系数据库的为()。A、MysqlB、RedisC、SqlServerD、Oracle正确答案:B29.filebeat的默认配置文件名称为()A、filebeatB、filebeat.configC、filebeat.cfgD、filebeat.yml正确答案:D30.以下哪个是关系型数据库()。A、MySQLB、RedisC、NoSqlD、Hba正确答案:A31.以下选项中,Python语言中代码注释使用的符号是A、/……/B、!C、//D、#正确答案:D32.网络监测技术sFlow报文采用什么协议封装A、UDPB、IPC、TCPD、HTTP正确答案:A33.表示商业公司的一级域名是A、netB、orgC、eduD、com正确答案:D34.以下关于模块说法错误的是()A、任何一个普通的xx.py文件可以作为模块导入B、模块文件的扩展名不一定是.pyC、运行时会从制定的目录搜索导入的模块,如果没有,会报错异常D、一个xx.py就是一个模块正确答案:B35.求负整数的表达式是哪个?A、^d+$?B、^-?d+$C、^d+$D、d+$正确答案:C36.一个典型的NetStream系统不包含哪一部分()A、网络流数据输出器NDEB、网络流数据收集器NSCC、网络流数据分析器NDAD、网络流数据存储器NDS正确答案:D37.Python中,设s="HappyNewYear.则s[3:8]的值为():"A、"pyNew"B、"ppyN"C、"pyNe"D、"ppyNe正确答案:C38.任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动是在()法律中规定的A、《中华人民共和国网络安全法》B、《民法总则》C、《电信和互联网用户个人信息保护规定》D、《用户个人信息保护法》正确答案:A39.数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指A、多个用户共享一个数据文件B、同一个应用中的多个程序共享一个数据集合C、多种应用、多种语言、多个用户相互覆盖地使用数据集合D、多个用户、同一种语言共享数据正确答案:C40.以下关于GET和POST请求的区别,错误的是A、Get执行效率却比Post方法好。B、Get限制Form表单的数据集的值必须为ASCII字符;而Post支持整个ISO10646字符集。C、Get传送的数据量较小,这主要是因为受URL长度限制;Post传送的数据量较大,一般被默认为不受限制。D、POST是form提交的默认方法。正确答案:D41.关于Python赋值语句,以下选项中不合法的是()。A、x=1;y=1B、x.y=y.xC、x=y=1D、x=(y=1)正确答案:D42.以下()命令可正确显示shell环境变量PATH的值A、echoPATHB、echo$PATHC、catPATHD、cat$PATH正确答案:B43.在vi编辑器的命令模式中敲击dd会()A、删除2行B、复制2行C、删除当前光标所在行D、复制当前光标所在行正确答案:C44.关于ATM描述正确的是()A、是分组交换和报文交换技术的组合B、是电路交换和分组交换技术的组合C、是分组交换和帧交换技术的组合D、是报文交换和电路交互技术的组合正确答案:B45.你给公司的新同事创建一个用户,起指定他的账号在30天过期,现在想更改过期时间,使用下边哪个命令更合适()A、usermod-dB、usermod-aC、usermod-xD、usermod-e正确答案:D46.关于Python程序中与“缩进”有关的说法中,以下选项中正确的是()A、缩进统一为4个空格B、缩进是非强制性的,仅为了提高代码可读性C、缩进在程序中长度统一且强制使用D、缩进可以用在任何语句之后,表示语句间的包含关系正确答案:C47.哪种方式可以将外部CSS样式文件嵌入网页()A、<linktype="text/cssrel="stylesheet"src="外部样式表的文件名称">B、<linktype="text/css"rel="stylesheet"href="外部样式表的文件名称">C、<linkhref="外部样式表的文件名称">D、<linksrc="外部样式表的文件名称">正确答案:B48.下列不属于操作系统类型的是()。A、批处理系统B、模拟系统C、实时系统D、分时系统正确答案:B49.关于Python语言的浮点数类型,以下选项中描述错误的是A、浮点数类型表示带有小数的类型B、Python语言要求所有浮点数必须带有小数部分C、小数部分不可以为0D、浮点数类型与数学中实数的概念一致正确答案:C50.关于MongoDB集合命名规则错误的是()。A、不能以“system.”开头,因为这是系统集合的保留前缀B、集合名中不能含有保留字符$C、不能含是空字符串D、集合名称最大值200字节正确答案:D51.关于数据采集的描述不正确的是()A、数据采集不在于掌握庞大的的数据信息,而在于对数据的智能处理,挖掘出有价值的信息B、数据采集来源广泛,类型也丰富多样,很看重数据处理的高效性和实时性C、数据采集,要注重数据质量和数据采集性能提升,为数据的准确分析打下基础D、以上描述都不正确正确答案:D52.下列哪个表达式是求整数?A、^-?d$B、^-d+$C、^-?d+$D、^-?d+正确答案:C53.在Linux环境下的Tomcat容器数据的采集中,启动Tomcat容器的代码是()A、startup.shB、logstashC、httpdD、filebeat正确答案:A54.为了得到所有的命令行输入的参数,我们可以使用变量()A、$!B、$*C、$0D、$#正确答案:B55.用于解析域名的协议是A、HTTPB、DNSC、FTPD、SMTP正确答案:B56.数据清洗是针对不符合要求的数据进行处理,以下不属于数据清洗范围的是()A、无缺失数据B、不完整的数据C、重复的数据D、错误的数据正确答案:A57.哪个轴可以选取当前节点的所有命名空间节点?A、namespaceB、ancestorC、childD、parent正确答案:A58.httpd.conf配置文件中服务其主机与端口代码为()A、ServerNamelocalhost:80B、localhost80C、localhost8080D、ServerNamelocalhost正确答案:A59.下面对HBase的描述哪些是错误的?()。A、不是开源的B、是面向列的C、是分布式的D、是一种NoSQL数据库正确答案:A60.以下不属于ETL抽取数据步骤的是()A、数据的加载B、数据的清洗转换C、数据挖掘D、数据抽取正确答案:C61.jQuery中,定义array的语法错误的是()A、newArray(size);B、newArray(ele0.ele1.....ele);C、newArray();D、newArray[];正确答案:D62.以下哪种爬虫又称为主题网络爬虫,是指选择性的爬行那些与预先定义好的主题相关页面的网络爬虫A、通用网络爬虫B、深层页面爬虫C、增量式网络爬虫D、聚焦网络爬虫正确答案:D63.选取价格高于35的price节点?A、/book[price>35]/priceB、/bookstore/book[price>35]C、/bookstore/book[price>35]/priceD、以上都可以正确答案:C二、多选题(共17题,每题1分,共17分)1.Python中,关于文件的打开方式,以下选项中描述错误的是()。A、文件只能选择二进制打开B、所有文件都可能以二进制方式打开C、文本文件只能以文本方式打开D、所有文件都可能以文本方式打开正确答案:ACD2.进程的基本状态有()。A、阻塞态B、运行态C、就绪态D、停止态正确答案:ABC3.根据网页内容获取方式不同.可以将网页分为()。A、静态页面B、专业型网页C、标记型网页D、动态页面正确答案:AD4.在xpath中,基本值是()节点。A、有根B、无子C、无父D、没有根正确答案:BC5.以下属于常用爬虫框架的是()。A、Spring框架B、Scrapy框架C、Pyspider框架D、CoB框架正确答案:BCD6.关系数据库中,不是用来实现表与表之间联系的是()A、参照完整性规则B、用户自定义的完整性规则C、值域D、实体完整性规则正确答案:BCD7.以下选项中说法不正确的是()A、解释是将源代码转换成目标代码的过程B、静态语言采用解释方式执行,脚本语言采用编译方式执行C、Python语言是脚本语言D、编译是将源代码逐条转换成目标代码同时逐条运行目标代码的过程正确答案:ABD8.正则表达式是对()和()操作的一种逻辑公式?A、普通字符B、元字符正确答案:AB9.在Xpath中,元素节点可以有()个。A、0B、1C、多个D、以上都不对正确答案:ABC10.正则表达式中,下列哪些可以匹配由英文字母组成的字符串()。A、^[A-Z]+$B、^[a-z]+$C、^[A-Za-z]+$D、^[A-Za-z]正确答案:ABC11.CSS选择器主要包括()。A、类选择器B、标签选择器C、ID选择器D、父选择器正确答案:ABC12.下列哪种说法是错误的()。A、除字典类型外,所有标准对象均可以用于布尔测试B、空字符串的布尔值是TrueC、空列表对象的布尔值是FalseD、值为0的任何数字对象的布尔值是False正确答案:AB13.Apache容器数据采集中常用()工具完成数据采集。A、Apache服务器B、FilebeatC、logstashD、html正确答案:BC14.关系型数据库中,()是用来查询、添加、修改和删除数据库中数据的语句。A、SELECTB、INSERTC、UPDATED、DELETE正确答案:ABCD15.在XPath中,节点包括以下哪些类型()?A、元素B、文本C、属性D、命名空间正确答案:ABCD16.以下属于半结构化数据的是A、日志文件B、JSON格式文档C、XML文档D、MySQL中的数据表正确答案:ABC17.基本值是()节点?A、有根B、无子C、没有根D、无父正确答案:BD三、判断题(共27题,每题1分,共27分)1.HTTP请求报文结构包含请求行、请求头部、空行和请求数据4部分。A、正确B、错误正确答案:A2.WHERENAMEISNOTNULL可以查找条件为:姓名不是NULL的记录A、正确B、错误正确答案:A3.jQuery的核心功能不是根据选择器查找HTML元素,然后对这些元素执行相关的操作。A、正确B、错误正确答案:B4.filebeat可以采集Tomcat的日志文件A、正确B、错误正确答案:A5.HBase数据导入工具的是Inport。A、正确B、错误正确答案:A6.操作系统中,进程具备多种特性,如:动态性、顺序性、独立性和同步性。A、正确B、错误正确答案:B7.w与[0-9a-zA-Z]是等效的A、正确B、错误正确答案:B8.Net平台提供了运行所必须的环境.NETFramework类库以及CLRA、正确B、错误正确答案:A9.动态网页是相对静态网页来说的,指使用动态网络技术生成的网页,动态网页的后缀不仅仅是静态文件常见的形式,通常在动态网址之后包含“?”符号。A、正确B、错误正确答案:A10.HBase的底层存储为HDFS。A、正确B、错误正确答案:A11.候选关键字中的属性称为复合属性A、正确B、错误正确答案:B12.查看数据表的结构信息,可以在指定的数据库中使用“describe表名;”语句,通常简写为“desc表名;”A、正确B、错误正确答案:A13.Gallery是下拉列表组件。A、正确B、错误正确答案:B14.在关系A(S,SN,D)和B(D,CN,NM)中,A的主键是S,B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏第二师范学院《西方现当代文学经典导读》2023-2024学年第二学期期末试卷
- 企业安全生产复习试题库及答案
- 设计行业虚拟现实与增强现实设计方案
- 2025年中考化学【热点·重点·难点】重难点04 水和溶液(原卷版)
- 中医食疗与养生保健
- 长期和学校合作合同协议
- 非法劳务协作合同协议
- 2025物流公司收购合同范本 物流公司收购合同书
- 项目资产抵押合同协议
- 雇佣吊车起重机合同协议
- 2024年四川省公安厅招聘警务辅助人员真题
- 机械制造及非标零部件加工项目突发环境事件应急预案
- 2025年绍兴市九年级中考语文一模试卷附答案解析
- 9.1科学立法 课件高中政治统编版必修三政治与法治
- 施工现场临时用电安全
- 2025年3月广东省高三语文一模作文题目解析及范文6篇:“人们认知世界的方式”
- 小学教育学(第5版)课件 第九章 小学教育评价
- 硫酸铜晶体的制备实验课件
- 闸门液压维修施工方案
- 2025年度智慧婚恋服务平台服务合同
- 2024年深圳市中考历史试卷真题(含答案解析)
评论
0/150
提交评论