版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、-本页为预览页PAGE14-本页为预览页-本页为预览页22春学期(高起本1709-1803、全层次1809-2103)网络爬虫与信息提取在线作业-00001第1题. 如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为(),Value就是一个集合。选项A:字典选项B:集合的名字选项C:集合选项D:文档参考答案:B第2题. Redis若要进入交互环境,需要打开终端输入()选项A:redis-cli选项B:redis选项C:redis-cmd选项D:redis-start参考答案:A第3题. xpath中extract方
2、法返回值类型是()选项A:列表选项B:元组选项C:字典选项D:集合参考答案:A第4题. Scrapy自带的待爬队列是()选项A:deque选项B:queue选项C:list选项D:lqueue参考答案:A第5题. 请问按哪个键可以打开Chrome自带的开发者工具()选项A:F10选项B:F1选项C:F11选项D:F12参考答案:D第6题. 服务器端记录信息确定用户身份的数据是选项A:session选项B:cookies选项C:moonpies选项D:localstorage参考答案:A第7题. 以下关于Charles的说法正确的是( )选项A:Charles是一个跨平台的HTTP抓包工具,可以
3、截取HTTP或者HTTPS请求的数据包选项B:Charles有Windows 32/64版和Linux 64 版,但是目前还没有对Mac OS进行有效的支持。选项C:Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图标,可以清停止抓包。选项D:在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。参考答案:A第8题. MongoDB中数据存储的形式类似于()选项A:列表选项B:元组选项C:字典选项D:集合参考答案:C第9题. 一般来说在页面传输登录信息都用HTTP()请求类型选项A:GET选项B:POST选项C:PUT选项D:SEND参
4、考答案:B第10题. 使用了RedisSpider作为爬虫的父类以后,爬虫会直接监控()中的数据,并不读取start_urls中的数据。选项A:Redis选项B:RedisSpider选项C:Spider选项D:MongoDB参考答案:A第11题. 当需要把Python里面的数据发送给网页时,需要先转换成()字符串选项A:Python选项B:Json选项C:正则表达式选项D:Ajax参考答案:B第12题. lxml库中etree模块的()方法把Selector对象转换为bytes型的源代码数据选项A:etree.tostring选项B:etree.convertBytes选项C:etree.t
5、oBytes选项D:etree.convertstring参考答案:A第13题. Python中以下哪个容器里的元素不能重复()选项A:列表选项B:元组选项C:字典选项D:集合参考答案:D第14题. 通常使用()工具来模拟浏览器进行爬虫请求选项A:Selenium选项B:Chrome选项C:ChromeDriver选项D:WebDriver参考答案:A第15题. 下面Python代码输出为():def default_para_trap(para=, value=0):para.append(value)return paraprint(第一步:.format(default_para_tra
6、p(value=100)print(第二步:.format(default_para_trap(value=50)选项A:第一步:100第二步:100,50选项B:第一步:100第二步:50选项C:第一步:100第二步:选项D:第一步:100第二步:100参考答案:A第16题. Python中若定义object=1, 2, 3, 4, 5,则print(object:3)输出()选项A:12选项B:123选项C:23选项D:234参考答案:B第17题. 使用Xpath构造属性值包含相同字符串的路径采用()方法选项A:contain选项B:contains选项C:include选项D:inclu
7、des参考答案:B第18题. 使用UI Automatorr长按点击的操作是得到相应控件后使用命令()选项A:longclick选项B:long_click选项C:clicklong选项D:click_long参考答案:B第19题. HTTP常用状态码表明服务器上没有请求的资源的是()选项A:500选项B:503选项C:403选项D:404参考答案:D第20题. Scrapy_redis是Scrapy的“()”,它已经封装了使用Scrapy操作Redis的各个方法选项A:组件选项B:模块选项C:控件选项D:单元参考答案:A第21题. Python中有哪些实现多线程方法()选项A:multipr
8、ocess.dummy选项B:threading.Thread选项C:process选项D:PyMongoDB参考答案:A,B第22题. 最常见的HTTP请求类型有()选项A:GET选项B:POST选项C:SEND选项D:RECEIVE参考答案:A,B第23题. Redis中的值可以支持()选项A:列表选项B:哈希选项C:集合选项D:有序集合参考答案:A,B,C,D第24题. 常用的会话跟踪技术是选项A:session选项B:cookies选项C:moonpies选项D:localstorage参考答案:A,B第25题. 以下哪种方法是MongoDB的查找方法()选项A:find选项B:fin
9、d_one选项C:finds选项D:find_all参考答案:A,B第26题. 针对解析源代码的BeautifulSoup对象,构造时BeautifulSoup(网页源代码, 解析器)中的解析器可以为()选项A:html选项B:html.parser选项C:lxml选项D:xml参考答案:A,C第27题. Python中一个函数可以有()个return语句选项A:0选项B:1选项C:多个选项D:2参考答案:A,B,C,D第28题. Python中的容器有()选项A:列表选项B:元组选项C:字典选项D:集合参考答案:A,B,C,D第29题. Python中一个函数没有返回值则可以写()选项A:没
10、有return选项B:return选项C:return None选项D:return NULL参考答案:A,B,C第30题. 下列关于在IOS上配置charles的说法正确的是()选项A:不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。选项B:手机和电脑需要在同一个局域网下。选项C:HTTP代理可以使用“自动”选项。选项D:安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动参考答案:B,D第31题. Python中使用下面代码打开文件也需要对文件进行close关闭操作with open(文件路径, 文件操作方式, encod
11、ing=utf-8) as f选项A:对选项B:错参考答案:B第32题. 在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。选项A:对选项B:错参考答案:B第33题. Scrapy每一次发起请求之前都会在这里检查网址是否重复。因此如果确实需要再一次爬取数据,在Redis中把这个Key删除即可。选项A:对选项B:错参考答案:A第34题. 插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1选项A:对选项B:错参考答案:B第35题. Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。选项A:对选项B:错参考答案:A第36
12、题. 使用Scrapyd,可以实现一键部署Scrapy爬虫,访问一个网址就启动/停止爬虫选项A:对选项B:错参考答案:A第37题. Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;选项A:对选项B:错参考答案:B第38题. 如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。选项A:对选项B:错参考答案:A第39题. HTTP状态码302与307完全同义。选项A:对选项B:错参考答案:A第40题. 如果元组里面只有整数、浮点数、字符串、一个列表,就既不能添加数据,也不能删除数据,还不能修改里面数据的值。选项A:对选项B:错参考答案:B第41题. HT
13、TP状态码302表示资源永久重定向。选项A:对选项B:错参考答案:B第42题. 使用异步加载技术的网站,被加载的内容可以在源代码中找到选项A:对选项B:错参考答案:B第43题. Python中条件语句在使用and连接的多个表达式中,只要有一个表达式不为真,那么后面的表达式就不会执行。选项A:对选项B:错参考答案:A第44题. 当运行爬虫代码后,出现Forbidden by robots.txt提示后,说明当前时间段被爬取的网站无法访问。选项A:对选项B:错参考答案:B第45题. 在请求头中设置User-Agent即可正常请求网站选项A:对选项B:错参考答案:B第46题. 爬虫中间件的激活需要另外写一个文件来进行选项A:对选项B:错参考答案:B第47题. 在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis选项A:对选项B:错参考答案:B第48题. 当使用Charles监控iOS设备或者An
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 孤残儿童护理员安全生产基础知识模拟考核试卷含答案
- 苏教版科学一年级下册第1课捡石头教学设计
- 中药露剂工安全宣传模拟考核试卷含答案
- 平版制版员安全风险评优考核试卷含答案
- 抗生素酶裂解工班组安全测试考核试卷含答案
- 2025年模具设计培训课件
- 2025年辽宁省公需课学习-体育强国建设纲要解读737
- 八纲辨证护理在内科的应用
- 2026年红十字会事业发展中心招聘笔试试题及答案
- 护理岗位的专业发展
- T/CEMTA 1-2021工业炸药塑膜、纸塑袋包装技术规范
- (高清版)DB62∕T 3255-2023 建筑工程施工扬尘防治技术标准
- 冶金建设工程施工组织设计标准
- 2024年嘉兴市申嘉有轨电车运营管理有限公司招聘考试真题
- 场地合作协议合同范本
- 京教版小学四年级下册心理健康教育教案
- 会计事务代理课件 项目一 会计事务代理概述
- ASP.NET程序设计(慕课版)全套课件
- 源网荷储一体化试点项目可行性研究报告模板
- 食堂厨师人员培训内容
- 机械工程材料课件 学习情境六 工业用钢
评论
0/150
提交评论