南开大学22年春学期《网络爬虫与信息提取》在线作业-00003_第1页
南开大学22年春学期《网络爬虫与信息提取》在线作业-00003_第2页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-本页为预览页PAGE13-本页为预览页-本页为预览页22春学期(高起本1709-1803、全层次1809-2103)网络爬虫与信息提取在线作业-00003第1题. PyMongo中逻辑查询表示小于的符号是()选项A:$gt选项B:$lt选项C:$gte$lte参考答案:B第2题. 在Mac OS下安装MongoDB使用命令() install mongodb选项A:brew选项B:apt-get选项C:sudo选项D:apt参考答案:A第3题. 服务器端记录信息确定用户身份的数据是选项A:session选项B:cookies选项C:moonpies选项D:localstorage参考答案:A

2、第4题. 在Scrapy工程的settings.py文件中,哪个配置项,如果设置为True,那么Scrapy就会自动跳过网站不允许爬取的内容()选项A:ROBOTSTXT_ OBEY选项B:ROBOTSTXT_JUDGE选项C:ROBOTSTXT选项D:ROBOTSTXT_ IF参考答案:A第5题. 下列哪项不是HTTP的请求类型()选项A:GET选项B:POST选项C:PUT选项D:SET参考答案:D第6题. 使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()选项A:content选项B:text选项C:title选项D:body参考答案:B第7题. 当爬

3、虫运行到yield scrapy.Request()或者yield item的时候,下列哪个爬虫中间件的方法被调用?选项A:process_spider_output()选项B:process_spider_exception()选项C:process_spider_input()选项D:process_start_ requests()参考答案:A第8题. Redis中查看一个列表长度,使用关键字()选项A:len选项B:length选项C:llen选项D:count参考答案:C第9题. Python中列表可以用()方法在末尾添加元素选项A:add选项B:append选项C:plus选项D:

4、+参考答案:B第10题. 打开终端,输入(),屏幕上会出现Python的路径选项A:python path选项B:path python选项C:which python选项D:python which参考答案:C第11题. python中可以用来将图片中的文字转换为文本的第三方类库是选项A:lxml选项B:requests选项C:beautifulsoup选项D:pytesseract参考答案:D第12题. Redis中如果不删除列表中的数据,又要把数据读出来,就需要使用关键字()选项A:range选项B:lrange选项C:srange选项D:pop参考答案:B第13题. 请问按哪个键可以打

5、开Chrome自带的开发者工具()选项A:F10选项B:F1选项C:F11选项D:F12参考答案:D第14题. Python操作CSV文件可通过()容器的方式操作单元格选项A:列表选项B:元组选项C:字典选项D:集合参考答案:C第15题. 当需要把Python里面的数据发送给网页时,需要先转换成()字符串选项A:Python选项B:Json选项C:正则表达式选项D:Ajax参考答案:B第16题. Python中Object=1, 2, 3, 4, 5,则Objcet是()选项A:列表选项B:元组选项C:字典选项D:集合参考答案:A第17题. Python中若定义object=12345,则pr

6、int(object:-1)输出()选项A:1选项B:5选项C:54321选项D:程序报错参考答案:C第18题. HTTP状态码401表示选项A:请求报文中可能存在语法错误选项B:请求需要通过HTTP认证选项C:请求资源的访问被拒绝选项D:服务器上没有请求的资源参考答案:B第19题. 如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()选项A:列表选项B:元组选项C:字典选项D:集合参考答案:C第20题. 在Python中,为了使用XPath,需要安装一个第三方库()选项A:lxml选项B:xml选项C:xpath选项D:path参考答案:A第21题. 针对解析源代码

7、的BeautifulSoup对象,构造时BeautifulSoup(网页源代码, 解析器)中的解析器可以为()选项A:html选项B:html.parser选项C:lxml选项D:xml参考答案:A,C第22题. MongoDB中获取名字为set1的集合的语句为()选项A:database.set1选项B:database(set1)选项C:databaseset1选项D:databaseset1参考答案:A,C第23题. 下列说法错误的是()选项A:mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本,并在Python脚本里面直

8、接操作HTTP和HTTPS的请求,以及返回的数据包。选项B:命令行中执行mitmdump -s parse_request.py即可运行python 脚本选项C:使用python可以自定义返回的数据包,如 response.headers,就是返回的头部信息选项D:如果返回的是JSON类型的字符串,python无法进行解析。参考答案:A,B,C第24题. 使用BeautifulSoup对象后可以使用()来查找内容选项A:find_all选项B:find选项C:search选项D:search_all参考答案:A,B第25题. 以下哪些可以独立成为Python编译器()选项A:Pycharm选项

9、B:IDLE选项C:Eclipse选项D:Visual Studio 2010参考答案:A,B第26题. Redis中的值可以支持()选项A:列表选项B:哈希选项C:集合选项D:有序集合参考答案:A,B,C,D第27题. 要使用tesseract来进行图像识别,需要安装两个第三方库选项A:requests选项B:beautifulsoup选项C:Pillow选项D:pytesseract参考答案:C,D第28题. 在配置ios使用Charles的操作中,正确的有()选项A:对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。选项B:选择“HTTP代理”下面的“手动”选项卡,在“服务

10、器”处输入计算机的IP地址,在“端口”处输入8888选项C:输入完成代理以后按下苹果设备的Home键,设置就会自动保存。选项D:安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任参考答案:A,B,C,D第29题. 以下HTTP状态码表示服务器本身发生错误的是选项A:400选项B:503选项C:302选项D:500参考答案:B,D第30题. 以下HTTP状态码表示服务器没有正常返回结果的是选项A:200选项B:301选项C:404选项D:500参考答案:B,C,D第31题. Python中字符串切片以后的结果还是字符串选项A:对选

11、项B:错参考答案:A第32题. 打码平台都是靠机器使用OCR技术识别图片上的文字。选项A:对选项B:错参考答案:B第33题. 验证码必须通过手动填充识别。选项A:对选项B:错参考答案:B第34题. 代理中间件的可用代理列表一定要写在settings.py里面选项A:对选项B:错参考答案:B第35题. charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。选项A:对选项B:错参考答案:A第36题. MongoDB 是一个基于分布式文件存储的数据库,速度远快过Redis选项A:对选项B:错参考答案:B第37题.

12、爬虫的源代码通过公开不会对被爬虫网站造成影响选项A:对选项B:错参考答案:B第38题. 一般来说在页面都通过GET将用户登录信息传递到服务器端。选项A:对选项B:错参考答案:B第39题. 爬虫文件无法从Pycharm运行和调试,只能通过命令行的方式运行。选项A:对选项B:错参考答案:B第40题. 通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配选项A:对选项B:错参考答案:B第41题. Python中相比于findall方法,search方法对于从超级大的文本里面只找第1个数据特别有用,可以大大提高程序的运行效率。选项A:对选项B:错参考答案:A第42题. M

13、ongoDB URI的格式为:mongodb:/服务器IP或域名:端口用户名:密码选项A:对选项B:错参考答案:B第43题. Redis中查询列表长度命令llen中l代表left,即从左侧开始数选项A:对选项B:错参考答案:B第44题. middlewares.py是下载器中间件选项A:对选项B:错参考答案:B第45题. 需要实名认证的打码网站更加安全可靠。选项A:对选项B:错参考答案:B第46题. 开源库pytesseract的作用是将图像中文字转换为文本。选项A:对选项B:错参考答案:A第47题. 要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样选项A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论