版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第Python+selenium破解拼图验证码的脚本目录实现思路核心代码
实现思路
很多网站都有拼图验证码
1.首先要了解拼图验证码的生成原理
2.制定破解计划,考虑其可能性和成功率。
3.编写脚本
很多网站的拼图验证码都是直接借助第三方插件,也就是一类一种解法。
笔者遇到的这种拼图验证码实际上是多个小碎片经过重新组合成的一张整体,首先要在网站上抓取这种小碎片图片并下载到本地
我们先捋一捋大体思路:
获取所有碎片图片----找出他们的排列顺序逻辑-----找出他们中含有颜色深的真正位置的那个小碎块的序号-----根据每块碎片的宽度和上下和这个深色小块的序号算出距离----用selenium向右移动滑块到这个距离
核心代码
先导入必要的包:
#-*-coding:utf-8-*-
importcolorsys
importurllib,os,uuid,re,time
fromPILimportImage
frommon.action_chainsimportActionChains
fromseleniumimportwebdriver
抓到并下载到本地
defcreate(locapath,fileName):
filePath=locapath+'/'+fileName
ifnotos.path.exists(filePath):
file=open(filePath,'a+')
file.close()
returnfilePath
defdownloadImg():
list=openBrowser()
foriinrange(2):
fileName=str(i)+'_test.jpg'
urllib.urlretrieve(list[i],create('/Users/zijiawang/Downloads/',fileName))#下载到本地
time.sleep(3)
defopenBrowser():
globalwzj
wzj=webdriver.Firefox()
wzj.get('https://。。。。')
image1_url=wzj.find_elements_by_class_name('gt_cut_bg_slice')[0].get_attribute('style')
image1_url=image1_url[23:-38]
image2_url=wzj.find_elements_by_class_name('gt_cut_fullbg_slice')[0].get_attribute('style')
image2_url=image2_url[23:-38]
return[image1_url,image2_url]
分割并获取rgb颜色
efgetcolor(image):
list=[[x,y]forxinrange(26)foryinrange(2)]
listt=[]
colors=[]
foriinrange(len(list)):
l=list[i][0]*12+12
w=list[i][1]*58+58
listt.append([12*0.25+i/2*12,58*0.25+((i+10)%2)*58])
listt.append([12*0.25+i/2*12,58*0.75+((i+10)%2)*58])
listt.append([12*0.75+i/2*12,58*0.25+((i+10)%2)*58])
listt.append([12*0.75+i/2*12,58*0.75+((i+10)%2)*58])
foriinrange(len(listt)):
colors.append(image[listt[i][0],listt[i][1]])
returncolors
找出不同的小碎片序号
defgetDeferent():
deferent=[]
foriinrange(208):
ifabs(color1[i][2]-color2[i][2])20:
printu'B差值:',color1[i][2]-color2[i][2]
deferent.append(i)
#print([i,abs(color1[i][0]-color2[i][0]),abs(color1[i][1]-color2[i][1]),abs(color1[i][2]-color2[i][2])])
returndeferent
defgetUPDOWN():
deferent=getDeferent()
xlist=[]
ylist=[]
foriindeferent:
if(i/4)%2==0:
xlist.append(i)
else:
ylist.append(i)
uplist=[]
downlist=[]
foriinxlist:
uplist.append(i/4)
foriinylist:
downlist.append(i/4)
foriinrange(len(uplist)):
uplist[i]/=2
foriinrange(len(downlist)):
downlist[i]/=2
func=lambdax,y:xifyinxelsex+[y]
up=reduce(func,[[],]+uplist)
func=lambdax,y:xifyinxelsex+[y]
down=reduce(func,[[],]+downlist)
returnup,down
编写好排列方法,会用的
defbubble(l):
forindexinrange(len(l)-1,0,-1):
fortwo_indexinrange(index):
ifl[two_index]l[two_index+1]:
l[two_index],l[two_index+1]=l[two_index+1],l[two_index]
returnl
最后的进行解析,拼装源码
defend():
orders=getUPDOWN()
orderx=orders[0]
ordery=orders[1]
print'x:',orderx
print'y:',ordery
orderX=[145,157,277,265,169,181,253,241,97,109,301,289,73,85,37,25,1,13,133,121,49,61,229,
217,193,205]
orderY=[157,145,265,277,181,169,241,253,109,97,289,301,85,73,25,37,13,1,121,133,61,49,217,
229,205,193]
printu'X:',orderX
printu'Y:',orderY
forxinrange(26):
orderX[x]-=1
orderX[x]/=12
foryinrange(26):
orderY[y]-=1
orderY[y]/=12
endX=[]
endY=[]
foriinrange(len(orderX)):
forjinrange(len(orderx)):
iforderx[j]==orderX[i]:
endX.append(i)
break
foriinrange(len(orderY)):
forjinrange(len(ordery)):
ifordery[j]==orderY[i]:
endY.append(i)
break
print'endx:',endX
print'endy:',endY
os.remove('/Users/zijiawang/Downloads/0_test.jpg')
os.remove('/Users/zijiawang/Downloads/1_test.jpg')
all=[]
all=endX+endY
#print'all:',all
#系统最多可实验5次
func=lambdax,y:xifyinxelsex+[y]
all_old=reduce(func,[[],]+all)
#print'all_old:',all_old
all_end=bubble(all_old)
print'all_end:',all_end
duandata=1000
foriinrange(1,len(all_end)):
ifall_end[i]-1inall_end:
pass
else:
duandata=all_end[i]
printu'断点为:',duandata
guess=[]
ifduandata!=1000:
ifendX!=[]andendY!=[]:
printu'断点1'
guess=[duandata,all_end[0]]
elifendX==[]:
printu'断点2'
guess=[duandata,endY[0]]
elifendY==[]:
printu'断点3'
guess=[duandata,endX[0]]
else:
printu'无断点'
guess=[all_end[0]]
end_guess=[]
printu'猜测的点:',guess
foriinguess:
end_guess.append(i*12-38)
end_guess.append(i*12-28)
end_guess.append(i*12-20)
end_guess.append(i*12-17)
end_guess.append(i*12-15)
printu'猜测的位移量:',end_guess
returnend_guess
主函数
if__name__=='__main__':
downloadImg()
color1=getcolor(Image.open('/Users/zijiawang/Downloads/0_test.jpg').load())
color2=getcolor(Image.open('/Users/zijiawang/Downloads/1_test.jpg').load())
guess=end()
foriinguess:
printi,wzj.title
try:
ele=wzj.find_element_by_xpath('//div[@]')
except:
ele=wzj.find_element_by_xpath('//div[@]')
ActionCh
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- BIM技术应用实施方案
- 品牌宣传与市场推广工具包
- 员工培训安排跟进函(5篇)
- 智能交通系统停车场智能监测系统使用手册
- 告知变更供应商的函(3篇)范文
- 2026届四川省巴中学市恩阳区重点名校初三下学期期初学情调研考试语文试题试卷含解析
- 农业科技园规划与发展战略手册
- 新疆沙湾县2025-2026学年初三3.20联考考试英语试题含解析
- 2026年天津市津南区咸水沽三中学业水平模拟考试英语试题仿真模拟试题B卷含解析
- (正式版)DB32∕T 2633-2014 《乡镇(街道)便民服务中心服务管理规范》
- 2026年安庆医药高等专科学校单招综合素质考试题库及答案详解(各地真题)
- 2026年春统编版小学道德与法治五年级下册(全册)教学反思
- 2025至2030中国智能射击装备行业市场运行分析及发展前景与投资研究报告
- 2025年落实党的创新理论方面存在的问题和整改措施
- 既有公共建筑节能改造技术标准
- 初中七年级历史大概念视域下第一单元“隋唐繁荣与开放”深度复习导学案
- 妇科妇科肿瘤化疗护理
- 中国注意缺陷多动障碍诊疗指南(2025年版)
- 货车尾板装卸培训课件
- 2026年辅警面试常见试题及深度解析
- 党的二十届四中全会精神题库
评论
0/150
提交评论