




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
制作游戏辅助教材推荐:抓取网页指定内容(资料),获取网页里的图片来源:按键学院 【按键精灵】 最近有遇到同学反馈,网页里的那些没有特征值的文本元素不知道怎么获取。以及,不知道怎么获取保存网页里出现的图片。获取网页指定文字:目前按键支持的元素特征值有这些: frame(框架) 、id(唯一标识) 、tag(标签) 、type(类型)、txt(文本) 、value(特征) 、index(索引) 、name(名字) 拥有这些特征值的元素才能直接使用HtmlGet命令来获取元素文本信息。命令名称:HtmlGet 获取网页元素的信息命令功能: 获取网页元素指定属性的信息命令参数: 参数1:字符串型,网页元素属性类型:text、html、 outerHtml、value、src、href、 offset 参数2:字符串型,网页元素特征字符串 例如下面的例子,按键精灵论坛搜索框,它有type、name、id这三个特征值。 我们取它id特征值带入到HtmlGet 命令来查看下结果:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)/要提取信息的网站Txt=Plugin.Web.HtmlGet(value,id:scbar_txt) TracePrint Txt成功获取到了搜索框的value值。我们现在想要取下面红色区域块的帖子标题,想要把一个页面中的这些帖子名称都取出来。该怎么办? 这些文字,都没有特征值的。我们不能使用特征值的方式去找他们。 我们可以这样获取到整个网页的文本之后,去找我们要取的标题,前后不变的字符。 大家会发现,这个页面中,帖子标题前后不便的字符是:“ 和 “果果。“ 那我们就将”“字符前面的文本都过滤掉,“果果。“后面的文本也过率掉,这样就能得到我们所需要的文本。首先,我们需要复习下几个函数:InStr函数描述start可选的。规定每次搜索的起始位置。默认是搜索起始位置是第一个字符。如果已规定 compare 参数,则必须有此参数。string1必需的。需要被搜索的字符串。string2必需的。需搜索的字符串。compare必需的。规定要使用的字符串比较类型。默认是 0 。可采用下列值: 0= vbBinaryCompare - 执行二进制比较。 1 = vbTextCompare - 执行文本比较。 Mid函数描述string必需的。从其中返回字符的字符串表达式。如果字符串包含 Null,则返回 Null。start必需的。规定起始位置。如果设置为大于字符串中的字符数目,则返回空字符串()。length可选的。要返回的字符数目。如果省略或 length 超过文本的字符数,将返回字符串中从 start 到字符串结束的所有字符。Len函数描述string任意有效的字符串表达式。如果 string 参数包含Null,则返回 Null。varname任意有效的变量名。如果 varname 参数包含 Null,则返回 Null。脚本过程:1. 先打开一个要提取信息的网站。2. 用HtmlGet 命令 获取整个网页的文本信息,存到Txt变量里面3. 过滤符号前面的文本4. 从文本里的符号后面的位置开始取字符串,这里取了一百个字符放到命名为cc的变量里。如下图,也可以设置取80个字符,60个字符,但是长度一定要把“果果。” 给截进来,因为后面我们要通过“果果。”作为基准,去过滤掉不要的文字。2014-9-12 19:22 上传下载附件 (65.96 KB) 5. 在cc变量里,找果果。出现的位置,找到之后,截取“果果。”之前的文本,也就是我们需要接取的地方。6. 最后,设置叠加的变量x,把每次找到的 这个符号的位置放到变量x里进行累加,累加之后第二次循环,就会跳过之前找过的内容,进行新的内容的寻找。源码:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)/要提取信息的网站Delay 1000 / 如果网页打开速度慢,可适当添加延迟Txt =Plugin.Web.HtmlGet(text,)/获取网页的文本 x=1Do aa = /过滤符号前面的文本 bb = InStr(x, Txt, aa) / 返回aa变量里的这个字符 在整个网页文本txt里的位置 cc = Mid(Txt, bb + Len(aa), 100)/从文本里的符号后面的位置开始取字符串,这里取了一百个字符 dd = InStr(1, cc, 果果。)/找cc字符串里,果果。出现的位置,果果。的位置就是我们要接取的字符串的长度 ee = Mid(cc, 1, dd)/从文本里cc里第一个字符开始,取到果果。文字出现的位置 If Len(ee) 0 Then /判断有没有取到匹配的字符 pp = Left(ee, Len(ee)-1)/如果有取到,我们还要做下处理,因为前面ee字符串是取到了果果。出现的位置,所以果字也被取了,我们这里长度-1,去掉果字 TracePrint pp x = InStr(x, Txt, pp) /这里做个记号,把每次找到的 这个符号的位置进行累加,累加之后第二次循环,就会跳过之前找过的内容,进行新的内容的寻找。 Else Exit Do /如果没有找到匹配的 就退出 End IfLoop 最终效果:2014-9-12 19:23 上传下载附件 (170.42 KB) 标题后面的?234这样的字符是帖子总回帖的页数获取网页图片 我们截图按键精灵官网的图标: 2014-9-12 19:25 上传下载附件 (9.33 KB) 2014-9-12 19:26 上传下载附件 (173.2 KB) 我们可以查看图片的具体地址代码如下:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.Go() /打开按键官网地址Call Plugin.Web.Save(/images/logo.gif, d:123.gif)Delay 3000RunApp mspaint.exe& d:123.gif /打开画图工具,看看保存的图片的效果命令名称:Save 保存网页或图片命令功能:保存指定URL的文件到本地磁盘 命令参数:参数1:字符串型,需要保存的目标Url 参数2:字符串型,本地文件名最终效果:2014-9-12 19:30 上传下载附件 (150.99 KB) 大家有没有注意到,这里的按键精灵官网图标,是gif格式的,可以保存。如果是一个链接呢?例如,腾讯QQ注册页面里的这种验证图片:2014-9-12 19:30 上传下载附件 (154.34 KB) 大家看,它的图片是保存在一个链接里的,这样就无法获取。2014-9-12 19:30 上传下载附件 (58.92 KB) 地址是没有变化的,但是点击进去之后,生成的就是另一张验证图片了。2014-9-12 19:30 上传下载附件 (23.81 KB) 所以,遇到这种链接方式的图片,大家还是使用查找图片的区域坐标,然后用屏幕范围截图命令来截图保存:/下面这句在屏幕区域范围内截图保存到(内存)里,以备后面调用。Call Plugin.ColorEx.PrintScreen(0, 0, 1024, 768)/下面这句在屏幕区域范围内按方式0,查找颜色,返回左上角第一点颜色位置坐标 XY = Plugin.ColorEx.FindColor(0, 0, 1024
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中学体育课程教学设计范本
- 公司裁人合同(标准版)
- 研学基地基础设施建设与维护方案
- (2025年标准)工程分包安全协议书
- 教学资源数字化管理平台开发方案
- 2023年度企业环保合规自查报告样本
- 第三方物流仓储管理流程指导
- 超市日常管理规章及操作流程
- 2025年机械设计与制造综合试卷答案及解析
- 节能环保项目实施方案详解
- NB/T 11636-2024煤矿用芳纶织物芯阻燃输送带
- 法官培训人民调解员讲稿
- 2025贵州航空产业城集团股份有限公司旗下子公司贵州安立航空材料有限公司面向社会招聘61人笔试历年参考题库附带答案详解
- 静脉留置针输液技术课件
- 2025至2030伸缩梯行业产业运行态势及投资规划深度研究报告
- 小肠梗阻病人护理查房
- 风电叶片修复技术方案和措施
- 防暴技能培训课件
- 2025至2030年中国电子级磷酸行业市场发展态势及未来趋势研判报告
- 2025至2030年中国牛肉丸行业市场现状分析及投资潜力研判报告
- 保利舆情管理制度
评论
0/150
提交评论