




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本文格式为Word版,下载可任意编辑——PHP的cURL库有效地抓网页的技巧PHP的cURL库有效地抓网页的技巧
PHP独特的语法混合了C、Java、Perl以及PHP自创的语法。它可以比CGI或者Perl更快速地执行动态网页。用PHP做出的动态页面与其他的编程语言相比,PHP是将程序嵌入到HTML文档中去执行,执行效率比完全生成HTML标记的CGI要高大量;PHP还可以执行编译后代码,编译可以达成加密和优化代码运行,使代码运行更快。以下是我为大家探寻整理PHP的cURL库有效地抓网页,梦想能给大家带来扶助!更多精彩内容请实时关注我们我!
启用cURL设置
首先,我们得先要确定我们的PHP是否开启了这个库,你可以通过使用php_info函数来得到这一信息。
phpinfo;
?
假设你可以在网页上看到下面的输出,那么表示cURL库已被开启。
假设你看到的话,那么你需要设置你的`PHP并开启这个库。假设你是在Windows平台下,那么分外简朴,你需要改一改你的php.ini文件的设置,找到php_curl.dll,并取消前面的分号解释就行了。如下所示:
//取消下在的解释
extension=php_curl.dll
假设你是在Linux下面,那么,你需要重新编译你的PHP了,编辑时,你需要开启编译参数在configure命令上加上"with-curl'参数。
一个小例如
假设一切就绪,下面是一个小例程:
//初始化一个cURL对象
$curl=curl_init;
//设置你需要抓取的URL
curl_setopt$curl,CURLOPT_URL,;
//设置header
curl_setopt$curl,CURLOPT_HEADER,1;
//设置cURL参数,要求结果保存到字符串中还是输出到屏幕上。
curl_setopt$curl,CURLOPT_RETURNTRANSFER,1;
//运行cURL,苦求网页
$data=curl_exec$curl;
//关闭URL苦求
curl_close$curl;
//显示获得的数据
var_dump$data;
?
如何POST数据
上面是抓取网页的代码,下面那么是向某个网页POST数据。假设我们有一个处理表单的网址http://./sendSMS.php,其可以采纳两个表单域,一个是电话号码,一个是短信内容。
$phoneNumber
$message=Thismessagewasgeneratedbycurlandphp;
$curlPost=pNUMBER=.urlencode$phoneNumber.MESSAGE=.urlencode$message.SUBMIT=Send;
$ch=curl_init;
curl_setopt$ch,CURLOPT_URL,http://./sendSMS.php;
curl_setopt$ch,CURLOPT_HEADER,1;
curl_setopt$ch,CURLOPT_RETURNTRANSFER,1;
curl_setopt$ch,CURLOPT_POST,1;
curl_setopt$ch,CURLOPT_POSTFIELDS,$curlPost;
$data=curl_exec;curl_close$ch;
?
从上面的程序我们可以看到,使用CURLOPT_POST设置HTTP协议的POST方法,而不是GET方法,然后以CURLOPT_POSTFIELDS设置POST的数据。
关于代理服务器
下面是一个如何使用代理服务器的例如。请留神其中高亮的代码,代码很简朴,我就不用多说了。
$ch=curl_init;
curl_setopt$ch,CURLOPT_URL,http://.;
curl_setopt$ch,CURLOPT_HEADER,1;
curl_setopt$ch,CURLOPT_RETURNTRANSFER,1;
curl_setopt$ch,CURLOPT_HTTPPROXYTUNNEL,1;
curl_setopt$ch,CURLOPT_PROXY,:1080;
curl_setopt$ch,CURLOPT_PROXYUSERPWD,user:password;
$data=curl_exec;curl_close$ch;
?
关于SSL和Cookie
关于SSL也就是HTTPS协议,你只需要把CURLOPT_URL连接中的http://变成https://就可以了。当然,还有一个参数叫CURLOPT_SSL_VERIFYHOST可以设置为验证站点。
关于Cookie,你需要了解下面三个参数:
CURLOPT_COOKIE,在当面的会话中设置一个cookie
CURLOPT_COOKIEJAR,当会话终止的时候保存一个Cookie
CURLOPT_COOKIEFILE,Cookie的文件。
HTTP服务器认证
结果,我们来看一看HTTP服务器认证的处境。
$ch=curl_init;
curl_setopt$ch,CURLOPT_URL,http://.;
curl_setopt$ch,CURLOPT_RETURNTRANSFER,1;
curl_setopt$ch,CURL
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 统编版2025-2026学年 语文三年级上册 期中测试卷 (有答案)
- 河南省周口市等2地2025-2026学年高三上学期开学物理试题(含解析)
- 部门干部安全培训总结报告课件
- 部门安全培训概况课件
- 辩论程序课件
- 基于人工智能的合成路线智能生成与实验验证的闭环反馈系统构建
- 城市级智慧能源管理中探测器网络拓扑优化与能耗悖论解构
- 车队车辆安全培训课件
- 可降解高分子复合材料在一次性双极电极板降解周期与临床时效平衡中的挑战
- 可重构凸轮齿轮模块化设计对柔性制造系统的适配性研究
- 睿卡古筝课件
- 中国邮政储蓄银行2025年反洗钱知识考试题库(带答案)
- 医院消毒供应中心控感管理规范
- 【课件】长度和时间的测量教学课件2025-2026学年初中物理人教版(2024)八年级上册
- 煤矿面试题目及答案
- 2025年部编版语文新教材三年级上册第六单元大单元教学及课时教案
- 养殖场安全知识培训课件
- 2025年国企中层干部竞聘笔试题含答案
- 贸易安全管理办法
- 泥工安全生产责任制
- 2025新党内法规知识测试(竞赛)题库及答案
评论
0/150
提交评论