PHP的cURL库有效地抓网页的技巧_第1页
PHP的cURL库有效地抓网页的技巧_第2页
PHP的cURL库有效地抓网页的技巧_第3页
PHP的cURL库有效地抓网页的技巧_第4页
PHP的cURL库有效地抓网页的技巧_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版,下载可任意编辑——PHP的cURL库有效地抓网页的技巧PHP的cURL库有效地抓网页的技巧

PHP独特的语法混合了C、Java、Perl以及PHP自创的语法。它可以比CGI或者Perl更快速地执行动态网页。用PHP做出的动态页面与其他的编程语言相比,PHP是将程序嵌入到HTML文档中去执行,执行效率比完全生成HTML标记的CGI要高大量;PHP还可以执行编译后代码,编译可以达成加密和优化代码运行,使代码运行更快。以下是我为大家探寻整理PHP的cURL库有效地抓网页,梦想能给大家带来扶助!更多精彩内容请实时关注我们我!

启用cURL设置

首先,我们得先要确定我们的PHP是否开启了这个库,你可以通过使用php_info函数来得到这一信息。

phpinfo;

?

假设你可以在网页上看到下面的输出,那么表示cURL库已被开启。

假设你看到的话,那么你需要设置你的`PHP并开启这个库。假设你是在Windows平台下,那么分外简朴,你需要改一改你的php.ini文件的设置,找到php_curl.dll,并取消前面的分号解释就行了。如下所示:

//取消下在的解释

extension=php_curl.dll

假设你是在Linux下面,那么,你需要重新编译你的PHP了,编辑时,你需要开启编译参数在configure命令上加上"with-curl'参数。

一个小例如

假设一切就绪,下面是一个小例程:

//初始化一个cURL对象

$curl=curl_init;

//设置你需要抓取的URL

curl_setopt$curl,CURLOPT_URL,;

//设置header

curl_setopt$curl,CURLOPT_HEADER,1;

//设置cURL参数,要求结果保存到字符串中还是输出到屏幕上。

curl_setopt$curl,CURLOPT_RETURNTRANSFER,1;

//运行cURL,苦求网页

$data=curl_exec$curl;

//关闭URL苦求

curl_close$curl;

//显示获得的数据

var_dump$data;

?

如何POST数据

上面是抓取网页的代码,下面那么是向某个网页POST数据。假设我们有一个处理表单的网址http://./sendSMS.php,其可以采纳两个表单域,一个是电话号码,一个是短信内容。

$phoneNumber

$message=Thismessagewasgeneratedbycurlandphp;

$curlPost=pNUMBER=.urlencode$phoneNumber.MESSAGE=.urlencode$message.SUBMIT=Send;

$ch=curl_init;

curl_setopt$ch,CURLOPT_URL,http://./sendSMS.php;

curl_setopt$ch,CURLOPT_HEADER,1;

curl_setopt$ch,CURLOPT_RETURNTRANSFER,1;

curl_setopt$ch,CURLOPT_POST,1;

curl_setopt$ch,CURLOPT_POSTFIELDS,$curlPost;

$data=curl_exec;curl_close$ch;

?

从上面的程序我们可以看到,使用CURLOPT_POST设置HTTP协议的POST方法,而不是GET方法,然后以CURLOPT_POSTFIELDS设置POST的数据。

关于代理服务器

下面是一个如何使用代理服务器的例如。请留神其中高亮的代码,代码很简朴,我就不用多说了。

$ch=curl_init;

curl_setopt$ch,CURLOPT_URL,http://.;

curl_setopt$ch,CURLOPT_HEADER,1;

curl_setopt$ch,CURLOPT_RETURNTRANSFER,1;

curl_setopt$ch,CURLOPT_HTTPPROXYTUNNEL,1;

curl_setopt$ch,CURLOPT_PROXY,:1080;

curl_setopt$ch,CURLOPT_PROXYUSERPWD,user:password;

$data=curl_exec;curl_close$ch;

?

关于SSL和Cookie

关于SSL也就是HTTPS协议,你只需要把CURLOPT_URL连接中的http://变成https://就可以了。当然,还有一个参数叫CURLOPT_SSL_VERIFYHOST可以设置为验证站点。

关于Cookie,你需要了解下面三个参数:

CURLOPT_COOKIE,在当面的会话中设置一个cookie

CURLOPT_COOKIEJAR,当会话终止的时候保存一个Cookie

CURLOPT_COOKIEFILE,Cookie的文件。

HTTP服务器认证

结果,我们来看一看HTTP服务器认证的处境。

$ch=curl_init;

curl_setopt$ch,CURLOPT_URL,http://.;

curl_setopt$ch,CURLOPT_RETURNTRANSFER,1;

curl_setopt$ch,CURL

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论