php抓取頁面的的方法

來源:文萃谷 1.52W

導語:抓取和分析一個文件是非常簡單的事。下面是php抓取頁面的的方法,希望對你有所幫助:

php抓取頁面的的方法

  一、 PHP抓取頁面的`主要方法:

1. file()函數

2. file_get_contents()函數

3. fopen()->fread()->fclose()模式

方式

5. fsockopen()函數 socket模式

6. 使用插件

 二、PHP解析html或xml代碼主要方式:

 1. file()函數

$url='';

$lines_array=file($url);

$lines_string=implode('',$lines_array);

echo htmlspecialchars($lines_string);

 2. file_get_contents()函數

使用file_get_contents和fopen必須空間開啟allow_url_fopen。方法:編輯,設置 allow_url_fopen = On,allow_url_fopen關閉時fopen和file_get_contents都不能打開遠程文件。

$url='';

$lines_string=file_get_contents($url);

echo htmlspecialchars($lines_string);

 3. fopen()->fread()->fclose()模式

$url='';

$handle=fopen($url,"rb");

$lines_string="";

do{

$data=fread($handle,1024);

if(strlen($data)==0) {

break;

}

$lines_string.=$data;

}while(true);

fclose($handle);

echo htmlspecialchars($lines_string);

 4. curl方式

使用curl必須空間開啟curl。方法:windows下修改,將extension=php_前面的分號去掉,而且需 要拷貝和到C:WINDOWSsystem32下;Linux下要安裝curl擴展。

$url='';

$ch=curl_init();

$timeout=5;

curl_setopt($ch, CURLOPT_URL, $url);

curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);

$lines_string=curl_exec($ch);

curl_close($ch);

echo htmlspecialchars($lines_string);

 5. fsockopen()函數 socket模式

socket模式能否正確執行,也跟服務器的設置有關係,具體可以通過phpinfo查看服務器開啟了哪些通信協議,比如我的本地php socket沒開啟http,只能使用udp測試一下了。

$fp = fsockopen("udp://", 13, $errno, $errstr);

if (!$fp) {

echo "ERROR: $errno - $errstr
"

} else {

fwrite($fp, "")

echo fread($fp, 26)

fclose($fp)

}

熱門標籤