php中抓取網(wǎng)頁(yè)內(nèi)容的兩種方法(實(shí)例講解)
第一種方法:使用file_get_contents方法實(shí)現(xiàn)
1
2
3
4
5
|
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
$html = file_get_contents($url);
//如果出現(xiàn)中文亂碼使用下面代碼
//$getcontent = iconv("gb2312", "utf-8",$html);
echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
|
第二種方法:使用curl實(shí)現(xiàn)
1
2
3
4
5
6
7
8
9
10
11
|
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);
echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
|
1
|
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
|
加上這句代碼,表示如果請(qǐng)求被重定向時(shí),可以訪問(wèn)到最終的請(qǐng)求頁(yè)面,不然請(qǐng)求的結(jié)果會(huì)顯示如下內(nèi)容:
1
2
|
<head><title>Object moved</title></head>
<body><h1>Object Moved</h1>This object may be found <a href="some link."rel="external nofollow" >here</a>.</body>
|