国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 PHP 庫 其它類庫 phP的抓取網(wǎng)站類庫
phP的抓取網(wǎng)站類庫
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

支持抓取網(wǎng)站,進行爬蟲,非常強大,是一個基于PHP的服務(wù)端開源項目,它可以讓PHP開發(fā)人員輕松處理DOM文檔內(nèi)容,比如獲取某新聞網(wǎng)站的頭條信息。更有意思的是,它采用了jQuery的思想,你可以像使用jQuery一樣處理頁面內(nèi)容,獲取你想要的頁面信息。

免責(zé)聲明

本站所有資源均由網(wǎng)友貢獻或各大下載網(wǎng)站轉(zhuǎn)載。請自行檢查軟件的完整性!本站所有資源僅供學(xué)習(xí)參考。請不要將它們用于商業(yè)目的。否則,一切后果由您負(fù)責(zé)!如有侵權(quán),請聯(lián)系我們刪除。聯(lián)系方式:admin@php.cn

相關(guān)文章

如何使用 Python 中的請求從嚴(yán)重依賴 JavaScript 的網(wǎng)站中抓取內(nèi)容? 如何使用 Python 中的請求從嚴(yán)重依賴 JavaScript 的網(wǎng)站中抓取內(nèi)容?

04 Nov 2024

Requests for Javascript-Enabled PagesRequests 是一個強大的 Python HTTP 庫,但它很難從網(wǎng)站中提取內(nèi)容......

如何使用 PHP 網(wǎng)頁抓取從網(wǎng)站中提取數(shù)據(jù)? 如何使用 PHP 網(wǎng)頁抓取從網(wǎng)站中提取數(shù)據(jù)?

19 Nov 2024

網(wǎng)頁抓取如何與 PHP 一起使用網(wǎng)頁抓取涉及三個主要步驟:請求 URL:使用 GET 或 POST 從指定的位置獲取數(shù)據(jù)...

如何使用 PHP 網(wǎng)頁抓取從網(wǎng)站中提取數(shù)據(jù) 如何使用 PHP 網(wǎng)頁抓取從網(wǎng)站中提取數(shù)據(jù)

17 Oct 2024

** PHP 中的網(wǎng)頁抓?。禾崛?/p>

如何查看網(wǎng)站被百度抓取的情況 如何查看網(wǎng)站被百度抓取的情況

24 May 2019

查看網(wǎng)站被百度抓取的情況的方法:通過分析網(wǎng)站日志中百度蜘蛛的活躍性、抓取頻率、返回的HTTP狀態(tài)碼等來實現(xiàn)。還可以查看網(wǎng)站根目錄下的日志文件,該文件記錄了網(wǎng)站被訪問和操作的情況。

以下是一些基于您的文章的問題式標(biāo)題:

一般的:

* Python 可以用于網(wǎng)頁抓取嗎?綜合指南
* 如何使用 Python 從網(wǎng)站提取數(shù)據(jù):分步教程 以下是一些基于您的文章的問題式標(biāo)題: 一般的: * Python 可以用于網(wǎng)頁抓取嗎?綜合指南 * 如何使用 Python 從網(wǎng)站提取數(shù)據(jù):分步教程

26 Oct 2024

Python 中的網(wǎng)頁抓取網(wǎng)頁抓取涉及從網(wǎng)站中提取特定數(shù)據(jù)。憑借其多功能的庫,Python 提供了有效的...

如何使用 Curl 庫在 PHP 中實現(xiàn)網(wǎng)絡(luò)抓??? 如何使用 Curl 庫在 PHP 中實現(xiàn)網(wǎng)絡(luò)抓取?

17 Nov 2024

如何在 PHP 中實現(xiàn) Web Scraper Web 抓取涉及三個步驟:向 URL 發(fā)送 GET 或 POST 請求。接收 HTML 響應(yīng)。解析...

See all articles