<?php header("Content-Type: text/html; charset=UTF-8"); require("phpQuery.php"); $hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text'))); //dump($hj->data); $data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array( 'image' => array('img','src') ))->data; // $data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array( 'link' => array('a','href') ))->data; $page = 'http://cms.querylist.cc/news/566.html'; $reg = array( 'title' => array('h1','text'), 'date' => array('.pt_info','text','-span -a',function($content){ $arr = explode(' ',$content); return $arr[0]; }), 'content' => array('.post_content','html','a -.content_copyright -script',function($content){ $doc = phpQuery::newDocumentHTML($content); $imgs = pq($doc)->find('img'); foreach ($imgs as $img) { $src = 'http://cms.querylist.cc'.pq($img)->attr('src'); $localSrc = 'w/'.md5($src).'.jpg'; $stream = file_get_contents($src); file_put_contents($localSrc,$stream); pq($img)->attr('src',$localSrc); } return $doc->htmlOuter(); }) ); $rang = '.content'; $ql = QueryList::Query($page,$reg,$rang); $data = $ql->getData(); dump($data);
menyokong tapak web merangkak dan merangkak Ia adalah projek sumber terbuka sebelah pelayan berdasarkan PHP. Ia membolehkan pembangun PHP memproses kandungan dokumen DOM dengan mudah, seperti mendapatkan maklumat tajuk laman web. Apa yang lebih menarik ialah ia menggunakan idea jQuery Anda boleh memproses kandungan halaman sama seperti menggunakan jQuery untuk mendapatkan maklumat halaman yang anda inginkan.
Semua sumber di laman web ini disumbangkan oleh netizen atau dicetak semula oleh tapak muat turun utama. Sila semak integriti perisian itu sendiri! Semua sumber di laman web ini adalah untuk rujukan pembelajaran sahaja. Tolong jangan gunakannya untuk tujuan komersial. Jika tidak, anda akan bertanggungjawab untuk semua akibat! Jika terdapat sebarang pelanggaran, sila hubungi kami untuk memadamkannya. Maklumat hubungan: admin@php.cn
Artikel Berkaitan

16 Aug 2025
Artikel ini menerangkan cara merangkak data dari laman web yang menggunakan JavaScript untuk memuatkan data secara dinamik, mengambil data basikal pengangkutan London (TFL) sebagai contoh. Kami akan menunjukkan cara mencari permintaan API melalui alat pemaju pelayar analitik dan menghuraikan respons XML menggunakan perpustakaan Python dan BeautifulSoup untuk mengekstrak URL fail data yang diperlukan. Tutorial ini sesuai untuk pemula dan menyediakan contoh kod yang jelas dan arahan langkah.

16 Aug 2025
Artikel ini menyediakan penyelesaian berdasarkan laman web yang berkumpul yang membolehkan cache apabila menggunakan perpustakaan dom HTML PHP mudah untuk merangkak dan membuka laman web cache, dan membantu pemaju menyelesaikan masalah yang sama dengan menyelesaikan cums.

07 Aug 2025
Artikel ini menerangkan cara menggunakan JavaScript dan bertindak balas terhadap data merangkak dari laman web lain dan menjadikan laman web anda sendiri tanpa API. Kaedah utama adalah menggunakan iframe untuk membenamkan halaman pendaratan dan menyediakan kod sampel dan langkah berjaga -jaga untuk membantu pemaju dengan cepat merealisasikan paparan data.

02 Aug 2025
Gunakan Python untuk merangkak kandungan web untuk memilih alat yang betul dan perhatikan butiran. 1. Pilih permintaan BeautifulSoup (halaman statik), scrapy (projek berskala besar) atau selenium/penulis drama (kandungan dinamik) mengikut tempat kejadian; 2. mematuhi peraturan robots.txt dan mengawal kekerapan permintaan untuk mengelakkan menyekat IP; 3. Beri perhatian kepada struktur semantik dan bukan hanya label apabila parsing data untuk meningkatkan kestabilan kod; 4. Apabila menghadapi mekanisme anti-keriting, anda boleh menggunakan tajuk, IP proksi atau operasi penyemak imbas simulasi untuk menanganinya.

27 Feb 2025
Buat antara muka visual data yang menggabungkan estetika dan kecekapan. Visualisasi data harus menyerang keseimbangan antara estetika dan kepraktisan. Perpustakaan carta dinamik menyediakan penyelesaian praktikal untuk visualisasi data, yang membolehkan kemas kini masa nyata, interaktiviti, dan mengurangkan masa pemuatan halaman untuk pengalaman pengguna yang lebih lancar. Terdapat pelbagai perpustakaan carta dinamik untuk dipilih, masing -masing dengan kebaikan dan keburukannya, termasuk HighCharts, Plotkit, D3.js, FusionCharts, Google Chart Tools, dan Flot. Perpustakaan ini berkisar dari mudah, bebas hingga kuat dan mahal. Perpustakaan carta dinamik dapat memproses sejumlah besar data dan menyokong pelbagai carta

13 Apr 2025
Sebab mengapa PHP adalah timbunan teknologi pilihan untuk banyak laman web termasuk kemudahan penggunaannya, sokongan komuniti yang kuat, dan penggunaan yang meluas. 1) Mudah dipelajari dan digunakan, sesuai untuk pemula. 2) Mempunyai komuniti pemaju yang besar dan sumber yang kaya. 3) Digunakan secara meluas dalam platform WordPress, Drupal dan lain -lain. 4) Mengintegrasikan dengan ketat dengan pelayan web untuk memudahkan penggunaan pembangunan.


Alat panas

Pustaka PHP untuk bekas suntikan kebergantungan
Pustaka PHP untuk bekas suntikan kebergantungan

Koleksi 50 algoritma PHP klasik yang sangat baik
Algoritma PHP klasik, pelajari idea yang sangat baik dan kembangkan pemikiran anda

Pustaka PHP kecil untuk mengoptimumkan imej
Pustaka PHP kecil untuk mengoptimumkan imej
