可按Ctrl+D收藏 蚂蚁资源网

蚂蚁资源网

网站源码小偷(小偷网站)

  • 全部评论(3)
  • 飞创科技
  • 如果是完全版, 那就不用了其他的采集了, 只要有人访问, 程序就自动获取数据的。
  • 2021-02-27 14:05:01
  • 551108330
  • 发点提示性的代码,利用正则将连接地址分离出来。。。希望可以帮得上。<?php$str = <<<EOT<tr class="ccss"><td> <a href="/3240022.html">第一章 禁忌之地</a><br /> <a href="/3240026.html">第五章 破茧</a></td><td> <a href="/3240023.html">第二章 异界</a><br /> <a href="/3240027.html">第六章 盖寒</a></td><td> <a href="/3240024.html">第三章 灵气室</a><br /> <a title="双魂问天第七章>第七章 玄门之秘</a></td><td> <a href="/3240025.html">第四章 转换体</a><br /> <a href="/3240029.html">第八章 嫁衣</a></td></tr><tr class="ccss"><td> <a href="/3240030.html" >第九章 丹田变</a><br /> <a href="/3240034.html">第十三章 海怪的攻击</a></td><td> <ahref="/3240031.html">第十章 双魂体</a><br /> <a href="/3240035.html">第十四章 玄门灭</a></td><td> <a href="/3240032.html">第十一章 功成</a><br /> <a href="/3240036.html">第十五章 平衡</a></td><td> <ahref="/3240033.html">第十二章 仙界乱</a></td></tr> EOT;preg_match_all('/<a(.*?)href=(.*?)>(.*?)<\/a>/i', $str, $m);print_r($m[2]);
  • 2021-02-12 04:06:54
  • xiaozhang
  • 纯HTML小偷程序,这个简单啊,直接获取页面的HTML,再用正则提取需要的区域,再详细提取出内容。一次提取不行,可以分步进行, 下次我抓取某页面的 PHP 代码片段preg_match ('/(id="content_left".*?)<div id="content_right"/s', $strHtml, $content_left);preg_match('/(<div id="sentence_open.*?)<div class="clear/s', $content_left[1], $sentence_open);preg_match_all('/(<div class="tab_content".*?<\/ul><\/div>)/s', $sentence_open[1], $tab_contents);//目的是得到 <div class="tab_content"... 这一块, 但是有重复,所以分步。foreach($tab_contents[1] as $sentence){ preg_match ('/<span class="font_black fontb font12">(.*?)<\/span>/s', $sentence, $out); //目的就是得到这个 $out}
  • 2021-02-12 04:06:54
  • 商品推荐