网站源码小偷（小偷网站）

551108330
发点提示性的代码，利用正则将连接地址分离出来。。。希望可以帮得上。<?php$str = <<<EOT<tr class="ccss"><td> <a href="/3240022.html">第一章禁忌之地</a><br /> <a href="/3240026.html">第五章破茧</a></td><td> <a href="/3240023.html">第二章异界</a><br /> <a href="/3240027.html">第六章盖寒</a></td><td> <a href="/3240024.html">第三章灵气室</a><br /> <a title="双魂问天第七章>第七章玄门之秘</a></td><td> <a href="/3240025.html">第四章转换体</a><br /> <a href="/3240029.html">第八章嫁衣</a></td></tr><tr class="ccss"><td> <a href="/3240030.html" >第九章丹田变</a><br /> <a href="/3240034.html">第十三章海怪的攻击</a></td><td> <ahref="/3240031.html">第十章双魂体</a><br /> <a href="/3240035.html">第十四章玄门灭</a></td><td> <a href="/3240032.html">第十一章功成</a><br /> <a href="/3240036.html">第十五章平衡</a></td><td> <ahref="/3240033.html">第十二章仙界乱</a></td></tr> EOT;preg_match_all('/<a(.*?)href=(.*?)>(.*?)<\/a>/i', $str, $m);print_r($m[2]);
2021-02-12 04:06:54

xiaozhang
纯HTML小偷程序,这个简单啊，直接获取页面的HTML，再用正则提取需要的区域，再详细提取出内容。一次提取不行，可以分步进行，下次我抓取某页面的 PHP 代码片段preg_match ('/(id="content_left".*?)<div id="content_right"/s', $strHtml, $content_left);preg_match('/(<div id="sentence_open.*?)<div class="clear/s', $content_left[1], $sentence_open);preg_match_all('/(<div class="tab_content".*?<\/ul><\/div>)/s', $sentence_open[1], $tab_contents);//目的是得到 <div class="tab_content"... 这一块，但是有重复，所以分步。foreach($tab_contents[1] as $sentence){ preg_match ('/<span class="font_black fontb font12">(.*?)<\/span>/s', $sentence, $out); //目的就是得到这个 $out}
2021-02-12 04:06:54