php查词采集器

/**  * dict.class.php 采集百度词典翻译内容  *  * @copyright      (C) 2014 widuu  * @license       http://www.widuu.com  * @lastmodify     2014-2-15  */      header("content-type:text/html;charset=utf8"); class Dict{       private $word;           //显示的条数     private static $num = 10;       public function __construct(){}                 /**    * 公用返回百度采集数据的方法    * @param string 英文单词    * retun array(      *              symbol" => 音标      *              "pro"    => 发音      *              "example"=> 例句      *              "explain"=> 简明释义      *              "synonym"=> 同反义词      *              "phrase" => 短语数组      *          )    *      */    public function content($word){          $this -> word = $word;          $symbol = $this -> Pronounced();          $pro    = $this->getSay();          $example = $this -> getExample();          $explain = $this -> getExplain();          $synonym = $this -> getSynonym();          $phrase = $this -> getPhrase();          $result = array(                 "symbol" => $symbol,     //音标                 "pro"    => $pro,            //发音                 "example"=> $example,        //例句                 "explain"=> $explain,        //简明释义                 "synonym"=> $synonym,        //同反义词                 "phrase" => $phrase      //短语数组             );         return $result;     }         /**    * 远程获取百度翻译内容    * get function curl    * retun string    *      */      private function getContent(){         $useragent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0";         $ch = curl_init();         $url = "http://dict.baidu.com/s?wd=".$this->word;         curl_setopt($ch, CURLOPT_URL, $url);         curl_setopt($ch, CURLOPT_USERAGENT,$useragent);         curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);          curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);          curl_setopt($ch, CURLOPT_HTTPGET, 1);         curl_setopt($ch, CURLOPT_AUTOREFERER,1);         curl_setopt($ch, CURLOPT_HEADER, 0);          curl_setopt($ch, CURLOPT_TIMEOUT, 30);         $result = curl_exec($ch);         if (curl_errno($curl)) {             echo 'Errno'.curl_error($curl);         }         curl_close($ch);         return $result;     }         /**    * 获取百度翻译发音    * retun array(英,美)    *      */      private function Pronounced(){         $data = $this -> getContent();         preg_match_all("/\"EN\-US\"\>(.*)\<\/b\>/Ui",$data,$pronounced);         return array(             'en' => $pronounced[1][0],             'us' => $pronounced[1][1]         );     }       /**      * 获取百度翻译发音      * return array(英,美)      *      */      private function getSay(){         $data = $this -> getContent();         preg_match_all("/url=\"(.*)\"/Ui",$data,$pronounced);         return array(             'en' => $pronounced[1][0],             'us' => $pronounced[1][1]         );       }       /**    * 获取百度翻译例句    * return array() 多维数组 例句    *       */      private function getExample(){         $str = "";         $data = $this -> getContent();         preg_match_all("/var example_data = (.*)\]\;/Us",$data,$example);       $data1 = "[[[".ltrim($example[1][0],"[");       $data2 = explode("[[[",$data1);       $num = count(array_filter($data2));         foreach($data2 as $key => $value){             $data3 = explode("[[","[[".$value);             foreach ($data3 as $k => $v) {                 preg_match_all("/\[\"(.*)\",/Us","[".$v, $match);                 if(!empty($match[1])){                     $str .= implode($match[1]," ")."@";                 }             }         }         $data4 = trim($str,"@");         $data5 = explode("@", $data4);         $result = array_chunk($data5, 2);         return $result;     }       /**    * 获取简明释义    * return array (x => "词性",b => "附属")    *       **/      private function getExplain(){         $data = $this -> getContent();         preg_match_all("/id\=\"en\-simple\-means\"\>(.*)\/Us",$data,$explain);         $r_data = $explain[1][0];         preg_match_all("/\\(?P.*)\<\/strong\>\(?P.*)\<\/span\>\<\/p\>/Us", $r_data, $a_data);         preg_match_all("/\(?P[^\>]+)\:\(?P.*)\<\/a\>\<\/span\>/Us", $r_data, $b_data);                   $result = array();         foreach ($a_data["adj"] as $key => $value) {             $result[$value] = $a_data["name"][$key];         }                   $word_b = array();         foreach ($b_data["tag"] as $key => $value) {             $word_b[$value] = strip_tags($b_data["word"][$key]);         }                   $result_data = array("x" => $result,"b" => $word_b);           return $result_data;     }         /**    * 获取同义词    * return array(0 => "同义词", 1 => "反义词") 一般为多维数组    *       */      private function getSynonym(){         $data = $this -> getContent();         preg_match_all("/id=\"en\-syn\-ant\"\>(.*)/Us",$data,$synonym);         $content = $synonym[1][0];         $data1 = explode("", $content);         $result = array();         $data2 = array();         foreach ($data1 as $key => $value) {             preg_match_all("/\(?P.*)\ \;\<\/strong\>\<\/div\>\\(?.*)\<\/ul\>/Us", $value, $r_data);             $data2[$key]["adj"] = $r_data["adj"];             $data2[$key]["content"] = $r_data["content"];         }           foreach ($data2 as $key => $value) {             foreach ($value["content"] as $k => $v) {                 if(!empty($v)){                     preg_match_all("/\\(?P.*)\<\/p\>(?P<value>.*)\<\/li>/Us", $v, $v_data);                     foreach ($v_data['title'] as $m => $d) {                         $data = strip_tags(preg_replace("<</a>>"," ", $v_data["value"][$m]));                         $result[$key][$value["adj"][$k]][$d] = $data;                     }                 }             }         }         return $result;     }       /**    * 获取短语词组    * return array (key => value) 一维或者多维数组    *       */      private function getPhrase(){         $num = self::$num;         $data = $this -> getContent();         preg_match_all("/id=\"en\-phrase\"\>(.*)\<div class\=\"source\"\>/Us",$data,$phrase);         $data = explode("</dd>",$phrase[1][0]);         $data1 = array_slice($data,0,$num);         $result = array();         foreach ($data1 as $key => $value) {             $data2 = explode("</p>", $value);             $n = count($data2);             if($n<=3){                 $result[str_replace(" ","",strip_tags($data2[0]))] = strip_tags($data2[1]);             }else{                 $data3 = array_slice($data2,0,$n-1);                 $data4 = array_slice($data2,0,2);                 $res = array_diff($data3,$data4);                 $data5 = array_chunk($res,2);                 $key_value = trim(str_replace(" ","",strip_tags($data4[0])));                 $result[$key_value] = strip_tags($data4[1]);                 foreach ($data5 as $key => $value) {                     foreach ($value as $k => $v) {                         $value[$k] = strip_tags($v);                     }                     $array = array($result[$key_value],$value);                     if (array_key_exists($key_value, $result)){                         $result[$key_value] = $array;                     }                 }                               }         }         return $result;     }       /**      * 将数组转换为字符串      *      * @param  array  $data    数组      * @param  bool  $isformdata 如果为0,则不使用new_stripslashes处理,可选参数,默认为1      * @return  string 返回字符串,如果,data为空,则返回空      */    private function array2string($data, $isformdata = 1) {       if($data == '') return '';       if($isformdata) $data = $this->new_stripslashes($data);       return addslashes(var_export($data, TRUE));     }       /**      * 返回经stripslashes处理过的字符串或数组      * @param $string 需要处理的字符串或数组codego.net/25/1/1/      * @return mixed      */    private function new_stripslashes($string) {       if(!is_array($string)) return stripslashes($string);       foreach($string as $key => $val) $string[$key] = $this->new_stripslashes($val);       return $string;     }   }   // $word = new dict("express"); // $word ->content();</p><p><img src="/upload/ad_content/xuanchuantu-10.jpg"></p><p><a href="https://www.cdcxhl.com/" target="_blank">创新互联建站</a>专注于嘉鱼网站建设服务及定制,我们拥有丰富的企业做网站经验。 热诚为您提供嘉鱼营销型网站建设,嘉鱼网站制作、嘉鱼网页设计、嘉鱼网站官网定制、<a href="https://www.cdcxhl.com/xiaochengx.html" target="_blank">小程序设计</a>服务,打造嘉鱼网络公司原创品牌,更为您提供<a href="https://www.cdcxhl.com/paiming/jiayu.html" target="_blank">嘉鱼网站排名</a>全网营销落地服务。</p> <br> 网页名称:php查词采集器 <br> 当前路径:<a href="http://csdahua.cn/article/pihpjo.html">http://csdahua.cn/article/pihpjo.html</a> </div> <div class="view-qrocde cl"> <div class="m z"><img src="/Public/Home/images/ew.jpg"/></div> <div class="text"> <h6>扫二维码与项目经理沟通</h6> <p>我们在微信上24小时期待你的声音</p> <p>解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流</p> </div> </div> <div class="othernews cl"> <h3>其他资讯</h3> <ul> <li><a href="/article/eiioeg.html">自媒体代运营怎么收费,如何选择靠谱的自媒体代运营公司</a></li><li><a href="/article/eiioee.html">杰哥分享短视频运营技巧</a></li><li><a href="/article/eiioip.html">如何去衡量一个好网站建设的标准</a></li><li><a href="/article/eiioeh.html">合肥短视频运营基地</a></li><li><a href="/article/eiiogj.html">短视频代运营费用明细一览,短视频代运营介绍包含哪些内容</a></li> </ul> </div> </div> </div> <div class="sidebar"> <div class="tuijian"> <a href="#"> <h2 class="cl"><span>行业动态</span></h2> <h3>企业网站建设的重要性!</h3> <p>现在虽然是移动互联网时代,但企业网站依然重要,包含PC站点,移动站。可以说企业网站关系企业的未来发展和前途,尤其对中小企业更是如此,一些中小企业老板,对自己的名片很在乎,因为这是个门面。...</p> </a> </div> <div class="ser sidesub"> <h2>服务项目</h2> <ul class="ebox"> <li class="sub sub-1"> <div> <h3>网站建设</h3> <p></p> <a class="btn" href="/serve/website/">查看详情</a> </div> </li> <li class="sub sub-1"> <div> <h3>移动端/APP</h3> <p></p> <a class="btn" href="/serve/moblie/">查看详情</a> </div> </li> <li class="sub sub-1"> <div> <h3>微信/小程序</h3> <p></p> <a class="btn" href="/serve/small/">查看详情</a> </div> </li> <li class="sub sub-1"> <div> <h3>技术支持</h3> <p></p> <a class="btn" href="/serve/tech/">查看详情</a> </div> </li> <li class="sub sub-1"> <div> <h3>其它服务</h3> <p></p> <a class="btn" href="/serve/othe/">查看详情</a> </div> </li> <li class="sub sub-5"> <div> <h3>更多服务项目</h3> <p> <a>用我们的专业和诚信赢得您的信赖,从PC到移动互联网均有您想要的服务!</a></p> <a class="btn" href="/serve/">获取更多</a> </div> </li> </ul> </div> <div class="contact" id="fix"> <h2 class="cl"> <span>联系吧</span> <a href="https://map.baidu.com/" class="ditu" rel="nofollow" target="_blank">在百度地图上找到我们</a> </h2> <h3>电话:13518219792</h3> <p>如遇占线或暂未接听请拨:136xxx98888</p> <div class="qq"> <a href="//wpa.qq.com/msgrd?v=3&uin=244261566&site=qq&menu=yes" rel="nofollow" target="_blank">业务咨询</a> <a href="//wpa.qq.com/msgrd?v=3&uin=244261566&site=qq&menu=yes" rel="nofollow" target="_blank">技术咨询</a> <a href="//wpa.qq.com/msgrd?v=3&uin=244261566&site=qq&menu=yes" rel="nofollow" target="_blank">售后服务</a> </div> </div> </div> <script> //固定滚动 (function () { var oDiv = document.getElementById("fix"); var H = 120, iE6; var Y = oDiv; while (Y) { H += Y.offsetTop; Y = Y.offsetParent }; iE6 = window.ActiveXObject && !window.XMLHttpRequest; if (!iE6) { window.onscroll = function () { var s = document.body.scrollTop || document.documentElement.scrollTop; if (s > H) { oDiv.className = "contact fixed"; if (iE6) { oDiv.style.top = (s - H) + "px"; } } else { oDiv.className = "contact "; } }; } })(); </script> </div> <div class="footer"> <div class="wp"> <div class="wpss cl"> <dl class="about"> <dt>网站制作</dt> <dd><a href="http://www.cdxwcx.cn/bj/" target="_blank" title="网站制作价格">网站制作价格</a></dd><dd><a href="http://www.wjwzjz.com/" target="_blank" title="温江网站制作">温江网站制作</a></dd><dd><a href="http://www.cxhlcq.com/zhizuo/" target="_blank" title="重庆网站制作">重庆网站制作</a></dd><dd><a href="http://www.wjzwz.com/" target="_blank" title="温江网站制作">温江网站制作</a></dd> </dl> <dl class="about"> <dt>网站建设</dt> <dd><a href="http://m.cdcxhl.cn/qiye/" target="_blank" title="成都网站建设公司">成都网站建设公司</a></dd><dd><a href="http://www.myzitong.cn/" target="_blank" title="绵阳梓潼网站建设">绵阳梓潼网站建设</a></dd><dd><a href="https://www.cdcxhl.com/h5.html" target="_blank" title="成都h5网站建设">成都h5网站建设</a></dd><dd><a href="http://chengdu.cdcxhl.cn/qiye/" target="_blank" title="企业网站建设公司">企业网站建设公司</a></dd> </dl> <dl class="about"> <dt>网站设计</dt> <dd><a href="http://www.kswsj.com/" target="_blank" title="成都网站设计">成都网站设计</a></dd><dd><a href="http://www.gawzjs.com/" target="_blank" title="广安网站设计">广安网站设计</a></dd><dd><a href="http://chengdu.cdcxhl.com/" target="_blank" title="成都网站设计">成都网站设计</a></dd><dd><a href="http://www.4006tel.net/vision/website.html" target="_blank" title="网站设计">网站设计</a></dd> </dl> <dl class="contact"> <dt>联系我们</dt> <dd>电话:13518219792</dd> <dd>邮箱:631063699@qq.com</dd> <dd>地址:成都青羊区锦天国际1002号</dd> <dd>网址:www.csdahua.cn</dd> </dl> <dl class="flow"> <dt></dt> <div class="ma cl"> <div class="m"> <img src="/Public/Home/images/ew.jpg" /> <p>微信二维码</p> </div> </div> </dl> </div> </div> <div class="footer-link wp"> <ul class="wpss cl"> <li class="fisrt">友情链接</li> <li><a href="http://www.lzgcyd.com/" title="研学实践" target="_blank">研学实践</a></li><li><a href="http://www.abwzjs.com/" title="阿坝网站建设" target="_blank">阿坝网站建设</a></li><li><a href="http://www.shganxi.cn/" title="簇桥薇薇新娘" target="_blank">簇桥薇薇新娘</a></li><li><a href="http://www.cdxwcx.cn/tuoguan/neijiang.html" title="内江托管服务器" target="_blank">内江托管服务器</a></li><li><a href="http://www.cxjianzhan.cn/" title="网站建设开发" target="_blank">网站建设开发</a></li><li><a href="https://www.cdxwcx.com/city/suining/" title="遂宁网站建设" target="_blank">遂宁网站建设</a></li><li><a href="http://www.gzjike.cn/" title="公路钻孔机" target="_blank">公路钻孔机</a></li><li><a href="http://m.cdxwcx.com/weixin.html" title="成都微信开发" target="_blank">成都微信开发</a></li><li><a href="http://seo.cdkjz.cn/tuiguang/" title="成都网络推广公司" target="_blank">成都网络推广公司</a></li><li><a href="http://www.bzwzjz.com/" title="广东网站设计" target="_blank">广东网站设计</a></li> </ul> </div> </div> <div class="bot-footer"> <div class="wp"> <p class="wpss"> <em>Copyright © 2002-2023 www.csdahua.cn 快上网建站品牌 QQ:244261566 版权所有</em> <em>备案号:<a href="http://beian.miit.gov.cn/" rel="external nofollow">蜀ICP备19037934号</a></em> </p> <p class="wpss" style="line-height:30px !important;"> </p> </div> </div> <div class="footer-kefu"> <ul> <li class="qq"><a href="https://wpa.qq.com/msgrd?v=3&uin=244261566&site=qq&menu=yes"><em></em>在线咨询</a> </li> <li class="tel"><a href="tel:13518219792" target="_blank"><em></em>13518219792</a></li> <li class="wx"> <em></em> <div class="code"> <img src="/Public/Home/images/ew.jpg" /> <p>微信二维码</p> </div> </li> <li class="m"> <em></em> <div class="code"> <img src="/Public/Home/images/ew.jpg" /> <p>移动版官网</p> </div> </li> <li class="top"><em></em></li> </ul> </div> <script src="/Public/Home/js/all.js"></script> </body> </html> <script> $(".cont img").each(function(){ var src = $(this).attr("src"); //获取图片地址 var str=new RegExp("http"); var result=str.test(src); if(result==false){ var url = "https://www.cdcxhl.com"+src; //绝对路径 $(this).attr("src",url); } }); window.onload=function(){ document.oncontextmenu=function(){ return false; } } </script>