0 Comments

分页分析

发布于:2012-11-20  |   作者:广州网站建设  |   已聚集:人围观
分页分析

当文章内容过多时通常都会采用分页的形式,这样保证了页面的整体美观。但是对于采集程序而言就需要多做一步分页的分析工作,程序根据不同的分页样式分析出上下页形式。分页分析的流程代码如下:广州网站建设


  1. <?php   
  2. if(preg_match ("/".分页规则."/is",$buffer, $ljregs))  
  3. {  
  4.     while ( $ljregs [1] != "" ) {  
  5.         $ljregs [1] = $string->gethttp ( $ljregs [1] );  
  6.         $buffer = @file_get_contents ( $ljregs [1] );  
  7.         //延时  
  8.         if (empty ( $buffer )) {  
  9.             if ($phpcurl_init == "yes") {  
  10.                 $ch = curl_init ();  
  11.                 $timeout = 10;                  //设置超时时间  
  12.                 curl_setopt ( $ch, CURLOPT_URL, $ljregs [1] );  
  13.                 curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, 1 );  
  14.                 curl_setopt ( $ch, CURLOPT_CONNECTTIMEOUT, $timeout );  
  15.                 $buffer = curl_exec ( $ch );    //执行句柄  
  16.                 curl_close ( $ch );             //关闭连接  
  17.             }  
  18.         }  
  19.         preg_match ( "/" . $body_rule . "/is", $buffer, $regs );//匹配规则  
  20.         $cont .= $regs [1];  
  21.     }  
  22. }  
  23. ?> 

【代码解读】

上述代码根据获得分页规则的不同,匹配不同的上下页形式,通过while()函数嵌套if()函数,对获得内容过程中的异常状态进行排除处理。

注意:在file_get_contents ()函数前使用@符号,可以抑制程序报错时的输出。广州网站设计

标签:
飞机