0 Comments

获取全部列出形式

发布于:2012-11-20  |   作者:广州网站建设  |   已聚集:人围观
获取全部列出形式

在执行以上的步骤后,程序已经获得了所需的内容信息。在对页面进行分页分析整理后全部列出形式,核心流程代码如下:

广州网站设计
  1. <?php   
  2. //正则匹配分页区域  
  3. preg_match ("/".分页规则."/is",$buffer, $regs2);  
  4. //查找每个分割里面的网址 for保证网址不重复  
  5. preg_match_all ("/".'<[^<>]*(href|value)=(\”|\’)?([^\’\”<>]*)(\”|\’)?[^<>]*>’.”/is”,$regs2[1],$regs3);  
  6. for($i = 0; $i <= count ( $regs3 [3] ); $i ++) {  
  7.     $gethttp = $string->gethttp ( $regs3 [3] [$i] );  
  8.     $buffer2 = @file_get_contents ( $gethttp );  
  9.     //延时  
  10.     if (empty ( $buffer2 )) {  
  11.         if ($phpcurl_init == yes) {  
  12.             $ch = curl_init ();  
  13.             $timeout = 10;                  //设置延时时间  
  14.             curl_setopt ( $ch, CURLOPT_URL, $regsar [$i] );  
  15.             curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, 1 );  
  16.             curl_setopt ( $ch, CURLOPT_CONNECTTIMEOUT, $timeout );  
  17.             $buffer2 = curl_exec ( $ch );   //执行句柄  
  18.             curl_close ( $ch );             //关闭连接  
  19.         }  
  20.     preg_match (”/”.内容规则.”/is”,$buffer2, $regss);  
  21.         $cont .= $regss [1];  
  22.     }  
  23. }  
  24. ?> 

【代码解读】

上述代码通过分页的规则匹配出分页列表,然后通过查找每个分割单元里的网址(for函数排除重复网址),从而获得全部列出形式的列表数组。广州网站建设

标签:
飞机