欢迎来到258分享网,纯净的网络源码分享基地!

258资源分享网

全部作品
全部作品
网站源码
微信源码
素材特效
源码插件
视频教程
建站学院
热门搜索: 织梦  农业种植  农业  安全设置  官方
258资源分享 > 建站学院 > 织梦教程 > 修复DEDECMS5.5采集功能的一些bug

推荐下载

HTML5响应式自适应网咯设计

2020-05-12   浏览:740

高端HTML5响应式企业通用网

2020-05-06   浏览:521

html5响应式外贸网站英文版

2020-05-08   浏览:510

HTML5自适应律师工作室类网

2020-04-04   浏览:504

HTML5影视传媒文化公司类网

2020-05-12   浏览:500

修复DEDECMS5.5采集功能的一些bug

发布时间:2020-03-24  

修复1:将开始标签和结束标签以在网页源码中第一次出现的位置为准 

修改文件\include\dedecollection.class.php 

在成员函数GetHtmlArea中的 

$posend = @strpos($html,$areaRules[1],$posstart); 

语句前增加语句: 

$posstart=$posstart+strlen($areaRules[0]); 

将: 

return substr($html,$posstart+strlen($areaRules[0]),$posend-$posstart-strlen($areaRules[0])); 

替换为: 

return substr($html,$posstart,$posend-$posstart); 

 

修复2:下载图片时对图片的扩展名判断错误 

相同文件 

将 

 

eregi("\.gif",$v) 

替换为 

eregi("\.gif$",$url) 

 

eregi("\.png",$v) 

替换为 

eregi("\.png$",$url)

 

修复3:采集软件地址的正则表达式不准确 

\include\dedecollection.func.php 

将TurnLinkTag函数中 

preg_match_all("/<a(?:.*)href=['\"](.+?)['\"]([^>]+?)>(.+?)<\/a>/is",$body,$match);

换为: 

preg_match_all("/<a(?:[^\>]+?)href\\s*=\\s*[\'\"]?([^\\s\>\"\']+)([^\>]+?)>(.+?)<\/a>/is",$body,$match);

修复4:采集图片的正则表达式不准确

相同文件

preg_match_all('/src=[\'"](.+?)[\'"]/is',$body,$match);

 $ttx = '';

 if(is_array($match[1]) && count($match[1])>0)

 {

  for($i=0;isset($match[1][$i]);$i++)

  {

   $ttx .= "{dede:img text='' }".$match[1][$i]." {/dede:img}"."\r\n";

  }

 }

改为

$patten = "/<\\s*img\\s.*?src\\s*=\\s*([\"\\'])?(?(1)(.*?)\\1|([^\\s\\>\"\\']+))/isx";

    preg_match_all( $patten, $body, $images );

    $returnArray1 = $images[2];

    $returnArray2 = $images[3];

    foreach ( $returnArray1 as $key => $value )

    {

        if ( $value )

        {

            $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$value."{/dede:img}"."\r\n";

        }

        else

        {

            $ttx .= "{dede:img ddimg='$litpicname' text='图 ".($key+1)."'}".$returnArray2[$key]."{/dede:img}"."\r\n";

        }