zoukankan      html  css  js  c++  java
  • 获取网页中的部分内容,新闻标题和内容

    新闻信息采集

    <?php
    function canshujiequ($yuanma,$canshustr,$mubiao){
                if($yuanma=='')return array();
                
                if(strpos($canshustr,'[参数]')==false||strpos($mubiao,'[参数1]')==false)
                {
                    echo '参数或组合字符串格式不对';
                    return array();
                }
                $chaxunwz=0;
                $canshuarr=array();
                $canshuarr=explode('[参数]',$canshustr);
                $len1=count($canshuarr);
                $pipeiarr=array();
                $tpfarr=array();
                $qianks=0;
                $qianjs=0;
                $nowks=0;
                $nowjs=0;
                $end=0;
                $num=0;
                while(($end==0)&&($chaxunwz<strlen($yuanma))){
                        $mubiaofuben=$mubiao;
                        $feikong=0;
                        for($i=0;($end==0)&&($i<$len1);$i++){
                                if($canshuarr[$i]=='')continue;
                                $feikong++;
                                $tpfarr=explode('(*)',$canshuarr[$i]);
                                $len2=count($tpfarr);
                                $feikongnum=0;
                                for($j=0;($j<$len2)&&($end==0);$j++){
                                        if($tpfarr[$j]=='')continue;
                                        $feikongnum++;
                                        if($chaxunwz>=strlen($yuanma)){$end=1;break;}
                                        if(($pipeiwz=strpos($yuanma,$tpfarr[$j],$chaxunwz))!==false){
                                        $chaxunwz=$pipeiwz+strlen($tpfarr[$j]);
                                        if($feikongnum==1)$nowks=$pipeiwz;
                                        $nowjs=$chaxunwz;
    
    
                                        }
                                        else{$end=1;break;}
                                }
                                if($end==0){
                                        if($feikong>1){
                                            $str=substr($yuanma,$qianjs,$nowks-$qianjs);
                                            $mubiaofuben=str_replace('[参数'.($feikong-1).']',$str,$mubiaofuben);
                                        }
                                        $qianks=$nowks;
                                        $qianjs=$nowjs;
                                }else{
                                    break;
                                }
                        }
                        if($end==0){
                            $pipeiarr[]=$mubiaofuben;
                            $num++;
                        }
                }
                return $pipeiarr;
    }
    $source=file_get_contents("http://news.ef360.com/lady/");
    //获取数据源(【url】)
    $a='<ul class="ul_text_1 f14 arr1" style="padding:15px 0;">[参数]</ul>';
    $b="&nbsp;[参数1]&nbsp";
    $jieguo1=canshujiequ($source,$a,$b); 
    
    ?>
  • 相关阅读:
    5.1点击4个按钮显示相应的div
    4.1邮箱的全选,全不选,反选
    3.1点击3个按钮变宽变高变色
    2.4点击按钮填色
    2.3点击菜单显示div再点击就隐藏
    2.2 点击按钮改变文本框中的文字内容
    linux系统编程视频 百度网盘下载
    Linux网络编程视频 百度网盘
    Sage Crm 权限原理分析
    Sage CRM 平衡区域树结构
  • 原文地址:https://www.cnblogs.com/bafeiyu/p/2951196.html
Copyright © 2011-2022 走看看