zoukankan      html  css  js  c++  java
  • 根据 //div/span标签爬取数据

    </head>
    <body>
    <div class="daohang-div">
        <div class="daohang-contaner">
            <div class="daohang-left">
                
                <div class="daohang-kuai">
                    <div class="daohang-org"><span>风险管理部</span></div>
                    <div class="daohang-links"><a href="http://111.11.1110.11117:9003/loan-web/4ALogon.jsp?tgt=TGT-677296-MIoJ1AGTPNezXl0ncMUCbEoJ4s4LyQk4NTHXccqCskHvrq4yZb-cas01.example.org" target="_blank">信贷系统</a> <span >|</span><a href="http://20.2.200.17:7003/loan-web/sqlogon.html?tgt=TGT-677296-MIoJ1AGTPNezXl0ncMUCbEoJ4s4LyQk4NTHXccqCskHvrq4yZb-cas01.example.org" target="_blank">信贷系统(授权码)</a> <span >|</span><div class="clear"></div></div><div class="daohang-links"><a href="http://130.164.755.1:9001/datamanage/IM00000001_4a_signIn.do?tgt=TGT-677296-MIoJ1AGTPNezXl0ncMUCbEoJ4s4LyQk4NTHXccqCskHvrq4yZb-cas01.example.org" target="_blank">外部数据管理平</a> <span >|</span><a href="/tailong/syslink/oaforward.jsp?idName=oics&tgt=TGT-677296-MIoJ1AGTPNezXl0ncMUCbEoJ4s4LyQk4NTHXccqCskHvrq4yZb-cas01.example.org" target="_blank">非现场监测系统</a> <span >|</span><div class="clear"></div></div><div class="daohang-links"><a href="/tailong/syslink/oaforward.jsp?idName=tlorm&tgt=TGT-677296-MIoJ1AGTPNezXl0ncMUCbEoJ4s4LyQk4NTHXccqCskHvrq4yZb-cas01.example.org" target="_blank">风险事件报送系统</a> <span >|</span><div class="clear"></div></div>
                </div>
                
                
                
    
    
    根据//div/span  取文本内容
    
    my $tree= HTML::TreeBuilder::XPath->new;
    $tree->parse_file("fh1.html");
    my @bumen = $tree->findvalues('//div/span');
    foreach (@bumen){
      print $_;
      print "
    ";
    };
    
    风险管理部
    国际业务部
    银行卡部
    信息运营部
    信息开发部
    财富管理部
    董事会办公室
    普惠金融部
    互联网金融部
    资金营运中心
    安全保卫部
    计划财务部
    办公室
    人力资源部
    运营管理部
    合规部
  • 相关阅读:
    easyui 后台系统引入富文本编辑器的使用
    easyui datagrid 表格动态隐藏部分列的展示
    java ArrayList源码分析(转载)
    propertychange方法
    CSS margin-top 属性
    easyui-textbox input输入框的一种取值方式
    jquery next()方法
    jquery children()方法
    一段简单的表格样式
    常用的排序算法的时间复杂度和空间复杂度
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13349031.html
Copyright © 2011-2022 走看看