zoukankan      html  css  js  c++  java
  • .net处理页面的抓取数据

        //要抓取数据的页面路径
            string url = "http://www.scedu.net/banshi/used-car/lower-secondary-education/middle-school-list/1381286867.shtml";
           //将页面上的数据转换为HTML
            string html = Method.GetHtmlData(url);
            //   txt_content.Text = html;
            //找到需要的数据匹配正则  (?<name>.+?) 
            string regex = @"<font size=""2"">(?<name>.+?)</td>";
            Regex listRegex = new Regex(regex, RegexOptions.Multiline | RegexOptions.IgnoreCase);
            //得到匹配的数据集合
            MatchCollection mc = listRegex.Matches(html);
            JCheng.Model.School Model = new JCheng.Model.School();
            //将得到的字符串分割存进数组
            string[] str = txt_content.Text.Substring(0, txt_content.Text.Length - 1).Replace("<br />", "").Split(',');
            //数据每六个为一个model类 ,如下循环添加入库。
            for (int i = 0; i < str.Length - 1; )
            {
                Model.sName = str[i];
                Model.sAddress = str[i + 1];
                Model.sPostCode = str[i + 2];
                Model.sPhone = str[i + 3];
                Model.sEmail = str[i + 4];
                Model.sClass = str[i + 5];
                new JCheng.BLL.School().Add(Model);
                i += 6;
            }

    经常会遇到需要读取一些省市 区 县之类的信息, 数据庞大,手动输入效率太慢, 以上代码为读取的一个区县的所有中学信息的列表,抓取出来然后存到自己的数据库里面用, 很快很酷炫。 呵呵, 第一次做数据抓取, 代码肯定不是写的很好, 还是记录一下吧,希望对大家有所帮助。  

  • 相关阅读:
    iOS如何获取蓝牙Mac地址
    iOS完整App资源收集
    四月兄弟AprilBeacon
    图片360°旋转动画(
    图片圆角
    获取子字符串在元字符串中出现的所有位置
    调用系统震动 循环震动
    ibecon后台运行
    uiwebview 加载本地js、css、img,html从网站加载
    获取蓝牙mac地址
  • 原文地址:https://www.cnblogs.com/wr1437/p/3711733.html
Copyright © 2011-2022 走看看