zoukankan      html  css  js  c++  java
  • 数据采集器

    下载
    数据采集器,其实很简单,没有想像的那么复杂。
    1使用HttpWebRequest或者WebClient获取数据
    2 使用正则表达式获取你想要的数据
    现在将相关代码贴出来

    public static string GetHtml(string begin, string end, string content)
            {
                Regex reg = new Regex(begin + "((.*?\\n?)*?)" + end);
                Match match = reg.Match(content);

                if (match != Match.Empty)
                {
                    //content = content.Replace(match.Groups[1].ToString(), string.Empty);
                    return match.Groups[1].ToString();
                }
                else
                {
                    return string.Empty;
                }
            }
            public static StringCollection GetHtmls(string begin, string end, string content)
            {
                Regex reg = new Regex(begin + "((.*?\\n?)*?)" + end);
                MatchCollection  matches = reg.Matches(content);
                StringCollection list=new StringCollection();
                foreach(Match match in matches)           
                {
                    if (match != Match.Empty)
                    {
                        list.Add(match.Value);
                    }
                }
                return list;
            }

    示例:获取代理器Ip下载
     

  • 相关阅读:
    数据库
    数据库
    数据库
    数据库
    数据库
    数据库
    windows
    LeetCode : Word Pattern
    LeetCode : Perfect Number
    LeetCode : Minimum Depth of Binary Tree
  • 原文地址:https://www.cnblogs.com/rosanshao/p/1050241.html
Copyright © 2011-2022 走看看