zoukankan      html  css  js  c++  java
  • 数据采集器

    下载
    数据采集器,其实很简单,没有想像的那么复杂。
    1使用HttpWebRequest或者WebClient获取数据
    2 使用正则表达式获取你想要的数据
    现在将相关代码贴出来

    public static string GetHtml(string begin, string end, string content)
            {
                Regex reg = new Regex(begin + "((.*?\\n?)*?)" + end);
                Match match = reg.Match(content);

                if (match != Match.Empty)
                {
                    //content = content.Replace(match.Groups[1].ToString(), string.Empty);
                    return match.Groups[1].ToString();
                }
                else
                {
                    return string.Empty;
                }
            }
            public static StringCollection GetHtmls(string begin, string end, string content)
            {
                Regex reg = new Regex(begin + "((.*?\\n?)*?)" + end);
                MatchCollection  matches = reg.Matches(content);
                StringCollection list=new StringCollection();
                foreach(Match match in matches)           
                {
                    if (match != Match.Empty)
                    {
                        list.Add(match.Value);
                    }
                }
                return list;
            }

    示例:获取代理器Ip下载
     

  • 相关阅读:
    Docker安装以及运行第一个HelloWorld
    logstash-配置文件详解
    oh my zsh 常用插件
    Linux之Shell基本命令
    Linux的基本命令
    Vue
    rest_framwork之认证组件,权限组件,频率组件
    rest_framwork之序列化组件
    rest_framwork之APIView
    中间件
  • 原文地址:https://www.cnblogs.com/rosanshao/p/1050241.html
Copyright © 2011-2022 走看看