zoukankan      html  css  js  c++  java
  • c# 网站生成静态页面

    在一些需要经常更新页面数据的网站中,一般访问量不是很大的都直接发布的是带后台代码,每次访问都是有数据库交互的。但是一旦访问量增加了,那么这些服务器开销变成本就要考虑进来了,像一些文章,后台编辑后,文章内容存入数据库,如果1000人访问,如果还是每次取数据库,那这1000次的io访问就显得比较大了,一个好的方法就是,文章确定之后,做成静态页面,而这个做的方法由程序来做,就是递归遍历整个网站,将网站内容都访问一遍,然后生成这些页面的静态文本页面,在将这些页面发布,这样对浏览者而言,他看到的还是同一个地址,同一份文章,只是这份是静态的而言。这样就提升了网站的效率节约了资源;

    下面附上一份C#遍历网站内容,然后生成内容页面代码;

    [csharp] view plain copy
     
    1. private ArrayList htmlCreatedList = new ArrayList();  
    2.   
    3.         /// <summary>  
    4.         /// 递归实现页面静态化功能  
    5.         /// </summary>  
    6.         /// <param name="urlString">要访问的页面链接地址</param>  
    7.         public void SaveHtmlCode(string urlString)  
    8.         {  
    9.             if (htmlCreatedList.Contains(urlString))  
    10.             {  
    11.                 return;  
    12.             }  
    13.             string htmlCode = GetHtmlCodeFromUrl(urlString);  
    14.             string htmlPath = urlString.ToPhysicalPath();  
    15.             string direcHtmlPath = Path.GetDirectoryName(htmlPath);  
    16.             if (!Directory.Exists(direcHtmlPath))  
    17.             {  
    18.                 Directory.CreateDirectory(direcHtmlPath);  
    19.             }  
    20.             File.WriteAllText(htmlPath, htmlCode);  
    21.             htmlCreatedList.Add(urlString);  
    22.             var urlList = GetUrlLinkFromHtmlCode(htmlCode);  
    23.             string urlTemp = string.Empty;  
    24.             foreach (string url in urlList)  
    25.             {  
    26.                 urlTemp = url;  
    27.                 urlTemp = Regex.Replace(urlTemp, "href\s*=\s*", "");  
    28.                 urlTemp = urlTemp.Replace(""", "");  
    29.                 urlTemp = urlTemp.Replace("\", "/");  
    30.                 urlTemp = WebConfigInfo.UrlPrefix + urlTemp;  
    31.                 SaveHtmlCode(urlTemp);  
    32.             }  
    33.         }  
    34.   
    35.         /// <summary>  
    36.         /// 通过HttpWebRequest页面链接的html代码  
    37.         /// </summary>  
    38.         /// <param name="urlString">页面链接地址</param>  
    39.         /// <returns>页面链接对应的html代码</returns>  
    40.         private string GetHtmlCodeFromUrl(string urlString)  
    41.         {  
    42.             HttpWebRequest hwRequest = (HttpWebRequest)WebRequest.Create(urlString);  
    43.             hwRequest.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";  
    44.             hwRequest.Accept = "*/*";  
    45.             hwRequest.KeepAlive = true;  
    46.             hwRequest.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");  
    47.             HttpWebResponse hwResponse = (HttpWebResponse)hwRequest.GetResponse();  
    48.             Stream streamResponse = hwResponse.GetResponseStream();  
    49.             StreamReader readerOfStream = new StreamReader(streamResponse, System.Text.Encoding.GetEncoding("utf-8"));  
    50.             string strHtml = readerOfStream.ReadToEnd();  
    51.             readerOfStream.Close();  
    52.             streamResponse.Close();  
    53.             hwResponse.Close();  
    54.             return strHtml;  
    55.         }  
    56.   
    57.         ///<summary>  
    58.         ///正则表达式匹配出html代码中的超链接  
    59.         ///</summary>  
    60.         ///<param name="htmlCode">要找出超链接的html代码</param>  
    61.         ///<returns></returns>  
    62.         private IEnumerable<string> GetUrlLinkFromHtmlCode(string htmlCode)  
    63.         {  
    64.             string strRegex = "href\s*=\s*(?:["'](?<1>[^"'.#:]*)["'])";  
    65.             Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);  
    66.             MatchCollection ms = r.Matches(htmlCode);  
    67.             IEnumerable<string> listUrl = from Match cc in ms select cc.ToString().Replace("&", "&");  
    68.             return listUrl.Distinct();  
    69.         }  
    70.     }  


    给string 扩展了一个方法。

    [csharp] view plain copy
     
      1. public static string ToPhysicalPath(this string urlString)  
      2.        {  
      3.            System.Uri uri = new System.Uri(urlString);  
      4.            string htmlPath = string.Format("{0}\Html\{1}\", System.Web.HttpContext.Current.Request.PhysicalApplicationPath, uri.AbsolutePath);  
      5.            string[] querys = uri.Query.Split(new char[] { '?', '&', '=' }, StringSplitOptions.RemoveEmptyEntries);  
      6.            htmlPath += string.Join(string.Empty, querys);  
      7.            htmlPath += querys.Length.Equals(0) ? "Index.html" : ".html";  
      8.            htmlPath = htmlPath.Replace("/", "\");  
      9.            htmlPath = htmlPath.Replace("\\", "\");  
      10.            return htmlPath;  
      11.        }  
  • 相关阅读:
    BZOJ.5068.友好的生物(思路)
    BZOJ.4695.最假女选手(线段树 Segment tree Beats!)
    BZOJ.4355.Play with sequence(线段树)
    BZOJ.4909.[SDOI2017]龙与地下城(正态分布 中心极限定理 FFT Simpson积分)
    HDU.4035.Maze(期望DP)
    Codeforces.1027F.Session in BSU(思路 并查集)
    BZOJ.4299.Codechef FRBSUM(主席树)
    UOJ.41.[清华集训2014]矩阵变换(稳定婚姻)
    BZOJ.5312.冒险(线段树)
    UOJ.386.[UNR #3]鸽子固定器(贪心 链表)
  • 原文地址:https://www.cnblogs.com/Alex80/p/6959116.html
Copyright © 2011-2022 走看看