zoukankan      html  css  js  c++  java
  • 计算百度关键词出现密度

            /// <summary>
            /// 获取百度关键词出现的密度
            /// </summary>
            /// <param name="keyWord">标题、关键词</param>
            /// <returns>如:10 (满为100)</returns>
            public static int GetBaiDuKeywordDensity(string keyWord)
            {
                //获取百度源码
                string HtmlCode = GetHttpData("http://www.baidu.com/s?wd=" + keyWord);
                //百度搜索出来的标题列表
                List<string> listTitle = new List<string>();
                //列表正则匹配规则
                string strrex = @"<h3[sS]*?>(?<url>.*?)</h3>";
    
                //进行正则匹配
                MatchCollection mc = Regex.Matches(HtmlCode, strrex);
                foreach (Match m in mc)
                {
                    string content =HtmlDecodes(Environment.NewLine + m.Groups["url"].Value);
                 content=   ReplaceHtml(content);
                    listTitle.Add(RemoveHTML(content));
                }
    
                //只匹配第一条
                for (int i = 0; i < listTitle.Count; i++)
                {
                    return Convert.ToInt32(Similarity(listTitle[0], keyWord) * 100);
                }
    
                //相似度列表
               // List<double> listSimilarity = new List<double>();
                //进行相似度计算
                //foreach (string strTitle in listTitle)
                //{
                //    listSimilarity.Add(Similarity(strTitle, keyWord));
                //}
    
                //进行密度计算
                //int dev = Convert.ToInt32(stdev(listSimilarity) * 100);
                //if (dev<=0 || dev > 100)
                //{
                //    dev = Convert.ToInt32(average(listSimilarity) * 100);
                //}
                //return dev ;
                return 0;
            }
    

      

  • 相关阅读:
    Codeforces Round #401 (Div. 2)【A,B,C,D】
    HDU2874【LCA(模板)】
    ZOJ2898【折半搜索】
    zoj2901【DP·二进制优化】
    萌新笔记之鸽巢原理及其应用
    codeforces 547B【单调栈】
    Codeforces631C【栈维护+瞎搞】
    每天一节组合数学
    HDU 1506【单调栈】
    HDU 3410【单调栈】
  • 原文地址:https://www.cnblogs.com/Aamir-Ye/p/4561201.html
Copyright © 2011-2022 走看看