zoukankan      html  css  js  c++  java
  • 求一个字符串中连续出现的次数最多的子串

    求一个字符串中连续出现的次数最多的子串。例如字符串“abababc”,最多连续出现的为ab,连续出现三次。要和求一个字符串中的最长重复子串区分开来,还是上面的字符串,那么最长的重复子串为abab。两个题目的解法有些类似,都用到了后缀数组这个数据结构。求一个字符串中连续出现的次数最多的子串,首先生成后缀数组例如上面的字符串为:
    abababc
    bababc
    ababc
    babc
    abc
    bc
    c
    可以看出第一个后缀数组和第三个后缀数组的起始都为ab,第5个后缀数组也为ab。可以看出规律来,一个字符串s,如果第一次出现在后缀数组i的前面,那么如果它重复出现,下一次出现应该在第i+len(s)个后缀数组的前面。这个规律也不难看出。那么从头到尾按照这个规律搜索下不难得出结果。下面是代码:

     1 #include <iostream>
     2 using namespace std;
     3 
     4 int con_sub(char *str, char **ret);
     5 
     6 int main()
     7 {
     8         char str[] = "abcabcabcabcabcabbbb";
     9         char *ret = NULL;
    10         int time = con_sub(str, &ret);
    11         printf("%s occuers %d times
    ", ret, time);
    12         return 0;
    13 }
    14 
    15 int con_sub(char *str, char **ret)
    16 {
    17         int max_time = 0;//连续出现的最多次数
    18         int ret_len = 0;//连续出现的字符串的长度
    19         char *addr = NULL;//连续出现字符串的起始地址
    20 
    21         int len = strlen(str);
    22         char **a = (char **)malloc(sizeof(char *)*len);
    23         //生成后缀数组
    24         for(int i=0; i<len; i++)
    25                 a[i] = &str[i];
    26 
    27         //重复字符串的长度范围为1到(len+1)/2
    28         for(int i=1; i<=(len+1)/2; i++)
    29         {
    30                 //当重复的字符串长度为i的时候,如果是连续出现的,那么第j和第j+i个后缀数组前面为重复的字符串
    31                 for(int j=0; j+i<=len-1; j+=i)
    32                 {
    33                         int k = j;
    34                         int temp_time = 1;
    35                         while(k+i <= len-1 && strncmp(a[k], a[k+i], i) == 0)
    36                         {
    37                                 temp_time++;
    38                                 k += i;
    39                         }
    40                         if(temp_time > max_time)
    41                         {
    42                                 max_time = temp_time;
    43                                 ret_len = i;
    44                                 addr = a[k];
    45                         }
    46                 }
    47         }
    48         *ret = new char[len+1];
    49         strncpy(*ret, addr, ret_len);
    50         return max_time;
    51 }

     注意:这里有一个小技巧,加入字符串中存在出现次数相同的子串,如何优先选择更长的字符串作为最终的结果?可以调整子串的长度为从大到小。

  • 相关阅读:
    IOS使用 swizzle 解决一些错误
    Objective-C的hook方案(一): Method Swizzling
    jmeter录制Chrome浏览器https请求进行压力测试
    FIDDLER导出JMX文件,JMETER打开导出的JMX报错的解决方式
    Fiddler的PC端与手机端抓包配置步骤
    初识中间件之消息队列--提高服务性能
    Python虚拟环境配置应用
    jmeter三种阶梯式加压
    JMETER-正则表达式提取与查看变量是否提取正确
    jmeter的线程数,并发用户数,TPS,RPS 关系解说
  • 原文地址:https://www.cnblogs.com/shutter/p/4720341.html
Copyright © 2011-2022 走看看