zoukankan      html  css  js  c++  java
  • 给一个长度为n的字符串,找出长度为m的最小字典子序列【单调栈】

    一个大大的分割线,如果这个傻逼题没有被作为某某复赛的签到题,可能我一会都一直傻逼下去了。
    【2019计蒜之道复赛——星云系统】
    题目是,给出一个长度为n(1<n<5e6)的只有小写字母的字符串,然后找出一个长度为m的最小字典子序列
    更新: 这是一道简单得要死掉的单调栈裸题,为什么没想到呢,因为思路是,利用单调栈尽量求取结果字符串的最优值,也就说结果字符串在理想情况下是递增的,但是非理想情况是什么呢?因为有必须限定k个字母存在,因此被删掉的字母数量为len-k个字符,当被单调栈弹出的字符数量达到n-k个时,剩余的字符【即单调栈中的递增字符以及未遍历到的剩余字符】就组成了最小字典序ans。

    散了散了。。。时间复杂度是线性扫描的O(n)
    想想也是,题面都这个数量级了,还要啥常数。线性就完了。

    #include<bits/stdc++.h>
    #define M(a,b) memset(a,b,sizeof a)
    #define LL long long
    using namespace std;
    const int maxn=5000007;
    char a[maxn];
    stack<char>q;
    int n,m;
    int main()
    {
        while(!q.empty())q.pop();
        scanf("%s %d",a,&m);
        n=strlen(a);
        int cnt=0;
        int flag=n;
        for(int i=0; i<n; i++)
        {
            if(q.empty())q.push(a[i]);
            else
            {
                if(a[i]>q.top())q.push(a[i]);
                else
                {
                    while(!q.empty()&&q.top()>a[i])
                    {
                        q.pop();
                        cnt++;
                        if(cnt>=n-m)
                        {
                            flag=i;
                            break;
                        }
                    }
                    q.push(a[i]);
                }
            }
            if(cnt>=n-m)break;
        }
        string ans="";
        for(int i=n-1;i>flag;i--)ans+=a[i];
        while(!q.empty())ans+=q.top(),q.pop();
        reverse(ans.begin(),ans.end());
        ans=ans.substr(0,m);
        cout<<ans<<"
    ";
    }
    

    头条一面挂了,除了自己菜,数据结构和基础知识理解不够深刻外,还有就是面试时紧张得肚子疼到抽搐。。。可能是绝症了

    言归正传,面试官本来想随便出个签到题玩一下开个场,结果被我紧张的崩了。
    结束面试之后冷静下来认真想了下并不难

    题目是,给出一个长度为n(1<n<10000)的只有小写字母的字符串,然后找出一个长度为m的最小字典子序列
    如 orange
    当m=3时,输出结果age

    若borange,且长度为3时,同样输出age

    面试的时候脑子一团浆糊,想到了标号和排序,直接被反例否定了。

    如果用最暴力的思想,找到n个字符里字典序最小且位序小于等于m的字母,然后砍去这个字母之前的字母,在剩余的字母中又找一个字典序最小的字母,这样一直找m个就好了。
    唯一要考虑的条件就是,这样不断贪心取最小的要求是,要保证取了某个字母后,剩余待选串中的字符个数要大于等于m。

    于是想到一个 复杂度为O(n*m) 的做法,每次遍历n字符串,查找符合条件的字符,再从头扫一遍找下一个字符。从头扫的原因是,当找到了一个字符,比如b,无法判断是否后面的字符是否存在一个字典序小于b的字符,所以仍要遍历完整个串才能得到一个最小值。这样是不可取的,必须进行优化。

    那么做一个预处理,首先26个vector存储每个字母出现位置的下标,O(n)遍历字符串,push进每个字母出现下标,因为是顺序遍历,所以每个vector都是有序的。
    然后遍历m次这26个vector,找出第一个字母的出现位置,满足<=n-(m-i)+1,说明存在一个较小的字母符合筛选条件,并且不用关心该位置剩余字符串是否存在比其更小的字母,如果存在,在字典序遍历其他vector就应该找到了。在ans中填入这个字母,然后从a字母开始继续查找下标大于上一个填入ans中字母下标的符合条件的字母。这个在有序vector中查找位置直接用二分即可。
    最后时间复杂度O(26*m),空间复杂度O(n)
    代码如下:

    #include<bits/stdc++.h>
    using namespace std;
    char a[10080];
    vector<int>pos[26];
    int main()
    {
        int n,m;
        char ans[10080];
        while(scanf("%d",&n)!=EOF)
        {
            for(int i=0;i<=26;i++)pos[i].clear();
            scanf("%d",&m);
            scanf("%s",a);
            for(int i=0; i<n; i++) pos[a[i]-'a'].push_back(i+1);
            memset(ans,0,sizeof ans);
            int tmp=0;
            for(int i=0; i<m; i++)
            {
                for(int j=0; j<26; j++)
                {
                    if(pos[j].size()!=0)
                    {
                        int num=pos[j][upper_bound(pos[j].begin(),pos[j].end(),tmp)-pos[j].begin()];
                        if(num>tmp&&num<=n-m+i+1)
                        {
                            tmp=num;
                            ans[i]='a'+j;
                            break;
                        }
                    }
                }
            }
            printf("%s
    ",ans);
        }
    }
    
  • 相关阅读:
    20155213 2016-2017-2 《Java程序设计》第五周学习总结
    20155213 2016-2017-2《Java程序设计》第四周学习总结
    20155213 2016-2017-2《Java程序设计》第三周学习总结
    20155213 2016-2017-2 《Java程序设计》第二周学习总结
    20145109《Java程序设计》第一周学习总结
    《暗时间》读书笔记(三)
    调查问卷
    《Python学习手册》(四)
    《Python学习手册》(三)
    20165322 第五周学习总结
  • 原文地址:https://www.cnblogs.com/kuronekonano/p/11135672.html
Copyright © 2011-2022 走看看