zoukankan      html  css  js  c++  java
  • leetcode—word ladder II

    1.题目描述

    Given two words (start and end), and a dictionary, find all shortest transformation sequence(s) from start to end, such that:
     
    Only one letter can be changed at a time
    Each intermediate word must exist in the dictionary
    For example,
     
    Given:
    start = "hit"
    end = "cog"
    dict = ["hot","dot","dog","lot","log"]
     
    Return
     
      [
        ["hit","hot","dot","dog","cog"],
        ["hit","hot","lot","log","cog"]
      ]

    2.解题思路

    我一看到这个题目就觉得类似于最小生成树,应该用贪心算法来做,贪心算法的思路如下:

           从start串出发,找出一次变换可以得到的string串的集合S1,如果集合S1中包含有end串,那么搜索结束,否则,搜索两步之内能到达的串的集合S2,同样判断两步之内能到达的串集合中是否有end串,以此类推,最终找到最短路径。另外,路径保存需要单独设置一个数据结构,

    最终算法描述如下(类最小生成树):

    1. 将字典dict中的所有字符串分为左右两侧,一侧为leftside=start(实际编码不需存储),一侧为rightside=(dict-start),当前距start最远的节点,比如说从start i 步之内可达的节点集合curStep = start (因为初始是0步可达)。
    2. 计算nextStep,也就是 i+1 步可达的字符串集合,最简单的思路就是下面的思路,遍历curStep 遍历rightside,逐个比较,必然能找到nextStep,找到nextStep之后curStep 变成了nextStep,将nextStep 中的字符串从rightside里面抹去,nextStep清空继续寻找直至找到的nextStep或rightside为空(表示没有路径到end),或者end被发现。

    于是有了下面的这份代码:

    class Solution {
    public:
        vector<vector<string> > findLadders(string start, string end, unordered_set<string> &dict) {
            // end typing your C/C++ solution below
            // DO NOT write int main() function
            //areslipan@163.com
     
            map<string,vector<string> > path;
     
            unordered_set<string>leftside;
            unordered_set<string>rightside=dict;
            rightside.insert(start);
            rightside.insert(end);
     
            leftside.insert(start);
            rightside.erase(start);
     
            unordered_set<string>curStep;
            unordered_set<string>nextStep;
            curStep.insert(start);
            while(curStep.find(end)==curStep.end()&&!rightside.empty())
            {
                
                unordered_set<string>::iterator iter_us_cur;
                unordered_set<string>::iterator iter_us_right;
     
                for(iter_us_cur=curStep.begin();iter_us_cur!=curStep.end();++iter_us_cur)
                {
                    
     
                    for(iter_us_right=rightside.begin();iter_us_right!=rightside.end();++iter_us_right)
                    {
                        
                        if(isCvtable(*iter_us_cur,*iter_us_right))
                        {
                            if(path.find(*iter_us_cur)!=path.end())
                            {
                                path[*iter_us_cur].push_back(*iter_us_right);
                            }
                            else
                            {
                                vector<string> emptyV;
                                path[*iter_us_cur]=emptyV;
                                path[*iter_us_cur].push_back(*iter_us_right);
                            }
     
                            nextStep.insert(*iter_us_right);
                        }
                    }
     
                }
     
                if(nextStep.empty())break;
                for(iter_us_right=nextStep.begin();iter_us_right!=nextStep.end();++iter_us_right)
                {
                    rightside.erase(*iter_us_right);
                }
                curStep = nextStep;
                nextStep.clear();
            }
     
            vector<vector<string> > result;
            vector<string> temp;
     
            if(curStep.find(end)!=curStep.end())
            {
                output(path,start,end,result,temp);
            }
     
            return result;
     
        }
        bool isCvtable(string str1,string str2)
        {
            //cout<<"isCvtable: "<<str1<<str2<<endl;
            if(str1.length()!=str2.length()){return false;}
            
            int count=0;
            for(int i = 0;i<str1.length();++i)
            {
                if(str1[i]!=str2[i])count++;
                if(count>1)return false;
            }
            
            return count==1;
        }
     
     
        void output(map<string,vector<string> >&path,string start,string end,vector<vector<string> >&result,vector<string> & temp)
        {
            temp.push_back(start);
     
            if(start==end)
            {
                result.push_back(temp);return;
            }
     
            vector<string>::iterator iter_v;
            
            for(iter_v=path[start].begin();iter_v!=path[start].end();++iter_v)
            {
                output(path,*iter_v,end,result,temp);temp.pop_back();
            }
        }
    };

    提交online judge之后,小数据集没问题,大数据集却TLE了,分析了一下,主要是从curStep求nextStep的过程太耗时,我这个是O(N2)的时间复杂度,结果如下:

    image

    挂掉的这个案例大概有3000个词,很大,分析了一下,题目给的参数是unordered_set是有用意的,unordered_set实际底层是个hash表,所以能够常数时间索引一个字符串,基于这个思路,在已知curStep、rightside求nextStep的过程中:

            对每一个curStep中的字符串,假设长度为M,那么它的每位有25种变化,也就是每个单词有25*M中变化,那么时间复杂度就变成了O(MN),单词长度一般不会太大,所以这个是个线性的算法,分析完毕,我开始着手写算法:

    class Solution {
    public:
        vector<vector<string> > findLadders(string start, string end, unordered_set<string> &dict) {
            // end typing your C/C++ solution below
            // DO NOT write int main() function
            //areslipan@163.com
     
            map<string,vector<string> > path;
     
            unordered_set<string>rightside=dict;
     
            rightside.erase(start);
            
            unordered_set<string>curStep;
            unordered_set<string>nextStep;
            curStep.insert(start);
            while(curStep.find(end)==curStep.end()&&!rightside.empty())
            {
                unordered_set<string>::iterator iter_us_cur;
                for(iter_us_cur=curStep.begin();iter_us_cur!=curStep.end();++iter_us_cur)
                {
                    string temp;
                    for(int i=0;i<(*iter_us_cur).length();++i)
                    {
                        for(int j = 0;j<26;j++)
                        {
                            temp = *iter_us_cur;
                            if(temp[i]!=('a'+j))
                            {
                                temp[i] = ('a'+j);
                            }
                            
                            if(rightside.count(temp)==1)
                            {
                                nextStep.insert(temp);
                                if(path.find(*iter_us_cur)==path.end())
                                {
                                    vector<string> emptyV;
                                    path.insert(make_pair(*iter_us_cur,emptyV));
                                }
                                
                                path[*iter_us_cur].push_back(temp);
                            }
                        }                    
                    }
                }
                
                if(nextStep.empty())break;
                unordered_set<string>::iterator iter_set;
                for(iter_set=nextStep.begin();iter_set!=nextStep.end();++iter_set)
                {
                    rightside.erase(*iter_set);
                }
                curStep = nextStep;
                nextStep.clear();
            }
            
            vector<vector<string> > result;
            vector<string> temp;
            
            if(curStep.find(end)!=curStep.end())
            {
                output(path,start,end,result,temp);
            }
     
            return result;
     
        }
        
        void output(map<string,vector<string> >&path,string start,string end,vector<vector<string> >&result,vector<string> & temp)
        {
            temp.push_back(start);
     
            if(start==end)
            {
                result.push_back(temp);return;
            }
     
            vector<string>::iterator iter_v;
            
            for(iter_v=path[start].begin();iter_v!=path[start].end();++iter_v)
            {
                output(path,*iter_v,end,result,temp);temp.pop_back();
            }
        }
    };

    结果出来的一瞬间很美妙:

    image

    另外,输出结果的方式也有改进的余地,如图所示,程序中的path实际是这么一张图,实际就是一张邻接表。

    image

    我的算法是从start开始深度搜索,直至找到end,当搜索到的最后一个节点不是end的时候其实都是无效搜索(而且比重很大),所以可以把上述这幅图反过来,然后从end开始反向搜索,以空间换时间。

  • 相关阅读:
    第5次作业+105032014118+陈元可
    第4次作业类测试代码+105032014118+陈元可
    实验二+118+陈元可
    第三次作业+105032014118
    第一次作业+105032014118
    第二次作业+105032014118
    UT源码105032014118
    ORACLE基本操作
    实验四+074+林盼皇
    实验三+074+林盼皇
  • 原文地址:https://www.cnblogs.com/obama/p/3247095.html
Copyright © 2011-2022 走看看