这是曾经的一个面试题,正好引出状态机编程思想。挺不错的一个例子。
题目描述
给定一个字符串,它由以下字符组成:
- 左括号“(”
- 右括号“)”
- 下划线“_”
- 大小写字母构成的字符串(单字母也算作字符串)
该字符串组成有以下规则限定:
- 括号成对出现且不会嵌套,保证语法正确
- 字符串可以出现在括号内,也可以出现在括号外
- 各个字符串之间必须用下划线“_”隔开
- 括号外的字符串必须以下划线“_”为边界;括号内字符串的边界可以是下划线“_”,也可以是括号“(”、“)”
请解决问题:
- 括号内字符串个数
- 统计括号外最长字符串的长度
传统思路
我们拿到这个问题时,第一感觉往往是顺序遍历字符串,并检测左右相邻字符是否满足边界条件,从而进行分支处理。但是这样做有以下棘手之处:
- 判定括号边界时需要保存之前的状态,而处理程序和判定状态逻辑往往混乱成一锅粥,难解难分
- 不同状态下的处理逻辑不同,这样对于大型问题,逻辑之间有可能产生耦合,甚至在不同状态间跳来跳去
- 还有效率问题,每次处理当前字符时还有同时处理左右相邻字符,工作量有冗余,效率降低
嗯,不信的话,可以自己按照上述最简单的思路实现一下,你就明白了。
有人说,复杂逻辑我不怕啊,细心就好。So...是时候请出我们的大侠--“状态机”了。
状态机思路
状态机是编译原理中的一种技术,学过电学的读者应该也在《数字电子技术》中用过它,归根结底,就是把复杂的问题逻辑化为一个一个的状态,我们处理问题的过程就是在各个状态之间不断迁移(包含自迁移),这样画出来的图就叫做状态迁移图,帮助我们把一锅难缠的粥转化为一张清晰的网。当然,这里不会深究状态机的概念,详情请自查(比如还有状态迁移表等等)。
让我们用状态迁移图表示上面的问题(若看不清图,可以右键在新的标签页看,或者下载下来看):
我设置了两个状态,一个用来区分括号内外,一个用来区分是否是字母,从而进行不同的处理。
括号内外分成了两个子状态,这两个子状态是互斥的,因此他们内部的状态变量可以共用。
至于状态之间转移条件,直接看代码即可理解:
1 public class CountWords { 2 3 final static int InBracket = 0;// 括号内 4 final static int OutBracket = 1;// 括号外 5 6 final static int IsLetter = 0;// 是字母 7 final static int NotLetter = 1;// 不是字母 8 9 public static void main(String[] args) { 10 test("_yy_()()_(_apple_welcome)_ssjjjs_");//2,6 11 test("__()()_(_)__()_");//0,0 12 test("_ya_");//0,2 13 test("_yy_(_)(r)_(_wel_c_ome_k)_");//5,2 14 test("_yy_aa_");//0,2 15 test("_yy_(aaa_bb_c)()__yyyyy_");//3,5 16 test("(u)_()_(__)()_yy_()");//1,2 17 test("__(a_wwwww)");//2,0 18 test("__(_a_wwwww_)_____ddd____()()()()()()");//2,3 19 } 20 21 public static void test(String str) { 22 // 状态初始化 23 int state_INOUT = OutBracket; 24 int state_letter = NotLetter; 25 // 统计结果初始化 26 int outLengthOfLongestWord = 0; 27 int outLengthOfCurrentWord = 0; 28 int inNumsOfWord = 0; 29 // 开始处理 30 for (int i = 0; i < str.length(); ++i) { 31 // 取出当前字符 32 char c = str.charAt(i); 33 // 根据括号设置状态:括号内、括号外 34 if (c == '(') { 35 state_INOUT = InBracket; 36 } 37 if (c == ')') { 38 state_INOUT = OutBracket; 39 } 40 // 括号内状态 41 if (state_INOUT == InBracket) { 42 if (state_letter == IsLetter) { 43 if (c == '_' || c == ')') { 44 state_letter = NotLetter; 45 } 46 } else if (state_letter == NotLetter) { 47 if (Character.isLetter(c)) { 48 state_letter = IsLetter; 49 ++inNumsOfWord; 50 } 51 } 52 } 53 // 括号外状态 54 else if (state_INOUT == OutBracket) { 55 if (state_letter == IsLetter) { 56 // System.out.println(c); 57 if (c == '_' || c == '(') { 58 if (outLengthOfLongestWord < outLengthOfCurrentWord) { 59 outLengthOfLongestWord = outLengthOfCurrentWord; 60 } 61 outLengthOfCurrentWord = 0; 62 state_letter = NotLetter; 63 } else if (Character.isLetter(c)) { 64 ++outLengthOfCurrentWord; 65 } 66 } 67 if (state_letter == NotLetter) { 68 if (Character.isLetter(c)) { 69 state_letter = IsLetter; 70 ++outLengthOfCurrentWord; 71 } 72 } 73 } 74 } 75 System.out.println("括号内的字符串数:" + inNumsOfWord); 76 System.out.println("括号外的最长字符串长度:" + outLengthOfLongestWord); 77 System.out.println(); 78 79 } 80 81 }
有没有感觉到很方便?思路更清晰了,效率也上去了。
注:状态机不同于设计模式中常说的状态模式(状态模式用类代表状态)。
就这么多吧,欢迎提出测试样例找bug,共同进步。