1. string库中所有的字符索引从前往后是1,2,...;从后往前是-1,-2,...
2. string库中所有的function都不会直接操作字符串,而是返回一个结果
简单的模式串
s = "hello world"
i, j = string.find(s, "hello")
print(i, j) --> 1 5
print(string.sub(s, i, j)) --> hello
print(string.find(s, "world")) --> 7 11
i, j = string.find(s, "l")
print(i, j) --> 3 3
print(string.find(s, "lll")) --> nil
格式化的模式串
s = "Deadline is 30/05/1999, firm"
date = "%d%d/%d%d/%d%d%d%d"
print(string.sub(s, string.find(s, date))) --> 30/05/1999
下面的表列出了Lua支持的所有字符类:
. 任意字符
%s 空白符
%p 标点字符
%c 控制字符
%d 数字
%x 十六进制数字
%z 代表0的字符
%a 字母
%l 小写字母
%u 大写字母
%w 字母和数字
上面字符类的大写形式表示小写所代表的集合的补集。例如,'%A'非字母的字符:
模式串中的特殊字符
( ) . % + - * ? [ ^ $
'%' 用作特殊字符的转义字符
'%.' 匹配点;
'%%' 匹配字符 '%'。
转义字符 '%'不仅可以用来转义特殊字符,还可以用于所有的非字母的字符。当对一个字符有疑问的时候,为安全起见请使用转义字符转义他。
用'[]'创建字符集
'[%w_]' 匹配字母数字和下划线
'[01]' 匹配二进制数字
'[%[%]]'匹配一对方括号
在'[]'中使用连字符'-'
'%d' 表示 '[0-9]';
'%x' 表示 '[0-9a-fA-F]'
'[0-7]' 表示 '[01234567]'
在'[]'开始处使用 '^' 表示其补集:
'[^0-7]' 匹配任何不是八进制数字的字符;
'[^\n]' 匹配任何非换行符户的字符。
'[^%s]' == '%S'
模式修饰符
+ 匹配前一字符1次或多次
* 匹配前一字符0次或多次;最长匹配
- 匹配前一字符0次或多次;最短匹配
? 匹配前一字符0次或1次
^ 匹配字符串开头
$ 匹配字符串结尾
捕获:用()将要捕获的部分包围起来
pair = "name = Anna"
firstidx, lastidx, key, value = string.find(pair,
"(%a+)%s*=%s*(%a+)")
print(key, value) <== name Anna
拷贝捕获(%1-%9)
s = "abc \"it\'s a cat\""
_,_,_,q = string.find(s, "([\"'])(.-)%1"))
print(q) <== it's a cat 如果%d代表第几个捕获的拷贝。
string.gsub(s, pattern, reps)
第1个参数:源字符串
第2个参数:待替换之模式串
第3个参数:替换为reps
将s中所有符合pattern的字串替换为reps,返回结果串+匹配数
print(string.gsub("hello, world", "o", "a"))
<== hella,
warld 2
gsub也可以用拷贝捕获技巧
print(string.gsub("hello, world", "(o)",
"%1-%1")) <== hello-o, wo-orld 2
print(string.gsub("hello Lua", "(.)(.)", "%2%1"))
<== ehll ouLa 4
function trim (s) return (string.gsub(s, "^%s*(.-)%s*$",
"%1")) end <== 注意匹配数用括号丢弃
string.gsub(s, pattern, func)
第3个参数:自定义函数,对找到的匹配操作,并传出替换值
s, n = string.gsub("hello world", "l+", function(s) return
"xxx" end)
print(s, n) <== hexxxo worxxxd 2
string.gfind(s, pattern)
返回一个迭代器,迭代器每执行一次,返回下一个匹配串;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) <== a=b
print(iter()) <== c=d
通常用于泛性for循环,下面的例子结果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end
-------------------------------------------------
1 ------------------------------------------------------- 2 -- 参数:待分割的字符串,分割字符 3 -- 返回:子串表.(含有空串) 4 function stringSplit(str, splitChar) 5 local subStrTab = {} 6 while (true) do 7 local pos = string.find(str, splitChar) 8 9 if (not pos) then 10 subStrTab [#subStrTab + 1] = str 11 break; 12 end 13 14 local subStr = string.sub(str, 1, pos - 1) 15 subStrTab [#subStrTab + 1] = subStr 16 str = string.sub(str, pos + 1, #str) 17 end 18 19 return subStrTab 20 end