语法
split(str string, regex string) -- 使用 regex 分割字符串 str
返回值为一个数组。
基本用法
select split('a,b,c,d', ',') from temp_cwh_test; -- 分割
-- 结果为数组
["a","b","c","d"]
截取字符串中某个值
select split('a,b,c,d', ',')[0] from temp_cwh_test;
-- 提取第1个值
a
可以指定提取结果数组中的某个值。
特殊字符的处理
针对特殊分割符号,需要特殊处理。
select split('122.122.122.122', '.') from temp_cwh_test;
-- 将出错,无法得到预想结果
正确语法为:
select split('122.122.122.122', '\.') from temp_cwh_test;
-- 结果
["122","122","122","122"]
当 split
包含在双引号 " "
之中时,需要添加4个反斜杠。例如:
hive -e "... split('122.122.122.122', '\\.')"
否则得到的值为空值 NULL。
同样的 | 等特殊符号需做类似处理。
有些特殊字符转义只需要1个反斜杠,而有些需要2个反斜杠,需要注意测试一下。
参考链接1:hive函数 -- split 字符串分割函数
参考链接2:【Hive】split函数(分割字符串)