oracle数据库中字符串类型varchar2有两种定义方式,分别是varchar2(n char)和varchar2(n byte),但我们一般习惯定义varchar2(n),这样oracle会根据配置文件中的设置选择以字节为单位还是以字符为单位。
我们可以通过pl/sql developer的命令窗口,输入"show parameter nls_length",查看当前值,如果返回值为byte的话就是以字节存储的。
先看oracle本身设置是以字节 还是 字符 为单位,再根据数据库字符集编码确定可以存储几个汉字:以字符集gbk为例,一个中文字符占两个字节,一个英文字符占一个字节。
例如新建一个表,create table t1(name varchar2(4),如果默认为byte,那么name字段最多只能存储两个中文字符或四个英文字符或者一个中文字符和两个英文字符。
pl/sql中系统函数length和substr针对的是字符,length('测试c')=3,substr('测试c',1,2)='测试',返回的是字符或字符数,不管字符是中文还是西文。
pl/sql中还有一些系统函数是针对字节的,例如lengthb和substrb,lengthb('测试c')=5,substrb('测试c',1,4)='测试',substrb('测试c',1,5)='测试c',
如果是substrb('测试c',1,3),会返回一个三个字节的字符串,由于没有完全取到两个中文,我们看到的可能会是乱码。
查看oracle字符集sql:
select userenv('language') from dual;
一个汉字占用2个字节: SIMPLIFIED CHINESE_CHINA.ZHS16GBK
一个汉字占用3个字节: SIMPLIFIED CHINESE_CHINA.AL32UTF8