zoukankan      html  css  js  c++  java
  • sql字符串函数和操作符

    本节描述了用于检查和操作字符串数值的函数和操作符。 在这个环境中的字串包括所有类型 charactercharacter varying,和 text 的值。除非另外说明,所有下面列出的函数都可以处理这些类型, 不过要小心的是,在使用 character 类型的时候, 它的自动填充的潜在影响。通常这里描述的函数也能用于非字串 类型,我们只要先把那些数据转化为字串表现形式就可以了。 有些函数还可以处理位串类型。

    SQL 定义了一些字串函数, 它们有指定的语法,它们里面是用 某种特定的关键字,而不是逗号来分隔参数。 详情请见Table 9-6, 这些函数也用正常的函数调用说法实现了。 (参阅 Table 9-7。)

    Table 9-6. SQL 字串函数和操作符

    函数 返回类型 描述 例子 结果
    string || string text 字串连接 'Post' || 'greSQL' PostgreSQL
    bit_length(string) integer 字串里二进制位的个数 bit_length('jose') 32
    char_length(string)character_length(string) integer 字串中的字符个数 char_length('jose') 4
    convert(string using conversion_name) text 使用指定的转换名字改变编码。转换可以通过 CREATE CONVERSION 定义。当然系统里有一些预定义的转换名字。参阅 Table 9-8 获取可用的转换名。 convert('PostgreSQL'
     using
    iso_8859_1_to_utf_8)
    Unicode (UTF-8) 编码的'PostgreSQL'
    lower(string) text 把字串转化为小写 lower('TOM') tom
    octet_length(string) integer 字串中的字节数 octet_length('jose') 4
    position(substring in string) integer 声明的子字串的位置 position('om' in 'Thomas') 3
    overlay(string placing string from integer [for integer]) text 替换子字串 overlay('Txxxxas' placing 'hom' from 2 for 4) Thomas
    position(substring in string) integer 指定的子字串的位置 position('om' in 'Thomas') 3
    substring(string [from integer] [for integer]) text 抽取子字串 substring('Thomas' from 2 for 3) hom
    substring(string from pattern) text 抽取匹配 POSIX 正则表达式的子字串 substring('Thomas' from '...$') mas
    substring(string from pattern for escape) text 抽取匹配SQL正则表达式的子字串 substring('Thomas' from '%#"o_a#"_' for '#') oma
    trim([leading | trailing | both] [characters] from string) text 从字串 string 的 开头/结尾/两边/ 删除只包含 characters (缺省是一个空白)的最长的字串。 trim(both 'x' from 'xTomxx') Tom
    upper(string) text 把字串转化为大写。 upper('tom') TOM

    还有额外的字串操作函数可以用,它们在Table 9-7列出。 它们有些在内部用于实现Table 9-6
    列出的SQL标准字串函数。

    Table 9-7. 其他字串函数

    函数 返回类型 描述 例子 结果
    ascii(text) integer 参数第一
    个字符的 ASCII
    ascii('x') 120
    btrim
    (string text, characters text)
    text string
    开头和结尾删除 只包含在 characters 里的字符的最长字串。
    btrim
    ('xyxtrimyyx','xy')
    trim
    chr(integer) text 给出 ASCII 码的字符 chr(65) A
    convert(string text, [src_encoding name,] dest_encoding name) text 把字串转换为 dest_encoding . 原来的编码是用 src_encoding 声明的. 如果省略了 src_encoding, 则假设为数据库编码. convert(
    'text_in_unicode',
     'UNICODE',
    'LATIN1')
    以 ISO
    8859-1
    编码表示的text_in
    _unicode
    decode(string text, type text) bytea 把早先用encode编码的,存放在 string 里面的二进制数据解码。 参数类型和encode一样。 decode('MTIzAAE=',
     'base64')
    123\000\001
    encode(data bytea, type text) text 把二进制数据编码为只包含 ASCII 形式的数据。 支持的类型有base64hexescape encode('123\\000
    \\001', 'base64')
    MTIzAAE=
    initcap(text) text 把每个单词(空白分隔)的第一个子母转为大写 initcap('hi
    thomas')
    Hi Thomas
    length(string) integer 字串中字符的数目 length('jose') 4
    lpad(string text, length integer [, fill text]) text 通过填充字符 fill (缺省时为空白), 把 string 填充为长度 length。 如果 string 已经比 length 长则将其截断(在右边)。 lpad('hi', 5, 'xy') xyxhi
    ltrim(string text, characters text) text 从字串 string 的 开头 删除只包含 characters 的最长的字串。 ltrim
    ('zzzytrim','xyz')
    trim
    md5(string text) text 计算给出字串的 MD5 散列,以十六进制返回结果。 md5('abc') 90015098
    3cd24
    fb0d69
    63f7d2
    8e17f72
    pg_client_encoding() name 当前客户端编码名称。 pg_client_
    encoding()
    SQL_ASCII
    quote_ident(string text) text 返回给出字串的一个适用于在SQL语句字串里当作标识符引起使用的形式。 只有在必要的时候才会添加引号(也就是说,如果字串包含非标识符字符或者会 转换大小写的字符)。 嵌入的引号被恰当地写了双份。 quote_ident('Foo') "Foo"
    quote_literal(string text) text 返回给出字串的一个适用于在SQL语句字串里当作文本使用的形式。 嵌入的引号和反斜杠被恰当地写了双份。 quote_literal
    ('O\'Reilly')
    'O''Reilly'
    repeat(text, integer) text 重复 text 一定次数。 repeat('Pg', 4) PgPgPgPg
    replace(string text, from text, to text) text 把字串string里出现地所有子字串 from 替换成子字串 to replace
    ('abcdefabcdef',
     'cd', 'XX')
    abXXef
    abXXef
    rpad(string text, length integer [, fill text]) text 通过填充字符 fill (缺省时为空白), 把 string 填充为长度 length。 如果 string 已经比 length 长则将其截断。 rpad('hi', 5, 'xy') hixyx
    rtrim(string
    text, character text)
    text 从字串 string 的 结尾
    删除只包含 character 的最长的字串。
    rtrim
    ('trimxxxx','x')
    trim
    split_part
    (string text, delimiter text, field integer)
    text 根据 delimiter 分隔 string 返回生成的第 field 个子字串(一为基)。 split_part
    ('abc~@~def
    ~@~ghi','~@~',2
    )
    def
    strpos(string, substring) text 声明的子字串的位置。(和 position(substring in string一样),不过要注意参数顺序 是相反的) strpos
    ('high','ig')
    2
    substr(string, from [, count]) text 抽取子字串。(和 substring(string from from for count)一样) substr('alphabet',
    3, 2)
    ph
    to_ascii
    (text [, encoding])
    text 把文本从其它编码转换为 ASCII[a] to_ascii('Karel') Karel
    to_hex(number integer 或者 bigint) text number 转换成其对应地十六进制表现形式。 to_hex(922337203
    6854775807)
    7fffffff
    ffffffff
    translate(string text, from text, to text) text 把在 string 中包含的任何匹配 from 中的字符的字符转化为对应的 在 to 中的字符。 translate('12345',
     '14', 'ax')
    a23x5
    Notes:
    a. to_ascii 函数只支持从 LATIN1LATIN2,和 WIN1250 转换。

    Table 9-8. 内置的转换

    转换名 [a] 源编码 目的编码
    ascii_to_mic SQL_ASCII MULE_INTERNAL
    ascii_to_utf_8 SQL_ASCII UNICODE
    big5_to_euc_tw BIG5 EUC_TW
    big5_to_mic BIG5 MULE_INTERNAL
    big5_to_utf_8 BIG5 UNICODE
    euc_cn_to_mic EUC_CN MULE_INTERNAL
    euc_cn_to_utf_8 EUC_CN UNICODE
    euc_jp_to_mic EUC_JP MULE_INTERNAL
    euc_jp_to_sjis EUC_JP SJIS
    euc_jp_to_utf_8 EUC_JP UNICODE
    euc_kr_to_mic EUC_KR MULE_INTERNAL
    euc_kr_to_utf_8 EUC_KR UNICODE
    euc_tw_to_big5 EUC_TW BIG5
    euc_tw_to_mic EUC_TW MULE_INTERNAL
    euc_tw_to_utf_8 EUC_TW UNICODE
    gb18030_to_utf_8 GB18030 UNICODE
    gbk_to_utf_8 GBK UNICODE
    iso_8859_10_to_utf_8 LATIN6 UNICODE
    iso_8859_13_to_utf_8 LATIN7 UNICODE
    iso_8859_14_to_utf_8 LATIN8 UNICODE
    iso_8859_15_to_utf_8 LATIN9 UNICODE
    iso_8859_16_to_utf_8 LATIN10 UNICODE
    iso_8859_1_to_mic LATIN1 MULE_INTERNAL
    iso_8859_1_to_utf_8 LATIN1 UNICODE
    iso_8859_2_to_mic LATIN2 MULE_INTERNAL
    iso_8859_2_to_utf_8 LATIN2 UNICODE
    iso_8859_2_to_windows_1250 LATIN2 WIN1250
    iso_8859_3_to_mic LATIN3 MULE_INTERNAL
    iso_8859_3_to_utf_8 LATIN3 UNICODE
    iso_8859_4_to_mic LATIN4 MULE_INTERNAL
    iso_8859_4_to_utf_8 LATIN4 UNICODE
    iso_8859_5_to_koi8_r ISO_8859_5 KOI8
    iso_8859_5_to_mic ISO_8859_5 MULE_INTERNAL
    iso_8859_5_to_utf_8 ISO_8859_5 UNICODE
    iso_8859_5_to_windows_1251 ISO_8859_5 WIN
    iso_8859_5_to_windows_866 ISO_8859_5 ALT
    iso_8859_6_to_utf_8 ISO_8859_6 UNICODE
    iso_8859_7_to_utf_8 ISO_8859_7 UNICODE
    iso_8859_8_to_utf_8 ISO_8859_8 UNICODE
    iso_8859_9_to_utf_8 LATIN5 UNICODE
    johab_to_utf_8 JOHAB UNICODE
    koi8_r_to_iso_8859_5 KOI8 ISO_8859_5
    koi8_r_to_mic KOI8 MULE_INTERNAL
    koi8_r_to_utf_8 KOI8 UNICODE
    koi8_r_to_windows_1251 KOI8 WIN
    koi8_r_to_windows_866 KOI8 ALT
    mic_to_ascii MULE_INTERNAL SQL_ASCII
    mic_to_big5 MULE_INTERNAL BIG5
    mic_to_euc_cn MULE_INTERNAL EUC_CN
    mic_to_euc_jp MULE_INTERNAL EUC_JP
    mic_to_euc_kr MULE_INTERNAL EUC_KR
    mic_to_euc_tw MULE_INTERNAL EUC_TW
    mic_to_iso_8859_1 MULE_INTERNAL LATIN1
    mic_to_iso_8859_2 MULE_INTERNAL LATIN2
    mic_to_iso_8859_3 MULE_INTERNAL LATIN3
    mic_to_iso_8859_4 MULE_INTERNAL LATIN4
    mic_to_iso_8859_5 MULE_INTERNAL ISO_8859_5
    mic_to_koi8_r MULE_INTERNAL KOI8
    mic_to_sjis MULE_INTERNAL SJIS
    mic_to_windows_1250 MULE_INTERNAL WIN1250
    mic_to_windows_1251 MULE_INTERNAL WIN
    mic_to_windows_866 MULE_INTERNAL ALT
    sjis_to_euc_jp SJIS EUC_JP
    sjis_to_mic SJIS MULE_INTERNAL
    sjis_to_utf_8 SJIS UNICODE
    tcvn_to_utf_8 TCVN UNICODE
    uhc_to_utf_8 UHC UNICODE
    utf_8_to_ascii UNICODE SQL_ASCII
    utf_8_to_big5 UNICODE BIG5
    utf_8_to_euc_cn UNICODE EUC_CN
    utf_8_to_euc_jp UNICODE EUC_JP
    utf_8_to_euc_kr UNICODE EUC_KR
    utf_8_to_euc_tw UNICODE EUC_TW
    utf_8_to_gb18030 UNICODE GB18030
    utf_8_to_gbk UNICODE GBK
    utf_8_to_iso_8859_1 UNICODE LATIN1
    utf_8_to_iso_8859_10 UNICODE LATIN6
    utf_8_to_iso_8859_13 UNICODE LATIN7
    utf_8_to_iso_8859_14 UNICODE LATIN8
    utf_8_to_iso_8859_15 UNICODE LATIN9
    utf_8_to_iso_8859_16 UNICODE LATIN10
    utf_8_to_iso_8859_2 UNICODE LATIN2
    utf_8_to_iso_8859_3 UNICODE LATIN3
    utf_8_to_iso_8859_4 UNICODE LATIN4
    utf_8_to_iso_8859_5 UNICODE ISO_8859_5
    utf_8_to_iso_8859_6 UNICODE ISO_8859_6
    utf_8_to_iso_8859_7 UNICODE ISO_8859_7
    utf_8_to_iso_8859_8 UNICODE ISO_8859_8
    utf_8_to_iso_8859_9 UNICODE LATIN5
    utf_8_to_johab UNICODE JOHAB
    utf_8_to_koi8_r UNICODE KOI8
    utf_8_to_sjis UNICODE SJIS
    utf_8_to_tcvn UNICODE TCVN
    utf_8_to_uhc UNICODE UHC
    utf_8_to_windows_1250 UNICODE WIN1250
    utf_8_to_windows_1251 UNICODE WIN
    utf_8_to_windows_1256 UNICODE WIN1256
    utf_8_to_windows_866 UNICODE ALT
    utf_8_to_windows_874 UNICODE WIN874
    windows_1250_to_iso_8859_2 WIN1250 LATIN2
    windows_1250_to_mic WIN1250 MULE_INTERNAL
    windows_1250_to_utf_8 WIN1250 UNICODE
    windows_1251_to_iso_8859_5 WIN ISO_8859_5
    windows_1251_to_koi8_r WIN KOI8
    windows_1251_to_mic WIN MULE_INTERNAL
    windows_1251_to_utf_8 WIN UNICODE
    windows_1251_to_windows_866 WIN ALT
    windows_1256_to_utf_8 WIN1256 UNICODE
    windows_866_to_iso_8859_5 ALT ISO_8859_5
    windows_866_to_koi8_r ALT KOI8
    windows_866_to_mic ALT MULE_INTERNAL
    windows_866_to_utf_8 ALT UNICODE
    windows_866_to_windows_1251 ALT WIN
    windows_874_to_utf_8 WIN874 UNICODE
    Notes:
    a. 转换名遵循一个标准的命名模式:将源编码中的所有非字母数字字符 用下划线替换,后面跟着 _to_,然后后面再跟着 经过同样处理的目标编码的名字。因此这些名字可能和客户的编码名字 不同。
  • 相关阅读:
    电路开发软件积累
    .NET移动开发环境搭建
    Microsoft SQL Server Express各版本对比
    .NET IL指令速查表
    C#访问加密的SQLite数据库
    C#中时间计算方法汇总
    最佳C/C++编辑器 source insight3
    常用PHP框架收集
    CSS 中文字体的英文名称 (simhei, simsun) 宋体 微软雅黑等
    Windows下Java JDK8配置环境变量
  • 原文地址:https://www.cnblogs.com/subingster/p/668601.html
Copyright © 2011-2022 走看看