zoukankan      html  css  js  c++  java
  • Oracle中如何用SQL检测字段是否包括中文字符

     今天有一个同事的数据迁移程序有个问题,没有考虑中文编码字符,由于迁移的表有几千万数据,但是有中文的记录集很少,问我能否找出有中文内容的记录数。首先我想到的是采用检测每个字节ASCII的方式,这样的话需要写一个自定义函数,然后SQL中调用得到结果。但是感觉这个方法估计很耗时,毕竟每个字符都要比较,所以没有去实现。突然想到Oracle有一个编码转换的函数叫Convert,如果一个字符串编码转换前后不一样就表示字符串里面含有非ASCII字符,这样就得到结果。最后写出来测试了一下,确实可行,5500万记录10秒钟就扫描结束。以下是测试用例:

    select *
          from (select 'abcd' c1 from dual
                union all
                select 'ab测试cd' c1 from dual)
         where c1 <> CONVERT(c1, 'US7ASCII', 'ZHS16GBK');
    

      

    C1
    --------
    ab测试cd

    CONVERT函数说明:

    CONVERT(inputstring,dest_charset,source_charset)

    inputstring:要转换的字符串

    dest_charset:目标字符集

    source_charset:原字符集

    这只是一个小技巧,也许有一天你也有这样的需求,或许能派上用场。

  • 相关阅读:
    管理ceph缓存池
    Ceph更换OSD磁盘
    crushmap磁盘智能分组
    Angular 初体验
    音视频开发-FFmpeg
    开源项目OEIP 游戏引擎与音视频多媒体(UE4/Unity3D)
    Yolov3代码分析与训练自己数据集
    整合Yolov3到UE4/Unity3D
    CUDA版Grabcut的实现
    CUDA加opencv复现导向滤波算法
  • 原文地址:https://www.cnblogs.com/appinn/p/4844242.html
Copyright © 2011-2022 走看看