zoukankan      html  css  js  c++  java
  • [20180503]珅与分隔符.txt

    [20180503]珅与分隔符.txt

    --//今天再次遇到分隔符问题,以前也遇到过做一次,链接.http://blog.itpub.net/267265/viewspace-763696/
    --//这个"珅"还是许多人喜欢作为名字使用..

    $ cat d1.txt
    123|张飞珅test|aaa1

    $ cat d1.txt  | tr '|' ' '
    123
    张飞?
    test
    aaa1

    --//这样被分割成4个字段,导致错误.

    $ echo 珅 | xxd -c 16
    -bash: syntax error near unexpected token `|'

    --//因为"珅" 编码包含字符"|",出现错误.要使用引号

    $ echo -n "珅" | xxd -c 16
    0000000: ab7c                                     .|

    --//可以"珅"的编码是ab7c,而7c的编码对应的就是"|".

    $ echo -n "|" | xxd -c 16
    0000000: 7c                                       |

    --//这样导致分割出现错误.实际上这个字符不属于GB2312编码表.
    --//以前通过这个脚本定位:
    select upper(TO_CHAR (167+rownum,'xxxxxxxxxxxxx')) "10to16",chr(167+rownum)||'|' from dual connect by level+167<=254;
    --//但是仅仅对数据库字符集AMERICAN_AMERICA.US7ASCII有效.
    --//对于字符集AMERICAN_AMERICA.ZHS16GBK可以使用如下查询:

    SELECT hex, UTL_RAW.cast_to_varchar2 (hex) hz
      FROM (    SELECT TO_CHAR (167 + ROWNUM, 'FMxx') || '7c' hex
                  FROM DUAL
            CONNECT BY LEVEL + 167 <= 254);



  • 相关阅读:
    JZOJ5906 传送门
    JZOJ5907 轻功
    JZOJ5904 刺客信条
    JZOJ5347 遥远的金字塔
    JZOJ5344 摘果子
    JZOJ4742 单峰
    JZOJ4725 质数序列
    JZOJ2499 东风谷早苗
    JZOJ4737 金色丝线将瞬间一分为二
    最后的财产——模板大全
  • 原文地址:https://www.cnblogs.com/lfree/p/8986104.html
Copyright © 2011-2022 走看看