zoukankan      html  css  js  c++  java
  • [20180503]珅与分隔符.txt

    [20180503]珅与分隔符.txt

    --//今天再次遇到分隔符问题,以前也遇到过做一次,链接.http://blog.itpub.net/267265/viewspace-763696/
    --//这个"珅"还是许多人喜欢作为名字使用..

    $ cat d1.txt
    123|张飞珅test|aaa1

    $ cat d1.txt  | tr '|' ' '
    123
    张飞?
    test
    aaa1

    --//这样被分割成4个字段,导致错误.

    $ echo 珅 | xxd -c 16
    -bash: syntax error near unexpected token `|'

    --//因为"珅" 编码包含字符"|",出现错误.要使用引号

    $ echo -n "珅" | xxd -c 16
    0000000: ab7c                                     .|

    --//可以"珅"的编码是ab7c,而7c的编码对应的就是"|".

    $ echo -n "|" | xxd -c 16
    0000000: 7c                                       |

    --//这样导致分割出现错误.实际上这个字符不属于GB2312编码表.
    --//以前通过这个脚本定位:
    select upper(TO_CHAR (167+rownum,'xxxxxxxxxxxxx')) "10to16",chr(167+rownum)||'|' from dual connect by level+167<=254;
    --//但是仅仅对数据库字符集AMERICAN_AMERICA.US7ASCII有效.
    --//对于字符集AMERICAN_AMERICA.ZHS16GBK可以使用如下查询:

    SELECT hex, UTL_RAW.cast_to_varchar2 (hex) hz
      FROM (    SELECT TO_CHAR (167 + ROWNUM, 'FMxx') || '7c' hex
                  FROM DUAL
            CONNECT BY LEVEL + 167 <= 254);



  • 相关阅读:
    MySql 数据备份与还原
    PHP 连接数据库
    迭代法写线性回归
    ML numpy、pandas、matplotlib的使用
    005 动态加载实例
    爬虫实现案例
    004 使用scrapy框架爬虫
    003 爬虫持久化的三个不同数据库的python代码
    内置函数和匿名函数
    迭代器和生成器
  • 原文地址:https://www.cnblogs.com/lfree/p/8986104.html
Copyright © 2011-2022 走看看