zoukankan      html  css  js  c++  java
  • MySQL 中如何存储 emoji ?

    MySQL 如何存储 emoji

    问题还原

    使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:

    <<240,159,152,134,240,159,152,144>>

    查看二进制的 unicode 是什么?

    14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>).

    [128518,128528]

    15> erlang:integer_to_list(128518,16).%%查看十六进制

    "1F606"

    16> erlang:integer_to_list(128528,16).

    "1F610"

    明显,1F606 1F610 超过了常见 unicode 字符串 0000-FFFF 的表达范围。

    1F606 1F610 代表什么?

    根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。

    MySQL 上存储失败的原因

    目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL utf8 和我们所说的传统 utf8 有点区别。MySQL utf8 编码规定了最多只能有 3 个字节,而 emoji unicode 已经超过了 3 个字节,因此 MySQL utf8 无法识别与存储 emoji

    为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4 个字节,这种编码可以表示 emoji

    另外 utf8mb4 向下兼容 utf8

    解决方案

    MySQL 中对应的字段改成 utf8mb4 编码:

    ALTER TABLE t1

      DEFAULT CHARACTER SET utf8mb4,

      MODIFY col1 CHAR(10)

        CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL,

      MODIFY col2 CHAR(10)

        CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL;

    将连接库的连接编码改为 utf8mb4下面兄弟连(www.itxdl.cn)就 erlang 的连接库 emysql 为例:

    emysql:add_pool(pool,[{size,1},{user,"user"},{password,"password"},{host,"host"},{port,3306},{encoding,utf8mb4}]).

    %%或者

    emysql:add_pool(pool,1,"user","password","host",3306,undefined, utf8mb4).

    为了建表方便,可以修改 my.cnf

    # 服务器字符集

    [mysql]

    default-character-set=utf8mb4

    [mysqld]

    character-set-server=utf8mb4

  • 相关阅读:
    参数传递二维数组 .
    类的static成员变量和成员函数能被继承吗
    Oracle面试题(基础篇)
    Visual C++ 8.0对象布局
    C++对象模型 多重继承与虚函数表
    浅析GCC下C++多重继承 & 虚拟继承的对象内存布局
    C++对象内存布局测试总结
    查找
    反转链表
    排序
  • 原文地址:https://www.cnblogs.com/lampbrotherIT/p/5794742.html
Copyright © 2011-2022 走看看