zoukankan      html  css  js  c++  java
  • Emoji表情符号在MySQL数据库中的存储

    在Android手机或者iPhone的各种输入法键盘中,会自带一些Emoji表情符号,如IPhone手机系统键盘包含的表情符号有:


    IPhone Emoji.png

    如果在移动端发布文本内容时包含了这种Emoji表情符号,通过接口传递到服务器端,服务器端再存入MySQL数据库:

    • 对gbk 字符集的数据库,写入数据库的数据,在回显时,变成 ‘口口’ 无法回显;

    • 对utf8 字符集的数据库,则根本无法写入数据库,程序直接报出异常信息
      java.io.exception xxxxxxxx.

    原因分析:

    Emoji表情符号为4个字节的字符,而 utf8 字符集只支持1-3个字节的字符,导致无法写入数据库。

    解决方案:

    1. 遍历输入的文本,把四字节长度的字符,修正为自定义的字符替换掉。

    2. 修改MySQL数据库字符集, 把数据库字符集从utf8 修改为支持1-4 个字节字符的utf8mb4。

    事实上可以看出,第一种方案的工作量较大,并不可取。推荐使用第二种方案,修改数据库字符集。从MySQL 5.5.3版本开始,数据库可支持4个字节的utf8mb4 字符集,一个字符最多可以有4个字节,所以能支持更多的字符集,故能存储Emoji表情符号。从 mysql 5.5.3 之后版本基本可以无缝升级到 utf8mb4 字符集。同时,utf8mb4兼容utf8字符集,utf8 字符的编码、位置、存储在utf8mb4与utf8字符集里一样的,不会对有现有数据带来损坏。

    升级方案:

    1. 修改数据库字符集character-set-server=utf8mb4 重启数据库生效。

    2. 修改database 的字符集为 utf8mb4 alter database dbname character set utf8mb4

    3. 修改表的字符集 为utf8mb4 , alter table character set = utf8mb4

    附上:

    Emoji 全编码字符集:IOS Emoji



    作者:亦枫
    链接:http://www.jianshu.com/p/20740071d854
    來源:简书
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
  • 相关阅读:
    REHの个人主页
    多项式基础学习笔记(2)
    多项式基础学习笔记(1)
    FFT & NTT 学习笔记
    LCT学习笔记
    莫队学习笔记
    SAM 学习笔记
    网络流学习笔记
    关于魔术球贪心做法的证明
    【题解】异或粽子&加强版
  • 原文地址:https://www.cnblogs.com/AllenChou/p/7687072.html
Copyright © 2011-2022 走看看