zoukankan      html  css  js  c++  java
  • MySql 中文写入数据库乱码及Incorrect string value: '\xF0\x9F...' for column 'XXX' at row 1解决

    一、中文写入乱码问题


    我输入的中文编码是 urf8 的,建的库是 urf8 的,但是插入MySQL总是乱码,一堆"???????????????????????"。可以使用以下的方式试试决解:

    原url地址是

    jdbc:mysql://localhost:3306/数据库名
    

    改为

    jdbc:mysql://localhost:3306/数据库名?useUnicode=true&characterEncoding=UTF-8
    

    就OK了。

    二、Incorrect string value: '\xF0\x9F...' for column 'XXX' at row 1


    做有关微信公众账号的项目时,报Incorrect string value: '\xF0\x9F\x98\x92' for column 'NIKENAME' at row 1,而所有的字符编码都是 utf8,使用的数据库是 mysql,在测试环境用得好好的,部署到线上后(使用的集群是阿里巴巴的,数据库服务器也是使用它们的,mysql 服务器版本是 5.5.18),就报这个错了,并且这个错,时而出现,时而不出现

    Emoji表情字符现在在APP已经广泛支持了。但是MySQL的UTF8编码对Emoji字符的支持却不是那么好。所以我们经常会遇到这样的异常:

    Java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x8E' for column 'nick' at row 1
    

    原因是MySQL里 urf8 编码最多只能支持3个字节,而Emoji表情字符使用的 urf8 编码,很多都是4个字节,有些甚至是6个字节。

    解决的方案有两种:

    1. 使用 utf8mb4 的 mysql 编码来容纳这些字符;
    2. 过滤掉这些特殊的表情字符。

    方法1:使用utf8mb4的mysql编码来容纳这些字符


    注意:要使用 utf8mb4 类型,首先要保证MySQL版本要不低于 MySQL 5.5.3。

    第一步:在mysql的安装目录下找到my.ini,作如下修改:

    [client] 
    default-character-set = utf8mb4 
    [mysql] 
    default-character-set = utf8mb4 
    [mysqld] 
    character-set-client-handshake = FALSE 
    character-set-server = utf8mb4 
    collation-server = utf8mb4_unicode_ci 
    init_connect='SET NAMES utf8mb4'
    

    修改后重启Mysql。

    第二步:将已经建好的表也转换成 utf8mb4

    alter table TABLE_NAME convert to character set utf8mb4 collate utf8mb4_bin; 
    

    将 TABLE_NAME 替换成你的表名。然后就OK了。

    网上流传的一个版本增加了一个步骤,就是以 root 身份登录 Mysql,修改环境变量,将

    character_set_client,character_set_connection,character_set_database,character_set_results,character_set_server
    

    都修改成 utf8mb4。不过我没有做这一步,也正常,所以可能是这一步是多余的。

    方法2:过滤掉这些特殊的字符


    import org.apache.commons.lang.StringUtils;
    
    public class charUtil {
        /**
         * 替换四个字节的字符 '\xF0\x9F\x98\x84\xF0\x9F)的解决方案 ��
         */
        public static String removeFourChar(String content) {
            byte[] conbyte = content.getBytes();
            for (int i = 0; i < conbyte.length; i++) {
                if ((conbyte[i] & 0xF8) == 0xF0) {
                    for (int j = 0; j < 4; j++) {
                        conbyte[i + j] = 0x30;// 0x30 int=48   字符=0
                    }
                    i += 3;
                }
            }
            content = new String(conbyte);
            return content.replaceAll("0000", "");
        }
    
        /**
         * 将emoji表情替换成*
         * @return 过滤后的字符串
         * 过滤的方式很简单,直接使用正则表达式匹配编码范围,然后替换就行了。
         */
        public static String filterEmoji(String source) {
            if (StringUtils.isNotBlank(source)) {
                return source.replaceAll("[\\ud800\\udc00-\\udbff\\udfff\\ud800-\\udfff]", "*");
            } else {
                return source;
            }
        }
    
        public static void main(String[] arg) {
            try {
                System.err.println("测试->将emoji表情替换成*");
                String text = "This is a smiley \uD83C\uDFA6 face\uD860\uDD5D \uD860\uDE07 \uD860\uDEE2 \uD863\uDCCA \uD863\uDCCD \uD863\uDCD2 \uD867\uDD98 ";
                System.out.println(text);
                System.out.println(text.length());
                System.out.println(text.replaceAll("[\\ud83c\\udc00-\\ud83c\\udfff]|[\\ud83d\\udc00-\\ud83d\\udfff]|[\\u2600-\\u27ff]", "*"));
                System.out.println(filterEmoji(text));
                //输出结果
                //This is a smiley �� face�� �� �� �� �� �� �� 
                //45
                //This is a smiley * face�� �� �� �� �� �� �� 
                //This is a smiley * face* * * * * * * 
    
                System.err.println("测试->替换四个字节的字符 '\\xF0\\x9F\\x98\\x84\\xF0\\x9F)的解决方案 ��");
                String title = "ff的范德萨分��������Llfldakf;dsk。f������������daslfjdsa;lfkjdsd'j'l'f'k'd'j'sa'l'k";
                System.out.println(removeFourChar(title));
                //输出结果:ff的范德萨分Llfldakf;dsk。fdaslfjdsa;lfkjdsd'j'l'f'k'd'j'sa'l'k
    
            } catch (Exception ex) {
                ex.printStackTrace();
            }
        }
    }
    
  • 相关阅读:
    EL表达式
    单例模式
    标准标签JSTL
    五大常用算法之三:贪心算法
    python字符串处理
    判断视图存不存在
    判断插入的数据在表中存不存在
    sql因为发现对象名称 'dbo.Ct2' 和索引名称 'PK_Ct2' 有重复的键,所以ALTER TABLE ALTER COLUMN 。。。 失败。
    C# MD5算法 16 32 大小写
    制作VS2022中文离线安装包
  • 原文地址:https://www.cnblogs.com/liupeifeng3514/p/10214392.html
Copyright © 2011-2022 走看看