zoukankan      html  css  js  c++  java
  • 了解MySQL的字符集

    在数据库中,字符乱码属于常见、多发问题。鉴于本人水平顶多只能归于不入流之类,写这篇文章时内心诚惶诚恐,实在担心误导大家。内容仅供参考,若有错误,请各位及时指出,我也好学习提高!

    MySQL的字符集有4种级别的设置,分别是:服务器级、数据库级、表级、字段级。

    一、服务器级字符集

    (1)、可以在my.cnf中设置

    [mysqld]
    default-character-set=gbk (5.1)
    character-set-server=gbk (5.5)

    (2)、可以在启动选项中设置

    mysqld --default-character-set=gbk

    (3)、可以在编译的时候设置

    ./configure --with-charset=gbk
              或
    cmake . -default-charset=gbk
    

    如果没有指定服务器的字符集,默认使用latin1为服务器的字符集。

    (4)、查看当前服务器的字符集

    mysql> show variables like '%char%';
    +--------------------------+-----------------------------------------+
    | Variable_name            | Value                                   |
    +--------------------------+-----------------------------------------+
    | character_set_client     | latin1                                  |
    | character_set_connection | latin1                                  |
    | character_set_database   | latin1                                  |
    | character_set_filesystem | binary                                  |
    | character_set_results    | latin1                                  |
    | character_set_server     | latin1                                  |
    | character_set_system     | utf8                                    |
    | character_sets_dir       | /usr/local/mysql-5.6.28/share/charsets/ |
    +--------------------------+-----------------------------------------+
    

    二、数据库字符集

    数据库的字符集在创建数据库的时候指定,也可以在创建完数据库之后通过alter database语句修改。如果数据库中已经存在数据,修改数据库字符集并不能将已有的数据按新字符集存放。所以无法通过修改数据库字符集修改数据的内容。

    设置数据库字符集的规则:

    (1)、如果指定了字符集和校对规则,则使用指定的规则;

    (2)、如果仅指定字符集而没有指定校对规则,则使用指定的字符集和默认的校对规则;

    (3)、如果没有指定字符集和校对规则,则使用服务器的字符集和校对规;

    三、表字符集

    表的字符集是在建表的时候指定的,可以通过alter table语句进行修改。同样,对于表中已经存在的数据,修改字符集不会影响原有的记录,仍将使用原有的字符集。

    设置表的字符集的规则同设置数据库的字符集规则。

    四、列字符集

    列的字符集和校对规则可以在建表的时候指定,也可以在修改表的时候调整。(这个不常用,仅记录一下)

    五、SET NAMES命令

    除了上述的四种字符集外,对实际的应用访问来说,还存在客户端和服务端之间交互的字符集,如下:

    (1)、character_set_client:客户端字符集
    (2)、character_set_connection:连接字符集
    (3)、character_set_resluts:结果字符集

    通常情况下,这3个字符集都应该是相同的,才能保证用户写入的数据被正确的读出,特别是对于中文字符。

    set names命令则用于同时修改这3个参数的值。

    六、关于中文字符集插入的实验

    字符集不一致是导致数据库内中文内容乱码的罪魁祸首。

    实验环境:

    Server version: 5.6.28 (在此说明实验环境是由于在学习过程中,从网上参考了部分资料,实验过程与资料描述稍有出入,未查出原因,只能暂归结为版本不同所致。)

    实验对象:

    mysql> show create table char_testG 
    *************************** 1. row ***************************
           Table: char_test
    Create Table: CREATE TABLE `char_test` (
      `id` smallint(6) NOT NULL AUTO_INCREMENT,
      `name` char(20) NOT NULL,
      PRIMARY KEY (`id`)
    ) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=latin1
    1 row in set (0.00 sec)
    

    由上可知,char_test表的字符集是latin1,如果不设置正确的字符集,插入中文字符时,必然会出现如下错误:

    mysql> insert into char_test (name) values ('小王');
    ERROR 1366 (HY000): Incorrect string value: 'xE5xB0x8FxE7x8Ex8B' for column 'name' at row 1
    

    解决方案

    (1)、先set names latin1,然后再插入数据。

    mysql> set names latin1;
    Query OK, 0 rows affected (0.00 sec)
    
    mysql> insert into char_test (name) values ('小王');
    Query OK, 1 row affected (0.01 sec)
    
    mysql> select * from char_test;
    +----+--------+
    | id | name   |
    +----+--------+
    |  1 | Tom    |
    |  2 | 小明   |
    |  3 | 小王   |
    +----+--------+
    3 rows in set (0.00 sec)
    

    (2)、在data.sql文件中指定set names latin1,然后通过source命令导入data.sql。

    # vi data.sql
    set names latin1;
    insert into char_test (name) values ('小李');
    
    mysql> source data.sql
    Query OK, 1 row affected (0.00 sec)
    
    mysql> select * from char_test;
    +----+--------+
    | id | name   |
    +----+--------+
    |  1 | Tom    |
    |  2 | 小明   |
    |  3 | 小王   |
    |  4 | 小李   |
    +----+--------+
    4 rows in set (0.00 sec)
    

    (3)、在data.sql文件中指定set names latin1,然后通过mysql命令导入

    # vi data.sql
    set names latin1;
    insert into char_test (name) values ('小张');
    
    # mysql -uroot -p test1 < data.sql
    # mysql -uroot -p -e "set names latin1;select * from test1.char_test;"

    (4)、通过指定mysql命令的字符集参数实现 --default-charset-set=字符集

    # vi data.sql
    insert into char_test (name) values ('小张');
    
    # 错误方法
    # mysql -uroot -p  test1 < data.sql                      
    Enter password: ******
    ERROR 1366 (HY000) at line 1: Incorrect string value: 'xE5xB0x8FxE8xB5xB5' for column 'name' at row 1
    
    # 正确方法
    # mysql -uroot -p  --default-character-set=latin1 test1 < data.sql 
    Enter password: ******
    
    # mysql -uroot -p -e "set names latin1;select * from test1.char_test;"
    Enter password: ******
    +----+--------+
    | id | name   |
    +----+--------+
    |  1 | Tom    |
    |  2 | 小明   |
    |  3 | 小王   |
    |  4 | 小李   |
    |  5 | 小张   |
    |  6 | 小赵   |
    +----+--------+
    

    (5)、在配置文件中指定客户端的字符集

    vi my.cnf
    [client]
    default-character-set=latin1
    
    mysql> insert into char_test (name) values ('小马');
    Query OK, 1 row affected (0.00 sec)
    
    mysql> select * from char_test;
    +----+--------+
    | id | name   |
    +----+--------+
    |  1 | Tom    |
    |  2 | 小明   |
    |  3 | 小王   |
    |  4 | 小李   |
    |  5 | 小张   |
    |  6 | 小赵   |
    |  7 | 小马   |
    +----+--------+
    7 rows in set (0.00 sec)
    
  • 相关阅读:
    Solidity 官方文档中文版 3_安装Solidity
    javaweb监听器
    ssh基础配置大全
    servlet
    压缩介绍
    jsp小结
    servlet生命周期
    后台权限验证
    进程&线程
    StrutsPreparedAndExcuteFilter与Interceptor
  • 原文地址:https://www.cnblogs.com/sunmengbbm/p/5654866.html
Copyright © 2011-2022 走看看