zoukankan      html  css  js  c++  java
  • MySQL_编码utf8_bin和utf8_general_ci的区别

    编码区别
    在mysql中存在着各种utf8编码格式,如下(新建数据库时一般选用utf8_general_ci就可以):
    utf8_bin:将字符串中的每一个字符用二进制数据存储,区分大小写(在二进制中 ,小写字母 和大写字母 不相等.即 a !=A)。
    utf8_genera_ci:不区分大小写,ci为case insensitive的缩写(insensitive ; 中文解释: adj. 感觉迟钝的,对…没有感觉的),即大小写不敏感。
    utf8_general_cs:区分大小写,cs为case sensitive的缩写(sensitive 中文解释:敏感事件;大小写敏感;注重大小写;全字拼写须符合),即大小写敏感
    utf8_unicode_ci:不能完全支持组合的记号。

    应用上的差别
    utf8_general_ci与utf8_unicode_ci

    一句话概况:utf8_unicode_ci比较准确,utf8_general_ci速度比较快。

    utf8_general_ci与utf8_bin

    用utf8_genera_ci没有区分大小写,导致这个字段的内容区分大小写时出问题:
    作为密码时就会出现不合理的方面;
    而验证码则一般不区分大小写,所以用这个就合理
    utf8_general_cs这个选项一般不用,所以使用utf8_bin区分大小写

    修改编码
    两种修改方案:

    通过SQL(结构化查询语言(Structured Query Language))来修改
    alter table emp modify ename varchar(30) collate utf8_general_ci
    直接通过设计表,点击需要修改字段,直接可修改utf8_general_ci为utf8_bin。

    示例

    CREATE TABLE `t_bin` (
    `id` int(11) DEFAULT NULL,
    `name` varchar(20) DEFAULT NULL,
    UNIQUE KEY `uk_name` (`name`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;
    
    CREATE TABLE `t_ci` (
    `id` int(11) DEFAULT NULL,
    `name` varchar(20) DEFAULT NULL,
    UNIQUE KEY `uk_name` (`name`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci;
    
    CREATE TABLE `t_default` (
    `id` int(11) DEFAULT NULL,
    `name` varchar(20) DEFAULT NULL,
    UNIQUE KEY `uk_name` (`name`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
    

    执行以下语句

    insert into t_bin values (1, 'Alex');
    insert into t_bin values (2, 'alex');
    
    insert into t_ci values (1, 'Alex');
    insert into t_ci values (2, 'alex');
    
    insert into t_default values (1, 'Alex');
    insert into t_default values (2, 'alex');

    结果如下:

    insert into t_bin values (1, 'Alex')
    > Affected rows: 1
    > 时间: 0.067s
    
    
    insert into t_bin values (2, 'alex')
    > Affected rows: 1
    > 时间: 0.031s
    
    
    insert into t_ci values (1, 'Alex')
    > Affected rows: 1
    > 时间: 0.098s
    
    
    insert into t_ci values (2, 'alex')
    > 1062 - Duplicate entry 'alex' for key 'uk_name'
    > 时间: 0.024s
    > 

    结果分析

    编码为utf8_bin时,Alex和alex被认为是两个不同的值,区分大小写;
    编码为utf8_general_ci时,即默认的编码时,Alex和alex被认为是相同的值,不区分大小写。
    所以在选择编码的时候应该注意区分。
  • 相关阅读:
    C# 时间格式总结
    一些学习的网址和资料
    强命名程序集与弱命名类型的区别
    数据库的三大范式
    keydown > keypress > keyup 用法和区别
    小学生四则运算小程序
    IPC$渗透使用
    免杀
    Linux安装Python xlrd、xlwt、xlutils模块
    Linux提权之信息收集
  • 原文地址:https://www.cnblogs.com/xiaozengzeng/p/13358248.html
Copyright © 2011-2022 走看看