zoukankan      html  css  js  c++  java
  • mysql数据库中的字符集

    第一章 字符集

    英文字符集:

    字符集

    说明

    字节长度

    ASCII

    美国标准信息交换代码

    单字节

    GBK

    汉字内码扩展规范

    双字节

    unicode

    万国码

    4字节

    UTF-8

    Unicode的可变长度字符编码

    16个字节

    1. ASCII

    ASCII 码使用指定的7 位或8 位二进制数组合来表示128 256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数来表示所有的大写和小写字母,数字0 9、标点符号, 以及在美式英语中使用的特殊控制字符。

    其中:

    031127(33)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8910 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

    32126(95)是字符(32是空格),其中485709十个阿拉伯数字。

    659026个大写英文字母,97122号为26个小写英文字母,其余为一些标点符号、运算符号等。

    2. GBK

    GBK 向下与 GB 2312 编码兼容。是中华人民共和国定义的汉字计算机编码规范。早期版本为GB2312

    3. Unicode

    Unicode(统一码、万国码、单一码)Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。以满足跨语言、跨平台进行文本转换、处理的要求。

    4. UTF-8

    是一种针对Unicode的可变长度字符编码,也是万国码。因为UNICODEASCII占用大一倍的空间,而对ASCII来说高字节的0对他毫无用处。为了解决这个问题,就出现了一些中间格式的字符集,他们被称为通用转换格式,即UTFUniversal Transformation Format

    5. 实际工作中要使用的编码

    gbk_chinese_ci 简体中文, 不区分大小写

    utf8_general_ci Unicode (多语言), 不区分大小写

    注意:

     mysql在写utf-8的时候写的是utf8。不加中间的中横线。

  • 相关阅读:
    python知识点
    python模块------pyinotify
    python模块------sys
    Ansible-----变量
    Docker-----仓库
    python模块------shutil
    Ansible-----循环
    ceph简单用户管理
    【js】两个数相除有余数时结果加1
    win10家庭版和专业版远程桌面出现身份验证错误, 要求的函数不受支持。解决办法【亲测有效】
  • 原文地址:https://www.cnblogs.com/dazhu-secure/p/13716641.html
Copyright © 2011-2022 走看看