zoukankan      html  css  js  c++  java
  • 【转】二维码生成原理

    原文链接:QR码生成原理-QR Code(ISO 18004)编码方式

    一、什么是QR码

    QR码属于矩阵式二维码中的一个种类,由DENSO(日本电装)公司开发,由JIS和ISO将其标准化。QR码的样子其实在很多场合已经能够被看到了,我这还是贴个图展示一下:

    QR码生成原理-QR <wbr>Code(ISO <wbr>18004)编码方式

    这个图如果被正确解码,应该看到我的名字和邮箱。

    二、QR码的特点

      说到QR码的特点:

      一是高速读取(QR就是取自“Quick Response”的首字母),对读取速度的体验源自于我手机上的一个软件,象上面贴出的码图,通过摄像头从拍摄到解码到显示内容也就三秒左右,对摄像的角度也没有什么要求;

      二是高容量、高密度;理论上内容经过压缩处理后可以存7089个数字,4296 个字母和数字混合字符,2953个8位字节数据,1817个汉字;

      三是支持纠错处理;纠错处理相对复杂,目前我还没有深入了解,按照QR码的标准文档说明,QR码的纠错分为4个级别,分别是:

        level L : 最大 7% 的错误能够被纠正;

        level M : 最大 15% 的错误能够被纠正;

        level Q : 最大 25% 的错误能够被纠正;

        level H : 最大 30% 的错误能够被纠正;

      四是结构化;看似无规则的图形,其实对区域有严格的定义,下图就是一个模式2、版本1的QR图结构(关于QR码的"模式"、"版本"将在后面进行介绍):

    QR码生成原理-QR <wbr>Code(ISO <wbr>18004)编码方式

      在上图21*21的矩阵中,黑白的区域在QR码规范中被指定为固定的位置,称为寻像图形(finder pattern) 和 定位图形(timing pattern)。寻像图形和定位图形用来帮助解码程序确定图形中具体符号的坐标。

      黄色的区域用来保存被编码的数据内容以及纠错信息码。

      蓝色的区域,用来标识纠错的级别(也就是Level L到Level H)和所谓的"Mask pattern",这个区域被称为“格式化信息”(format information)。

    五是扩展能力。QR码的Structure Append特点,使一个QR码可以分解成多个QR码,反之,也可以将多个QR码的数据组合到一个QR码中来:

    QR码生成原理-QR <wbr>Code(ISO <wbr>18004)编码方式

    三、QR码的模式和版本

      前面提到过QR码的模式(Model)和版本(Version)。QR码分为Model1和Model2两种模式,Model1是对QR的初始定义,Model2是对Model1的扩展,目前使用较为普遍的是Model2,本文的所有说明也仅用于Model2。

      QR图的大小(size)被定义为版本(Version),版本号从1到40。版本1就是一个21*21的矩阵,每增加一个版本号,矩阵的大小就增 加4个模块(Module),因此,版本40就是一个177*177的矩阵。(版本越高,意味着存储的内容越多,纠错能力也越强)。

    四、QR码支持的编码内容

      QR码支持编码的内容包括纯数字、数字和字符混合编码、8位字节码和包含汉字在内的多字节字符。其中:

        数字:每三个为一组压缩成10bit。

        字母数字混合:每两个为一组,压缩成11bit。

        8bit字节数据:无压缩直接保存。

        多字节字符:每一个字符被压缩成13bit。

    五、QR码编码原理(编码)

    编码就是把常见的数字、字符等转换成QR码的方法。说具体的编码之前,先说一下QR码的最大容量问题。

    5.1 最大容量

    QR码的最大容量取决于选择的版本、纠错级别和编码模式(Mode:数字、字符、多字节字符等)。以版本1、纠错级别为Level Q的QR码为例,可以存储27个纯数字,或17个字母数字混合字符或11个8bit字节数据。如果要存储同样多的内容同时提高纠错级别,则需要采用更高的 版本。版本1~9 数据容量、纠错码容量对照如下表:

    (version)

    (error correcting level)

    (count of data code words)

    count of EC code words

    (numeric)

    (alphanumeric)

    8bit

    1

    L

    19

    7

    41

    25

    17

    M

    16

    10

    34

    20

    14

    Q

    13

    13

    27

    16

    11

    H

    9

    17

    17

    10

    7

    2

    L

    34

    10

    77

    47

    32

    M

    28

    16

    63

    38

    26

    Q

    22

    22

    48

    29

    20

    H

    16

    28

    34

    20

    14

    3

    L

    55

    15

    127

    77

    53

    M

    44

    26

    101

    61

    42

    Q

    34

    36

    77

    47

    32

    H

    26

    44

    58

    35

    24

    4

    L

    80

    20

    187

    114

    78

    M

    64

    36

    149

    90

    62

    Q

    48

    52

    111

    67

    46

    H

    36

    64

    82

    50

    34

    5

    L

    108

    26

    255

    154

    106

    M

    86

    48

    202

    122

    84

    Q

    62

    72

    144

    87

    60

    H

    46

    88

    106

    64

    44

    6

    L

    136

    36

    322

    195

    134

    M

    108

    64

    255

    154

    106

    Q

    76

    96

    175

    108

    74

    H

    60

    112

    139

    84

    58

    7

    L

    156

    40

    370

    224

    154

    M

    124

    72

    293

    178

    122

    Q

    88

    108

    207

    125

    86

    H

    66

    130

    154

    93

    64

    8

    L

    194

    48

    461

    279

    192

    M

    154

    88

    365

    221

    152

    Q

    110

    132

    259

    157

    108

    H

    86

    156

    202

    122

    84

    9

    L

    232

    60

    552

    335

    230

    M

    182

    110

    432

    262

    180

    Q

    132

    160

    312

    189

    130

    H

    100

    192

    235

    143

    98

    如果要了解更详细的QR码容量信息,可以到电装的网站去看看:

    http://www.denso-wave.com/qrcode/vertable1-e.html

    下面,就举例说明将“ABCDE123”转换成为版本1、Level H的QR码转换方法。

    5.2 模式标识符(Mode Indicator)

    QR码的模式(Mode)就是前文提到的数字、字符、8bit 字节码、多字节码等。对于不同的模式,都有对应的模式标识符(Mode Indicator)来帮助解码程序进行匹配,模式标识符是4bit的二进制数:

    1、数字模式(numeric mode ): 0001

    2、混合字符模式(alphanumeric mode) : 0010

    3、8bit byte mode: 0100

    4、日本汉字(KANJI mode) : 1000

    5、中国汉字(GB2312):1101

    由于示例文本串是混合字符,因此将选择alphanumeric mode,其标识码为:0010

    5.3 文本串计数标识符(Character count indicator)

    文本串计数标识符用来存储源内容字符串的长度,在版本1-9的QR码中,文本串长度标识符自身的长度被定义为:

    数字 : 10bit

    混合字符 : 9bit

    8bit 字节码 : 8bit

    多字节码 : 8bit

    在本例中,源文本串的长度为8个字符,混合字符的长度为9bit,因此将字符个数8编码为9位二进制表示:000001000

    加上混合字符模式标识码,总的编码为0010 000001000

    5.4 数据内容编码

     1、数字模式下的编码

    在数字模式下,数据被限制为3个数字一段,分成若干段。如:"123456" 将分成"123" 和 "456",分别被编码成10bit的二进制数。“123”的10bit二进制表示法为:0001111011,实际上就是二进制的123。

    当数据的长度不足3个数字时,如果只有1个数字则用4bit,如果有2个数字就用7个bit来表示。
    如:"9876"被分成"987"和"6"两段,因此被表示为"1111011011 0110"。

    2、混合字符模式下的编码

    混合字符模式编码,其字符对照表如下:

    0

     0

     A

     10

     K

     20

     U

     30

     +

     40

    1

    1

    B

    11

    L

    21

    V

    31

    -

    41

    2

    2

    C

    12

    M

    22

    W

    32

    .

    42

    3

    3

    D

    13

    N

    23

    X

    33

    /

    43

    4

    4

    E

    14

    O

    24

    Y

    34

    :

    44

    5

    5

    F

    15

    P

    25

    Z

    35

    6

    6

    G

    16

    Q

    26

    [sp]

    36

    7

    7

    H

    17

    R

    27

    $

    37

    8

    8

    I

    18

    S

    28

    %

    38

    9

    9

    J

    19

    T

    29

    *

    3

    编码方式为:

    源码被分成两个字符一段,如下所示,每段的第一个字符乘上45,再用第二个数字相加。因此每段变成了11bit的2进制码,如果字符个数只有1个,则用6bit表示。

    示例:

    "AB"

    "CD"

    "E1"

    "23"

    45*10+11

    45*12+13

    45*14+1

    45*2+3

    461

    553

    631

    93

    0010

    000001000

    00111001101

    01000101001

    01001110111

    00001011101

    3、8bit字节数据不经编码转换直接保存。

    5.5 编码终止符(Terminator)

    如果编码后的字符长度不足当前版本和纠错级别所存储的容量,则在后续补"0000",如果容量已满则无需添加终止符。此时得到的编码串为:

    0010 000001000 00111001101 01000101001 01001110111 00001011101 0000

    5.6 编成8bit码字(Code words)

    将以上的编码再按8bit一组,形成码字(code words):

     00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000

    如果尾部数据不足8bit,则在尾部充0:

    00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000

    如果编码后的数据不足版本及纠错级别的最大容量,则在尾部补充 "11101100" 和"00010001",直到全部填满。最后,版本1、Level H下的"ABCDE123" 的QR码是:

    00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100

    十进制表示法为:

    32 65 205 69 41 220 46 128 236

    QR码编码原理(日本汉字和中文编码)

    一、日本汉字(KANJI)是两个字节表示的字符码,编码的方式是将其转换为13字节的二进制码制。

    转换步骤为:

    1、对于JIS值为8140(hex) 到9FFC(hex)之间字符:

    a)将待转换的JIS值减去8140(hex);

    b)将高位字节乘以C0(hex);

    c)将b)步骤生成的数据加上低位字节;

    d)将结果转换为13位二进制串。

    2、对于JIS值为E040(hex)到EBBF(hex)之间的字符:

    a)将待转换的JIS值减去C140(hex);

    b)将高位字节乘以C0(hex);

    c)将b)步骤生成的数据加上低位字节;

    d)将结果转换为13位二进制串。

    二、中文汉字的与日文汉字转换步骤相似:

    1、对于第一字节为0xA1~0xAA之间,第二字节在0xA1~0xFE之间字符:

    a)第一字节减去0xA1;

    b)上一步结果乘以0x60;

    c)第二字节减去0xA1;

    d)将b)步骤的结果加上c步骤的结果;

    e)将结果转换为13位二进制串。

    1、对于第一字节为0xB0~0xFA之间,第二字节在0xA1~0xFE之间字符:

    a)第一字节减去0xA6;

    b)上一步结果乘以0x60;

    c)第二字节减去0xA1;

    d)将b)步骤的结果加上c步骤的结果;

    e)将结果转换为13位二进制串。

  • 相关阅读:
    中小企业服务器配置方案(第三章 Web服务器)
    判断中日韩文的正则表达式
    中小企业服务器配置方案(第一章 代理接入服务器)
    ThinkPHP怎么样更好的使用Smarty第三方插件
    thinkphp 的目录结构
    学习Mysql命令行
    中小企业服务器配置方案(第五章 文件服务器)
    正则字符对应说明
    mysql导入导出.sql文件备份还原数据库[mysql导入导出sql命令行]
    中小企业服务器配置方案(第四章 邮件服务器)
  • 原文地址:https://www.cnblogs.com/xdouby/p/9007360.html
Copyright © 2011-2022 走看看