zoukankan      html  css  js  c++  java
  • php与ascii码

    首先 简单说一下历史,ascii码最开始是美国人搞出来的,用来干什么呢?我们知道,计算机只知道0和1,如果我们要计算机识别除了01之外的字符,例如 'a',我们要先告诉计算机‘1100001’就是'a'。跟摩斯密码一样,敲几下三长两短就是代表sos(开玩笑)。所谓的字符编码,就是跟计算机打交 道,跟计算机约定一连串的0101到底代表了什么字符。


    ascii编码是鼻祖了,不过由于ascii只有8bits,而且实际上用到的是7位,所以能表示的只有128个字符(00000000~01111111)。这128个字符包括了可打印的普通字符,也包括了不可打印的命令字符。看下表。

    这128个字符,对于美国人来说,应该是足够了。但对于一些使用非英文字符的国家地区,例如拉丁文,发文,俄文,中文,这就绝对不够。

    所以后来就有人搞了扩展的ascii,也有人搞了新的字符编码,在原来的8位基础上扩展到16位,32位。我们常见的ISOxxxx,GB2312,GBK,BIG 5,unicode....都是后来发展起来的。

    虽然这 些字符编码有些之间是不兼容,例如就中文而言,gb2312是不兼容unicode的,就是说,同一个汉字,底层约定的二进制是不一样的。网页上的乱码就 是出于此。但是这些后来发展的字符编码都向下兼容了ascii。这就是为什么utf-8(unicode)和gbk/gb2312显示英文是不会有乱码, 而显示中文会容易乱码。因为他们都兼容ascii,所以52个字母的显示都是按ascii标准。但ascii是没中文的,所以unicode,gbk都按 各自标准解释了。

    从简单入手,我们先来看ascii标准的编码。弄清楚PHP里面的二进制,十进制,八进制,十六进制,字符的表示与转化。
    先来说一下一些表示法:
    Dec:十进制
    Hex:十六进制
    Oct:八进制
    Bin:二进制

    所以数字16表示为:16D = 01H = 018O = 1000 0000B
    上面这些都是一些表示法而已。方便给人看的。

    =================================================================================================

    现在有一个需求,在程序中输入一个十六进制数,让计算机显示对应的ascii字符。例如就41H就对应A。
    方法一:
    转义字符:转义字符里提供\xdd和\ddd,\xdd表示十六进制,\ddd表示八进制
    所以我们可以:
    1. <?php  
    2. echo "\x41";                    //十六进制,\x开头  
    3. echo "\101";                    //八进制,随便几位  
    4. ?>  
    注意:转义字符只提供了十六进制和八进制转换到字符,没有提供二进制、十进制转换到字符。所以要用另外一种方法。

    方法二:
    用php里面的chr()函数。这个函数参数很简单,就是ascii码对应的十进制,十六进制,八进制。
    十进制:直接写整数
    八进制:第一位肯定是0,后面随便几位
    十六进制:0xdd
    二进制:字符串
    注意:一定要记清楚十六进制是0xdd
    1. <?php  
    2. echo chr(65);                    //十进制,由于都输数,所以没必要加双引号了  
    3. echo chr(0x41);                 //十六进制  
    4. echo chr(0101);                 //八进制,三位,最高位补零  
    5. echo chr('01000001');         //二进制,注意,这里的二进制一定要看做字符串,加引号!上面三个都不用加  
    6. ?>  

    方法三
    用php里面的printf/sprintf()函数格式化输出
    1. <?php  
    2. printf("%c", 0x41);               //第二个参数一定不能用单/双引号  
    3. printf("%c", 0101);               //第二个参数一定不能用单/双引号  
    4. printf("%c", 65);                    //第二个参数一定不能用单/双引号  
    5. printf("%c"'01000001');  
    6. ?>  
    第二个参数格式基本跟chr()的一样,8进制,10进制,16进制都不加引号,二进制就要加引号。8进制首位为0,16进制首位为0x。

    ====================================================================================
    现在是根据一个字符提取ascii表中的对应值
    方法一:
    ord()函数
    1. <?php  
    2. echo ord('A');  
    3. ?>  
    输出结果是65。因而这个函数只能从字符转化到十进制。
    注意:这个方法只提取第一个字符。如果是一个字符串,那就没办法处理后面的字符了。

    方法二:
    bin2hex()函数:将字符[串]转换为16进制
    1. <?php  
    2. echo bin2hex('A');  
    3. ?>  
    输出结果是41。
    注意,这个41只是字面数值,没有16进制的意义。
    这个函数不能用一个二进制‘01101...’直接转到16进制,只能由字符串转到16进制,真怪
    这个函数可以处理字符串  

    printf/sprintf()函数
    .....发现都不行
    所以,只能先用ord()转化为十进制,再转为二进制,八进制。(以后再看看pack这个函数)

    ====================================================================================

    各种进制 的转换:
    bindec():二进制转十进制
    1. <?php  
    2. echo bindec(1100);           //输出12,可以加引号,也可以不加                 
    3. ?>   
    decbin():十进制转二进制,一样用

    dechex() :十进制转16进制
    hexdec():16进制转10进制(参数直接写值,不用写0x)

    octdec():八进制转10进制
    decoct():10进制转8进制

    base_convert(要转换的数,原进制,目标进制):任意进制转换
    <?php
    echo base_convert(123, 6, 2);
    ?>

    注意:上面的这些转换函数,由于都是数学处理函数,所以参数都不需要是字符串形式(不需要加引号),直接写数值就行了。




    微软BI技术交流群:316744959 武汉NET技术群:961108969 NET技术群:21386099 本人具有丰富的系统开发经验,承接系统开发,小程序,NET系统开发,BI开发,有需求联系微信手机:15010195887
  • 相关阅读:
    东北育才 第1天
    东北育才 第0天
    BZOJ 3894 文理分科
    BZOJ 1001 [BeiJing2006]狼抓兔子
    POJ 2785 4 Values whose Sum is 0(暴力枚举的优化策略)
    UVA 1605 Building for UN(思维)
    统计频率(map映照容器的使用)
    POJ 1007 DNA Sorting(sort函数的使用)
    POJ 1002 487-3279(map映照容器的使用)
    BFS算法(——模板习题与总结)
  • 原文地址:https://www.cnblogs.com/Impulse/p/3137571.html
Copyright © 2011-2022 走看看