zoukankan      html  css  js  c++  java
  • 前端对base64编码的理解,原生js实现字符base64编码

    @



    常见对base64的认知(不完全正确)

    首先对base64常见的认知,也是须知的必须有以下几点*

    • base64是一种图片编码方式,用一长串超长的字符串表示图片
    • 在加载的时候会直接以字符串的形式加载出来,减少了图片加载的http请求
    • 正常加载服务器静态资源的时候都应该是通过http请求回来,每加载一张图片时需要发起一次http请求 ,http请求建立需要一定的时间,所以对于小图而且出现频次比较高的话,这样的成本消耗其实是特别浪费的
    • 所以一般base64编码适用于小图片,出现频次比较高的情况

    当然base64编码也有一定的缺点

    • 会增加图片本上的大小,对于小图来说,转码增加的大小和http请求发起的浪费时间相比还是划算的,但是对于大图和出现次数比较少的情况,这种方法就有待商榷
    • 当然上面我现在项目这种问题就很不合适,肯定需要寻求一个好的方式来解决掉这个问题

    多问一个为什么,base64到底是个啥?

    • base64是一种编码方式,将二进制编码为64字符串组成的字符码
    • 标准的Base64并不适合直接放在URL里传输,因为URL编码器会把标准Base64中的“/”和“+”字符变为形如“%XX”的形式,而这些“%”号在存入数据库时还需要再进行转换,因为ANSI SQL中已将“%”号用作通配符。
    • 为解决此问题,可采用一种用于URL的改进Base64编码,它在末尾填充'='号,并将标准Base64中的“+”和“/”分别改成了“-”和“_”,这样就免去了在URL编解码和数据库存储时所要作的转换,避免了编码信息长度在此过程中的增加,并统一了数据库、表单等处对象标识符的格式。
    • 另有一种用于正则表达式的改进Base64变种,它将“+”和“/”改成了“!”和“-”,因为“+”,“*”以及前面在IRCu中用到的“[”和“]”在正则表达式中都可能具有特殊含义。
    • 此外还有一些变种,它们将“+/”改为“-”或“.”(用作编程语言中的标识符名称)或“.-”(用于XML中的Nmtoken)甚至“_:”(用于XML中的Name)。
    • Base64要求把每三个8Bit的字节转换为四个6Bit的字节(38 = 46 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。

    ok,我承认以上都是百度出来了,接下来谈谈我自己的认识,哈哈

    直接掏个例子吧,比如,原生js是自带base64的编码方法的

    var b = Buffer.from('asdasds'); //buffer 是js里面专门存放二进制的缓存区,暂时理解创建一个二进制变量
    var s = b.toString('base64');
    console.log(s)
    //  YXNkYXNkcw==
    

    按照我们的思路实现一下

    • base64是针对二进制对象进行编码,所以我们要将字符转换为二进制码
    • base64 是用64个字符表示二进制,2的6次方 = 64,所以base64的字符其实是每6个二进制位为单位,但是一个字节是8bit,如果不满6的倍数要往 字节转换后的二进制编码后面补0,比如如果是两个个字符
      'ac' =》 转换为二进制为:'0110 0001 0110 0010' =》
      如果要将这两个字符进行base64编码,但是base64仅支持6位二进制转换为一个字符,
      截取之后就是=》 011000 010110 0010
      那最后面的4位二进制不够转码,所以会在后面默认补零
    • 补码完成之后开始转码 从000000 到111111分别对应ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=64个字符中的一个
    • 转码完成

    转换字符为二进制数

    function toBinary (str){
        let tempResult = [];
        let result = [];
        // 分割字符
        str.split('').forEach(element => {
        	//转二进制
            let binaryElement = element.charCodeAt().toString(2)
            //由于js原生方法转二进制如果前面是0可能会不满8位,所以前面补0,转为8位的对应ascii码二进制
            binaryElement = binaryElement.length === 8 ? binaryElement : ('0' + binaryElement)  //不足8位的二进制码在前面补0
            tempResult.push(binaryElement);
        });
        let index = 0;
        // 不满3个字符往后面补满3个字符(3个字符(24个二进制位)是6和8的最小公倍数)
        while(tempResult.length % 3 != 0){
            tempResult.push('00000000')
        }
        console.log(tempResult.length)
        return tempResult.join('');
    }
    let binary = toBinary('asdasds');
    

    那么就是第一步和第二步实现了

    二进制转 base64字符串

    //将字符串存为数组
    let KEYCODE = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=".split(''); 
    
    function toBase64 (binary){
        console.log(binary);
        let tempResult = [];
        let result = [];
        let index = 0;
        // 每6位切割二进制
        while(index+6 < binary.length){
            tempResult.push(binary.slice(index,index+6))
            index = index + 6 ;
        }
        //不满6位的前面补0
        console.log(binary.slice(index,index+6))
        tempResult.push(("000000" + binary.slice(index,index+6)).substr( -6 ));
        tempResult.forEach(element => {
        	//将二进制转为数组下标
            let index = parseInt(element,2);
            //获取对应下标字符串
            result.push(index === 0 ? '=' : KEYCODE[index])
        });
        //字符串拼接
        return result.join('')
    }
    let a = toBase64(binary);
    console.log(a);
    
    //  YXNkYXNkcw==
    

    到这里基本就实现了,结果跟原生的方法打印的是一样的

    但是也存在一些问题和改进

    • 对于中文字符和特殊字符的支持

      javascript中的中文都是默认utf-16编码,但是网页中编码格式基本都是UTF-8,然而即便我们用UTF-8格式保存了HTML文件,但是其中的中文字符依然是以UTF-16的形式保存的。所以我们首先要将中文字符转化为utf-8,然后再转二进制,最后即可用上面的方法进行编码
      代码如下:

      var utf16ToUtf8 = function (utf16Str) {
      var utf8Arr = [];
      var byteSize = 0;
      var tempList = [];
      for (var i = 0; i < utf16Str.length; i++) {
          //获取字符Unicode码值
          var code = utf16Str.charCodeAt(i);
      
          //如果码值是1个字节的范围,则直接写入
          if (code >= 0x00 && code <= 0x7f) {
              byteSize += 1;
              utf8Arr.push(code);
      
              //如果码值是2个字节以上的范围,则按规则进行填充补码转换
          } else if (code >= 0x80 && code <= 0x7ff) {
              byteSize += 2;
              utf8Arr.push((192 | (31 & (code >> 6))));
              utf8Arr.push((128 | (63 & code)))
          } else if ((code >= 0x800 && code <= 0xd7ff)
              || (code >= 0xe000 && code <= 0xffff)) {
              byteSize += 3;
              utf8Arr.push((224 | (15 & (code >> 12))));
              utf8Arr.push((128 | (63 & (code >> 6))));
              utf8Arr.push((128 | (63 & code)))
          } else if(code >= 0x10000 && code <= 0x10ffff ){
              byteSize += 4;
              utf8Arr.push((240 | (7 & (code >> 18))));
              utf8Arr.push((128 | (63 & (code >> 12))));
              utf8Arr.push((128 | (63 & (code >> 6))));
              utf8Arr.push((128 | (63 & code)))
          }
      }
      var toBin = (n) => {
      if(n == 0) return '0';
          var res = '';  
          while(n != 0) {
              res = n % 2 + res
              n = parseInt(n / 2)
              }  
          return res;
      }
      utf8Arr.forEach(element => {
         tempList.push(toBin(element)) 
      });
      return tempList.join('')
      }
      
    • 如何对图片base64编码进行实现

      图片的话,要用到canvas ,将图片转换为二进制流,然后再掉用上述的编码方法


    下一次

    • 可以尝试图片的base64编码
    • 可以做解码过程
  • 相关阅读:
    PAT (Advanced Level) 1060. Are They Equal (25)
    PAT (Advanced Level) 1059. Prime Factors (25)
    PAT (Advanced Level) 1058. A+B in Hogwarts (20)
    PAT (Advanced Level) 1057. Stack (30)
    PAT (Advanced Level) 1056. Mice and Rice (25)
    PAT (Advanced Level) 1055. The World's Richest (25)
    PAT (Advanced Level) 1054. The Dominant Color (20)
    PAT (Advanced Level) 1053. Path of Equal Weight (30)
    PAT (Advanced Level) 1052. Linked List Sorting (25)
    PAT (Advanced Level) 1051. Pop Sequence (25)
  • 原文地址:https://www.cnblogs.com/zm-blogs/p/11412255.html
Copyright © 2011-2022 走看看