zoukankan      html  css  js  c++  java
  • 浅析JavaScript中变量存储在堆中还是栈中-字符串、数字、其他类型分别是怎样存储的:984k的栈区为啥能装几十M的字符串、V8对字符串的处理过程(存在则复用地址,不存在则新建内存后把地址赋给变量/字符串不可变的理解)、数字(小整数在栈,其他在堆)、其他基本类型(引擎初始化时分配地址,之后都是复用同一个地址)

      看到这个问题,相信大家都觉得这个题目实在基础的不能再基础了。随手百度一下,就能看到很多人说:基本类型存在栈中,引用类型存在堆中。真的这么简单么?

      如果js中基础类型是存在栈里的,那为什么默认栈区大小为984KiB的V8可以允许声明500MiB大小的字符串呢?如果基础类型也是存在堆里的,又是怎么gc的呢?—— 看到这 2 个问题,我豁然开朗,觉得确实不那么简单了,研究一下。

    一、装不进冰箱的大象

      让我们看一下这段代码:在这里,我们声明了一个67MiB大小的字符串,如果字符串真的存在栈中,这就不好解释了。毕竟,v8默认的栈区大小为984KiB,肯定是存不下的。那这到底是怎么回事呢?

      注:在不同时期,不同操作系统中V8对于字符串大小的限制并不相同。大概有个范围是256MiB ~ 1GiB

    二、影分身的字符串

    const BasicVarGen = function () {
        this.s1 = 'IAmString'
        this.s2 = 'IAmString'
    }
    let a = new BasicVarGen()
    let b = new BasicVarGen()

      在这里,我们声明了两个一样的对象,每个对象包括两个相同的字符串。通过开发者工具,我们看到虽然我们声明了四个字符串,但是其内存指向了同一个地址。

      备注:chrome无法查看实际地址,此处为抽象后的地址

      这说明了啥?说明了四个字符串中存的是引用地址。所以上文中那个无法装进冰箱的大象,也就好解释了。字符串并没有存到栈中,而是存到了一个别的地方,再把这个地方的地址存到了栈中。那,让我们修改一下其中一个字符串的内容。

    const BasicVarGen = function () {
        this.s0 = 'IAmString'
        this.s1 = 'IAmString'
    }
    let a = new BasicVarGen()
    let b = new BasicVarGen()
    debugger
    a.s0 = 'different string'
    a.s2 = 'IAmString'

      这是 debugger 之前的内存快照

      这是 debugger 之后的内存快照。

      通过对比 2 份内存快照,我们可以看到 2 个结论:

    (1)a.s0 一开始内容为 ‘IAmString’ ,在我们修改其内容后,地址发生了变化

    (2)而我们新增的a.s2 其内容为 ‘IAmString’ ,其地址与其他值为 ‘IAmString’ 的变量保持一致

      那这是为什么呢?——  当我们声明一个字符串时:

    (1)v8内部有一个名为stringTable的hashmap缓存了所有字符串,在V8阅读我们的代码,转换抽象语法树时,每遇到一个字符串,会根据其特征换算为一个hash值,插入到hashmap中。在之后如果遇到了hash值一致的字符串,会优先从里面取出来进行比对,一致的话就不会生成新字符串类

    (2)缓存字符串时,根据字符串不同采取不同hash方式。

      所以让我们梳理一下:

    (1)在我们创建字符串的时候,V8会先从内存中(哈希表)查找是否有已经创建的完全一致的字符串

    (2)如果存在,直接复用

    (3)如果不存在,则开辟一块新的内存空间存进这个字符串,然后把地址赋到变量中

      这也是为什么我们不能直接用下标的方式修改字符串的原因: V8中的字符串都是不可变的

      拿出一个js的基本类型拷贝举例讲一下v8的实现逻辑和常规的大家理解的逻辑

    // 例: 
    var a = "刘潇洒";   // V8读取字符串后,去stringTable查找是否存在,发现不存在hashTable中,故插入'刘潇洒',并把'刘潇洒'的引用存入 a
    var b = a; // 直接拷贝 '刘潇洒' 的引用 
    b = "谭雅文"; // 查找, 无, 存入stringTable

      这里有个疑问点:字符串拼接又做了哪些操作呢

    // 接上面代码,我们加上
    a.s3 = a.s2+a.s0;   // 疑问点: 字符串拼接做了哪些操作?
    a.s4 = a.s2+a.s0

      同时申请两个拼接的字符串,内容相同。

      可以看到,虽然其内容相同。但是地址并不相同。而且,地址前方的Map描述也发生了变化。

    字符串拼接时如果以传统方式(如 SeqString)存储,拼接操作的时间复杂度为 O(n) ,采用 绳索结构[Rope Structure] (也就是 ConsString 所采用的数据结构)可以减少拼接所花费的时间。
      那么我们需要继续思考了:如果字符串是这样,那别的基本类型也是如此么?

    三、如朕亲临的 ‘奇球’

      说完字符串,让我们看看V8中另外一类典型的‘基本类型’: oddBall。

      拓展自 oddBall 的 type,让我们再做一个小实验:

      然后看一下内存分配情况:可以看到 2 个对象的基本类型的引用地址都是一样的。

      我们可以看到上图中列举的基本类型,地址也是相同的。在赋值时,也是就地复用

      而且这些拓展自 oddBall 的基本类型,其地址是固定的,也就是说,在V8跑起来的第一时间,不管我们有没有声明这些基本类型,他们都已经被创建完毕了而我们声明对象时,赋的是他们的引用

      这也可以解释为什么我们说基本类型是赋到栈中在V8中,存放在 @73 的值,永远是空字符串,那么v8就可以等效把这些地址视为值本身

    四、扑朔迷离的数字

      之所以叫扑朔迷离的数字,是因为还没有搞明白其分配与改变时内存分配的机制。(其内存是动态的)

      数字在V8中分为 smi 和 heapNumber。

      smi 直接存进内存,范围为 : -2³¹ 到 2³¹-1(2³¹≈2*10⁹)的整数

      heapNumber 类似字符串,不可变,范围为 :所有非smi的数字,最低位用来表示是否为指针,最低位为1,则是一个指针。

    const o = {
      x: 42,  // Smi
      y: 4.2, // HeapNumber
    };

      o.x 中的42会被当成Smi直接存储在对象本身,而 o.y 中的4.2需要额外开辟一个内存实体存放,并将 o.y 的对象指针指向该内存实体。

      如果是 32 位操作系统,用32位表示smi 可以理解,可是64位操作系统中,为什么 smi 范围也是 -2³¹ 到 2³¹-1(2³¹≈2*10⁹)?

      ECMAScript 标准约定number数字需要被当成 64 位双精度浮点数处理,但事实上,一直使用 64 位去存储任何数字实际是非常低效的(空间低效,计算时间低效 smi大量使用位运算),所以 JavaScript 引擎并不总会使用 64 位去存储数字,引擎在内部可以采用其他内存表示方式(如 32 位),只要保证数字外部所有能被监测到的特性对齐 64 位的表现就行。

    const cycleLimit = 50000
    console.time('heapNumber')
    const foo = { x: 1.1 };
    for (let i = 0; i < cycleLimit; ++i) {
    // 创建了多出来的heapNumber实例
      foo.x += 1; 
    }
    console.timeEnd('heapNumber') // slow   
    
    console.time('smi')
    const bar = { x: 1.0 };
    for (let i = 0; i < cycleLimit; ++i) {
      bar.x += 1;
    }
    console.timeEnd('smi')  // fast

      我们再来看一个疑问点:

    const BasicVarGen = function () {
        this.smi1 = 1
        this.smi2 = 2
        this.heapNumber1 = 1.1
        this.heapNumber2 = 2.1
    }
    let foo = new BasicVarGen()
    let bar = new BasicVarGen()
    debugger
    baz.heapNumber1 ++

      在数字中,一个数字的值都没有修改(注意后面是 baz 不是 bar),其他的数字地址也都变了。

    五、总结:基本类型到底存在哪里?

    1、字符串: 存在堆里,栈中为引用地址,如果存在相同字符串,则引用地址相同

    2、数字: 小整数存在栈中,其他类型存在堆中

    3、其他类型:引擎初始化时分配唯一地址,栈中的变量存的是唯一的引用

      这里只能算是大概讲明白了基本类型存在哪里,在学习探索的过程中,虽然一些疑问得到了解答,但是问题却变得更多了。

    学习文章链接:https://www.zhihu.com/question/482433315/answer/2083349992
  • 相关阅读:
    学习ExtJS(十一) accordion布局
    学习ExtJS(十) form布局
    使用PS保存PDF为图片(JPG)
    问题12:能否说:“电路交换和面向连接是等同的,而分组交换和无连接是等同的”? 答:不行。这在概念上是很不一样的。这点可举例说明如下。
    使用matlab判断CDMA接收码片
    问题115:什么是“无缝的”、“透明的”和“虚拟的”?
    百度域名信息
    问题110:有这样的说法:习惯上,人们都将网络的“带宽”作为网络所能传送的“最高数据率”的同义语。这样的说法有何根据?
    问题111:有时可听到人们将“带宽为10 Mb/s的以太网”说成是“速率(或速度)为10 Mb/s的以太网”或“10兆速率(或速度)的以太网”。试问这样的说法正确否?
    Tomcat中显示目录的配置
  • 原文地址:https://www.cnblogs.com/goloving/p/15352261.html
Copyright © 2011-2022 走看看