zoukankan      html  css  js  c++  java
  • 关于nodeJS多线程的支持,目前看来无法实现,讲解v8的一些东西

    关于这个,我这几天一直在研究,国内关于v8的资料很少,stackoverflow上也不多。

    说起来我得说声抱歉,虽然并没有承诺什么。这个功能大概是无法实现。下面我来解释一下为什么。

    首先我们要了解一下v8的运行机制。分为以下这些东西

    Context:           运行上下文,这在node启动的时候就被初始化了(这个我没怎么看明白)

    Isolate:             隔离域,代表一个v8虚拟机的实例,这是关键所在

    HandleScope:   句柄域,或者说是句柄集合,js对象存在堆中的引用,在c++中需要通过v8句柄(Handle)来操作js对象,HandleScope就是Handle的集合,当

                            一个HandleScope被释放了之后,所有包含的句柄也被释放,如果一个js对象在你的js代码中无非被使用,例如

                            var zs=new Person();

                            zs=1;   //此时刚刚创建的new Person();对象无法在js代码中被使用

                            同时在c++代码中也没有任何句柄指向它的时候,这个对象就会被v8的垃圾回收器给回收,即清除其在堆中占用的内存。

    Handle:             上面已经讲的很明白了,是c++中对js的引用。子类有Local和Persistent,后者在句柄域被回收时不会被回收,即v8会保留该对象的引用,

                            使其不被垃圾回收器回收。

    Locker/Unlocker:  Isolate的绝对线程锁。

    Context我不太了解,这里我不多做解释

    Isolate:

    这个是关键中的关键,Isolate的存在,让node实现js层面上的多线程成为了泡影,什么是js层面上的多线程呢?就是说将一个js函数交给子线程去执行。首先我们看一下Isolate的注释,翻译过来大概是这样的:

    Isolate代表了一个v8引擎的实例。每一个Isolate维护自己内部的状态。Isolate内创建的js对象无法在另一个Isolate中使用,v8允许创建多个Isolate并使它们并行运行在多个线程中。同一个Isolate同一时间只能在单个线程内运行。并且要求使用Locker/Unlocker使他们同步执行

     我们只关心两句话

    1.Isolate内创建的js对象无法在另一个Isolate中使用。

    这是什么意思呢。我们在c++和js中创建的js对象,实际上是保存在了一个Isolate实例中,你可以把Isolate想象成一个堆,创建的js对象从这个堆上占用内存。但是我建立在这个Isolate上的对象无法在另一个Isolate上使用。这就像是我有两个js文件,分别两次用node启动,这两个node程序无法使用对方的对象。

    //1.js

    var a=1;

    //2.js

    console.log(a);    //很明显这里是undefined,因为2.js中不存在a这个变量。

    当然到这里还没有问题,因为你可能会说我所有的线程共用一个Isolate就行了。那么我们看下面一句话。

    2.同一个Isolate同一时间只能在单个线程内运行

    这句话的意思是说同一个Isolate在多个线程中只能是串行的,比如有主线程和线程a和线程b,Isolate退出了主线程,线程a才能使用这个Isolate,线程b又会等待线程a退出Isolate。这样的结果是什么呢,我用一段代码来示例一下

    //假设有一个函数thread.run(fn,args,callback);     在子线程中执行fn,并传入参数args,执行完后执行callback回调

    thread.run(function(){

      console.log('子线程');

    },null,function(){

      console.log('子线程执行完毕');

    });

    while(true){

      console.log('主线程一直在打印...');

    }

    //如果是正常的理解,应该会输出如下结果

    ...

    ...(以上为省略)

    主线程一直在打印...

    主线程一直在打印...

    子线程

    ...

    主线程一直在打印...

    子线程执行完毕

    主线程一直在打印...

    ...

    ...

    但是node做不到这样,打印结果只能是

    子线程

    子线程执行完毕

    主线程一直在打印...

    主线程一直在打印...

    ...

    因为fn,args,callback是定义在一个Isolate上的对象,这个fn想在子线程运行,主线程必须退出该Isolate,这个时候子线程才能接手去执行fn和callback,执行完后又把这个Isolate交还给主线程。

    2.Locker/Unlocker

    我叫他Isolate的绝对线程锁。Locker能把一个Isolate锁定在当前线程,让其他线程无法使用。如果不使用Locker,子线程还是能够使用主线程的Isolate,只不过是串行的,但是一个Isolate如果被Locker锁在了一个线程,其他线程就绝对无法使用该Isolate。而Unlocker就是解开这个绝对锁。

    在不加锁的情况下

    //以下为子线程

    Isolate* isolate;   //假设这是从主线程传递过来的isolate实例

    isolate->Enter();  //isolate进入当前线程,其他线程不允许使用该isolate

    //...一万步操作后

    isolate->Exit();     //isolate退出该线程。其他线程现在可以使用了。

    假设主线程加了锁

    //主线程

    Locker(isolate);

    isolate->Exit();  //主线程退出该isolate

    //子线程

    isolate->Enter();  //错误,错误信息原文不记得了,意思是没有在适当的时候使用锁。

    3.v8的js对象管理

    这是与多线程无关的一些话题,但是讲到了v8我就想讲一讲。

    前面我讲过了Handle和HandleScope。学过c++就应该了解这是句柄的意思,没有学过c++就把他想象成引用对象的引用。总之Handle不是一个js对象,而是

    一个js对象的引用,通过这个Handle我可以操作一个js对象,并且在这个js对象没有被任何Handle指向,如同前面的例子一样,只不过换成了Handle而非js代码

    中的变量指向(这里其实是一样的),总而言之,无法使用这个对象了,你的代码里再也找不到这个对象了,v8的垃圾回收就会清楚这个对象。

    1.创建v8的js对象

    首先你必须有一个Isolate。前面已经讲过了一个isolate就是一个v8的实例,相当于一个js的运行环境,你的所有js对象必须创建在这个Isolate上

    v8::Isolate::CreateParams params();                   //params指创建isolate对这个isolate的一些配置,这里我不做设置,只创建一个默认的isolate

                                                                              (其实我没有看有哪些参数- -||)

    v8::Isolate* isolate=v8::Isolate::New(params);    //根据配置对象创建isolate

    v8::HandleScope handle_scope(isolate);              //创建该isolate的句柄域,如果不创建,v8会提示没有句柄域就创建了js对象句柄

    v8::Handle<v8::String> js_str=v8::Handle<v8::String>::NewFromUTF8(isolate,"hello world");

                                                                           //这句话创建一个句柄,该句柄指向一个v8::String对象,这个对象新创建并创建在刚刚的isolate中

    //...一万行代码后

    isolate->Dispose();                                            //释放isolate,所有句柄被释放,v8自动清空该isolate中的所有js对象。

    基本上所有v8的js对象都是这样创建 Handle<v8类型【v8::String,v8::Number等】>::New(isolate,值【int,char等】)

    v8类型就是js中定义的类型,基本类型有

    Value      代表任何类型

    Object    代表Object

    String     代表字符串

    Number   代表数字

    Boolean   代表布尔值

    Function  代表函数

    除此之外还有其他的类型

    Promise                         代表Promise

    FunctionCallbackInfo       代表函数的arguments

    ...

    4.Node是如何使用v8的

    v8在js层面是无法支持多线程的,因为无法传递函数,对象可以通过参数json化传递,但是比较麻烦。node是c++层面上的多线程。

    node可以分为两个部分

    v8

    node api

    举个例子fs.readFile(path,encoding,callback);

    js中调用这个函数的过程大概是这样的

    1.在主线程中将js变量的值转换为c++的值,比如将path和encoding转换为c++的字符串,并启用c++子线程去执行readFile这个操作。

    2.将该任务推入事件轮询,设置该任务状态为未完成

    3.c++子线程io完毕,通知事件轮询任务完成。

    4.事件轮询到该事件,将c++子线程的返回值转换为在主线程isolate上的js值,并将这个值作为参数传入回调函数,这个操作必须在主线程的isolate上执行。

    也就是说node将v8的对象转换为c++对象,子线程执行完毕后将结果转换回v8对象。这两次转换必须在同一个isolate中执行。所以node的异步只能提供基于c++的api而不能先实现node层面的多线程,归根结底这是v8不允许这样做。

    5.总结

    原本我是想做一个node的多线程插件,现在发现好像是不可能了。

    isolate间的通信我想过很多,比如我要子线程执行的函数中包含一个当前isolate的js对象,我就将这个对象传过去,并转换为json,在c++中解读出来,并在子线程中去创建新的isolate去转换回js对象。这样做是可以实现两个isolate通信的,但是函数没有办法传递。而且在运行的过程中必须将所有的参数传过去,这样一来就无法使用js闭包的特性。要想做到这一点,可能需要改v8的源码,但是我的c++并没有那么好,根本看不太懂。

    关于threads_a_gogo这个模块,他的api是eval(js代码),这样做等于是创建了一个新的上下文去执行这一段脚本。这样做也是一样的无法实现isolate间的通信,也就是说已经创建的函数和对象是无法使用的,只能使用一些基本的node内置的函数。

    还有cluster,这个模块是多进程模块,这个模块等于是启动多个进程去共同执行同一段js脚本,但是各个进程之间是没有关系的,进程a也无法使用进程b的对象和函数,也无法传递,所以说还是跨越不了isolate的限制。

    所以说并不是node不想做多线程,而是v8限制了。

  • 相关阅读:
    TypeError: Object of type 'type' is not JSON serializable解决方法
    Python Logging
    Mysql 主从赋值
    (转)Mysql 创建用户 查看权限 授权
    mysql you need (at least one of) the SYSTEM_USER privilege(s) for this operation
    java 多线程 六、线程状态
    java 多线程 五、线程组
    java 多线程 四、线程通信
    java Runtime类 Time类
    java 设计模式 ---- 饿汉 , 懒汉
  • 原文地址:https://www.cnblogs.com/kazetotori/p/6150216.html
Copyright © 2011-2022 走看看