zoukankan      html  css  js  c++  java
  • Java的LockSupport.park()实现分析

    LockSupport类是Java6(JSR166-JUC)引入的一个类,提供了主要的线程同步原语。LockSupport实际上是调用了Unsafe类里的函数,归结到Unsafe里,仅仅有两个函数:

      public native void unpark(Thread jthread);
      public native void park(boolean isAbsolute, long time);

    isAbsolute參数是指明时间是绝对的,还是相对的。

    只两个简单的接口,就为上层提供了强大的同步原语。

    先来解析下两个函数是做什么的。

    unpark函数为线程提供“许可(permit)”,线程调用park函数则等待“许可”。这个有点像信号量,可是这个“许可”是不能叠加的,“许可”是一次性的。

    比方线程B连续调用了三次unpark函数,当线程A调用park函数就使用掉这个“许可”,假设线程A再次调用park,则进入等待状态。

    注意,unpark函数能够先于park调用。比方线程B调用unpark函数,给线程A发了一个“许可”,那么当线程A调用park时,它发现已经有“许可”了,那么它会立即再继续执行。

    实际上,park函数即使没有“许可”,有时也会无理由地返回,这点等下再解析。

    park和unpark的灵活之处

    上面已经提到,unpark函数能够先于park调用,这个正是它们的灵活之处。

    一个线程它有可能在别的线程unPark之前,或者之后,或者同一时候调用了park,那么由于park的特性,它能够不用操心自己的park的时序问题,否则,假设park必需要在unpark之前,那么给编程带来非常大的麻烦!!

    考虑一下,两个线程同步,要怎样处理?

    在Java5里是用wait/notify/notifyAll来同步的。wait/notify机制有个非常蛋疼的地方是,比方线程B要用notify通知线程A,那么线程B要确保线程A已经在wait调用上等待了,否则线程A可能永远都在等待。编程的时候就会非常蛋疼。

    另外,是调用notify,还是notifyAll?

    notify仅仅会唤醒一个线程,假设错误地有两个线程在同一个对象上wait等待,那么又悲剧了。为了安全起见,貌似仅仅能调用notifyAll了。

    park/unpark模型真正解耦了线程之间的同步,线程之间不再须要一个Object或者其他变量来存储状态,不再须要关心对方的状态。


    HotSpot里park/unpark的实现

    每一个java线程都有一个Parker实例,Parker类是这样定义的:

    class Parker : public os::PlatformParker {
    private:
      volatile int _counter ;
      ...
    public:
      void park(bool isAbsolute, jlong time);
      void unpark();
      ...
    }
    class PlatformParker : public CHeapObj<mtInternal> {
      protected:
        pthread_mutex_t _mutex [1] ;
        pthread_cond_t  _cond  [1] ;
        ...
    }
    能够看到Parker类实际上用Posix的mutex,condition来实现的。

    在Parker类里的_counter字段,就是用来记录所谓的“许可”的。

    当调用park时,先尝试直接是否能直接拿到“许可”,即_counter>0时,假设成功,则把_counter设置为0,并返回:

    void Parker::park(bool isAbsolute, jlong time) {
      // Ideally we'd do something useful while spinning, such
      // as calling unpackTime().
    
    
      // Optional fast-path check:
      // Return immediately if a permit is available.
      // We depend on Atomic::xchg() having full barrier semantics
      // since we are doing a lock-free update to _counter.
      if (Atomic::xchg(0, &_counter) > 0) return;

    假设不成功,则构造一个ThreadBlockInVM,然后检查_counter是不是>0,假设是,则把_counter设置为0,unlock mutex并返回:

      ThreadBlockInVM tbivm(jt);
      if (_counter > 0)  { // no wait needed
        _counter = 0;
        status = pthread_mutex_unlock(_mutex);

    否则,再推断等待的时间,然后再调用pthread_cond_wait函数等待,假设等待返回,则把_counter设置为0,unlock mutex并返回:

      if (time == 0) {
        status = pthread_cond_wait (_cond, _mutex) ;
      }
      _counter = 0 ;
      status = pthread_mutex_unlock(_mutex) ;
      assert_status(status == 0, status, "invariant") ;
      OrderAccess::fence();
    当unpark时,则简单多了,直接设置_counter为1,再unlock mutext返回。假设_counter之前的值是0,则还要调用pthread_cond_signal唤醒在park中等待的线程:

    void Parker::unpark() {
      int s, status ;
      status = pthread_mutex_lock(_mutex);
      assert (status == 0, "invariant") ;
      s = _counter;
      _counter = 1;
      if (s < 1) {
         if (WorkAroundNPTLTimedWaitHang) {
            status = pthread_cond_signal (_cond) ;
            assert (status == 0, "invariant") ;
            status = pthread_mutex_unlock(_mutex);
            assert (status == 0, "invariant") ;
         } else {
            status = pthread_mutex_unlock(_mutex);
            assert (status == 0, "invariant") ;
            status = pthread_cond_signal (_cond) ;
            assert (status == 0, "invariant") ;
         }
      } else {
        pthread_mutex_unlock(_mutex);
        assert (status == 0, "invariant") ;
      }
    }
    简而言之,是用mutex和condition保护了一个_counter的变量,当park时,这个变量置为了0,当unpark时,这个变量置为1。
    值得注意的是在park函数里,调用pthread_cond_wait时,并没实用while来推断,所以posix condition里的"Spurious wakeup"一样会传递到上层Java的代码里。

    关于"Spurious wakeup",參考上一篇blog:http://blog.csdn.net/hengyunabc/article/details/27969613

      if (time == 0) {
        status = pthread_cond_wait (_cond, _mutex) ;
      }

    这也就是为什么Java dos里提到,当以下三种情况下park函数会返回:

    • Some other thread invokes unpark with the current thread as the target; or
    • Some other thread interrupts the current thread; or
    • The call spuriously (that is, for no reason) returns.

    相关的实现代码在:

    http://hg.openjdk.java.net/build-infra/jdk7/hotspot/file/52c4a1ae6adc/src/share/vm/runtime/park.hpp
    http://hg.openjdk.java.net/build-infra/jdk7/hotspot/file/52c4a1ae6adc/src/share/vm/runtime/park.cpp
    http://hg.openjdk.java.net/build-infra/jdk7/hotspot/file/52c4a1ae6adc/src/os/linux/vm/os_linux.hpp
    http://hg.openjdk.java.net/build-infra/jdk7/hotspot/file/52c4a1ae6adc/src/os/linux/vm/os_linux.cpp  

    其他的一些东东:

    Parker类在分配内存时,使用了一个技巧,重载了new函数来实现了cache line对齐。

    // We use placement-new to force ParkEvent instances to be
    // aligned on 256-byte address boundaries.  This ensures that the least
    // significant byte of a ParkEvent address is always 0.
     
    void * operator new (size_t sz) ;
    Parker里使用了一个无锁的队列在分配释放Parker实例:

    volatile int Parker::ListLock = 0 ;
    Parker * volatile Parker::FreeList = NULL ;
    
    Parker * Parker::Allocate (JavaThread * t) {
      guarantee (t != NULL, "invariant") ;
      Parker * p ;
    
      // Start by trying to recycle an existing but unassociated
      // Parker from the global free list.
      for (;;) {
        p = FreeList ;
        if (p  == NULL) break ;
        // 1: Detach
        // Tantamount to p = Swap (&FreeList, NULL)
        if (Atomic::cmpxchg_ptr (NULL, &FreeList, p) != p) {
           continue ;
        }
    
        // We've detached the list.  The list in-hand is now
        // local to this thread.   This thread can operate on the
        // list without risk of interference from other threads.
        // 2: Extract -- pop the 1st element from the list.
        Parker * List = p->FreeNext ;
        if (List == NULL) break ;
        for (;;) {
            // 3: Try to reattach the residual list
            guarantee (List != NULL, "invariant") ;
            Parker * Arv =  (Parker *) Atomic::cmpxchg_ptr (List, &FreeList, NULL) ;
            if (Arv == NULL) break ;
    
            // New nodes arrived.  Try to detach the recent arrivals.
            if (Atomic::cmpxchg_ptr (NULL, &FreeList, Arv) != Arv) {
                continue ;
            }
            guarantee (Arv != NULL, "invariant") ;
            // 4: Merge Arv into List
            Parker * Tail = List ;
            while (Tail->FreeNext != NULL) Tail = Tail->FreeNext ;
            Tail->FreeNext = Arv ;
        }
        break ;
      }
    
      if (p != NULL) {
        guarantee (p->AssociatedWith == NULL, "invariant") ;
      } else {
        // Do this the hard way -- materialize a new Parker..
        // In rare cases an allocating thread might detach
        // a long list -- installing null into FreeList --and
        // then stall.  Another thread calling Allocate() would see
        // FreeList == null and then invoke the ctor.  In this case we
        // end up with more Parkers in circulation than we need, but
        // the race is rare and the outcome is benign.
        // Ideally, the # of extant Parkers is equal to the
        // maximum # of threads that existed at any one time.
        // Because of the race mentioned above, segments of the
        // freelist can be transiently inaccessible.  At worst
        // we may end up with the # of Parkers in circulation
        // slightly above the ideal.
        p = new Parker() ;
      }
      p->AssociatedWith = t ;          // Associate p with t
      p->FreeNext       = NULL ;
      return p ;
    }
    
    
    void Parker::Release (Parker * p) {
      if (p == NULL) return ;
      guarantee (p->AssociatedWith != NULL, "invariant") ;
      guarantee (p->FreeNext == NULL      , "invariant") ;
      p->AssociatedWith = NULL ;
      for (;;) {
        // Push p onto FreeList
        Parker * List = FreeList ;
        p->FreeNext = List ;
        if (Atomic::cmpxchg_ptr (p, &FreeList, List) == List) break ;
      }
    }

    总结与扯谈

    JUC(Java Util Concurrency)仅用简单的park, unpark和CAS指令就实现了各种高级同步数据结构,并且效率非常高,令人惊叹。

    在C++程序猿各种自制轮子的时候,Java程序猿则有非常丰富的并发数据结构,如lock,latch,queue,map等信手拈来。

    要知道像C++直到C++11才有标准的线程库,同步原语,但离高级的并发数据结构还有非常远。boost库有提供一些线程,同步相关的类,但也是非常easy的。Intel的tbb有一些高级的并发数据结构,可是国内boost都用得少,更别说tbb了。

    最開始研究无锁算法的是C/C++程序猿,可是后来非常多Java程序猿,或者类库開始自制各种高级的并发数据结构,常常能够看到有分析Java并发包的文章。反而C/C++程序猿总是在分析无锁的队列算法。高级的并发数据结构,比方并发的HashMap,没有看到有相关的实现或者分析的文章。在C++11之后,这样的情况才有好转。

    由于正确高效实现一个Concurrent Hash Map是非常困难的,要对内存CPU有深刻的认识,并且还要面对CPU不断升级带来的各种坑。

    我觉得真正值得信赖的C++并发库,仅仅有Intel的tbb和微软的PPL。

    https://software.intel.com/en-us/node/506042     Intel® Threading Building Blocks 

    http://msdn.microsoft.com/en-us/library/dd492418.aspx   Parallel Patterns Library (PPL)

    另外FaceBook也开源了一个C++的类库,里面也有并发数据结构。

    https://github.com/facebook/folly

  • 相关阅读:
    Netscape中使用event对象
    attachEvent 与 addEventListener 对同一物件事件多次绑定的触发顺序
    ADO.NET Entity Framework如何:定义具有修改存储过程的模型(实体框架)
    ADO.NET Entity Framework插入和更新数据(实体框架快速入门)
    ADO.NET Entity Framework如何:通过每种类型一个表继承以定义模型(实体框架)
    ADO.NET Entity Framework SSDL 规范
    ADO.NET Entity Framework 如何:使用 EdmGen.exe 生成对象层代码
    ADO.NET Entity Framework CSDL、SSDL 和 MSL 规范
    ADO.NET Entity Framework MSL 规范
    ADO.NET Entity Framework配置实体框架(实体框架任务)
  • 原文地址:https://www.cnblogs.com/mengfanrong/p/3878111.html
Copyright © 2011-2022 走看看