zoukankan      html  css  js  c++  java
  • 浅谈智能指针的历史包袱

    我们学习C++的时候,想必都会听说一个叫智能指针的东西,在初听这个词的时候,我们都难免不被“智能”两个字所吸引,感觉它会比较高级,让人有种忍不住想用一把的冲动。
    但事实上,它可能并没有我们所想的那样“智能”、好用,它本质上其实就是一个对象,它去接管了原指针所管理的资源。但这里单单用一个对象就想有“智能”的效果并没有那么容易。在智能指针发展的过程中,出现了Autor_ptr等多种版本的智能指针,但它们都确都或多或少有一些问题存在(相信早期的前辈们会深有感触)。但智能指针的使用性却是不可否认的。它在实际应用中确实是使用很频繁的,因为它可以帮助我们管理资源,防止内存泄漏、处理异常安全问题,是非常方便的。只要我们对它合理的使用。而对于它的实现,它的来源于一种叫RAII的机制,来了解了解。。
     
    RAII机制

    RAII机制是通过利用对象出了作用域的自动销毁的机理,使得资源也具有了生命周期,有了自动销毁(自动回收)的功能。RAII全称为Resource Acquisition Is Initialization,它源于C++,在Java,C#,D,Ada,Vala和Rust中也有应用,它是在一些面向对象语言中的一种惯用法。翻译过来它意为资源分配即初始化,定义一个类来封装资源的分配和释放,在构造函数完成资源的分配和初始化,在析构函数完成资源的清理,可以保证资源的正确初始化和释放。RAII要求,资源的有效期与持有资源的对象的生命期严格绑定,即由对象的构造函数完成资源的分配(获取),同时由析构函数完成资源的释放。在这种要求下,只要对象能正确地析构,就不会出现资源泄露问题。
     
    智能指针

    RAII在这里就是简单提一下而已,现在我们来看我们今天的主角智能指针。
     
     所谓智能指针(smart pointer),就是智能/自动化的管理指针所指向的动态资源的释放。它其实是一个对象,当中存储指向动态分配(堆)对象的指针。它的诞生理由就是,为粗心和懒的人设计的,但是这个设计一定不是反人类的,因为无论你有多厉害只要你是人你总会有犯错误的时候,所以智能指针可以很好地帮助我们,程序员每次 new 出来的内存还需要手动去 delete。当程比较复杂,就有可能忘记delete了。
     不仅仅是这样,异常通常也会导致程序过早退出,进而让delete未得到执行。这时候智能指针就显得格外有用了,因为它们能够确保正确的销毁动态分配的对象。它们也可以用于跟踪被多用户共享的动态分配对象。
     
    事实上,智能指针能够做的还有很多事情,例如处理线程安全(加同步锁),提供写时复制,确保协议,并且提供远程交互服务等一系列类似于“前后需要呼应”起来的操作(如new/delete、malloc/free、fopen/fclose、这里线程安全的lock/unlock等,不过注意的是这些是C++11支持)。其实智能指针只是怕你忘了写上delete、free、fclose...,而专门设置出来的个对象。所以它是有很强的实用性
     
     
    现在我们来看看智能指针的使用。首先一个智能指针至少要符合两点:
     
    拥有RAII的机制来管理指针对于编译器来说,智能指针实际上是一个栈对象,并非指针类型,在栈对象生命期即将结束时,智能指针通过析构函数释放它管理的堆内存。
    有指针的基本功能。所有智能指针都重载了“*”和“->”操作符,让它可以直接返回对象的引用以及能用->去操作其指向的对象。若要访问智能指针原来的方法则使用“·”操作符。
    ③其次就是它还需要考虑深浅拷贝问题(见后面)
     
     
    现在就可以来模拟标准库中的智能指针实现一种简单的智能指针 auto_ptr

    auto_ptr


    auto_ptr是第一个版本的智能指针,在C98标准库中就有实现。它的实现思想很简单,就是管理权转移的思想。如下图
     
     
    代码:
     /*************************************************************************
       > File Name: AutoPtr.cc
       > Author: tp
       > Mail: 
       > Created Time: Sun 13 May 2018 05:08:41 PM CST
      ************************************************************************/
     
     #include <iostream>
     using namespace std;
     
     struct A
     {
         int age;
         string name;
         A(string na, int a = 0)
             :age(a), name(na)
         { }
     };
     template <class T>
     class AutoPtr
     {
         public:
             AutoPtr(T* ptr)
                 :_ptr(ptr) { }
     
             T& operator*()
             {
                 return *_ptr;
             }
             T* operator->()
             {
                 return _ptr;
             }
             //ap2( ap1)
             AutoPtr(AutoPtr<T>& a) //防止多次析构,ap2直接夺取管理权,ap1._ptr置空
                 :_ptr(a._ptr)
             {
                 a._ptr = NULL;
             }
             //ap2 = ap1
             AutoPtr<T>& operator=(AutoPtr<T>& a)
             {
                 if(this != &a)
                 {
                     delete _ptr;
                     _ptr = a._ptr;
                     a._ptr = NULL;
                 }
                 return *this;
             }
             ~AutoPtr( )
             {
                 cout<<"AutoPtr帮助析构
    ";
                 delete _ptr;
             }
     protected:
             T* _ptr;
     };
     int main( void)
     {
         AutoPtr<int> ap1(new int(20));
         cout<<++(*ap1)<<endl;
     
         AutoPtr<A> ap2(new A("napom"));
         cout<<ap2->name<<endl;
     
         return 0;
     }
    

    这里这两个地方,是需要弄清楚的

    然后,看一手结果:

     结果感觉还不错,它自动的帮我们做了了空间释放的动作。可是直接夺取管理权的机制那会这么容易让人放心!当我们做一个这样的操作
     
    结果发生了段错误,罪魁祸首就是AutoPtr<int>ap3(ap1)构造拷贝出ap3,ap3完全夺取了ap1的管理权,这个过程中会释放原本属于ap1的那段空间,所以导致ap1无家可归,进行 *ap1访问时程序就会崩溃了。同样道理,当进行了ap3 = ap1,程序也存在这样的问题,原因依旧在于ap1被彻彻底底的夺走了一切,这种编程思想是十分危险的。
     
    源于它的设计思想的缺陷,所以通常一般不推荐使用Autoptr智能指针。 使用了也绝对不能使用"="和拷贝构造。历史在发展,所以我们见到接下来这种想法: 
     

    unique_ptr (scoped_ptr)


     由于早期的auto_ptr抢权思想存在严重的缺陷,所以auto_ptr通常是被严禁使用的。但是从C++98到C++11出来期间,C++标准库却迟迟没有给出改良版的智能指针,但是在此期间有一群大牛们就坐不住了,他们在叫一个boost的社区讨论,他们想要自己去造一个第三方库,好去解决C++中的一些诟病同时对c++进行一些完善。这里的scoped_ptr就是其中的一个杰作(后来在C++11出来之后,c++11参考boost版本将scoped_ptr改名为unique_ptr)。它的思想也是特别的直接,它做的就是暴力的防止用户调用拷贝构造和赋值运算符“=”进行夺权管理。它直接将拷贝构造和“=”运算符重载函数给封装起来,以此防止用户来调用或恶意的去实现它。
     /*************************************************************************
       > File Name: ScopedPtr.cc
       > Author: tp
       > Mail: 
       > Created Time: Sun 13 May 2018 06:02:24 PM CST
      ************************************************************************/
     #include <iostream>
     using namespace std;
     
     struct A
     { 
         int age;
         string name;
         A(string na, int a = 0)
             :age(a), name( na)
         { }
     };
     template <class T>
     class ScopedPtr
     { 
         public:
             ScopedPtr(T* ptr)   
                 :_ptr(ptr) { }
     
             T& operator*()
             { 
                 return *_ptr;
             }
             T* operator->()
             { 
                 return _ptr;
             }
             ~ScopedPtr( )
             { 
                 cout<<"AutoPtr析构
    ";
                 delete _ptr; 
             }
     protected:
             ScopedPtr(ScopedPtr<T>& a); 
             ScopedPtr<T>& operator=( ScopedPtr<T>& a);
             T* _ptr;
                     
     };
    

    上面的scoped_ptr用于处理单个的对象,而new/delete和new[]/delete[]底层实现机制又是不同的(delete[]头部多开4字节,具体)对于new[]出来的多个对象,boost又提供了一个scoped_array版本的智能指针用来管理对象数组,用法和scoped_ptr类似。同样的,上面的auto_ptr也有一个auto_array版本。

    scoped_ptr的就好似“你强任你强”,我不给你机会施展,看你怎么夺权管理。这种做法虽然达到了上面的目的。但是这种暴力的思想却带来了新的问题。。由于scoped智能指针独享所有权,当我们真真需要复制智能指针时,需求便满足不了了。如此我们再引入一个更完善智能指针指针,专门用于处理复制,参数传递的情况。这便是如下的shared智能指针。

    shared_ptr


    这算是我们经常会用到的一种智能指针(它在c++11和boost版本名称一样)。智能指针发展到这一步也就比较成熟了,它已经几乎能够解决平常遇到的问题。它较前面的改进就是添加了引用计数,所以在它的内部就不会出现调用多次析构函数导致的程序崩溃,shared_ptrt同时也不像scoped_ptr那样没有拷贝构造和赋值运算符重载,难以被利用。它每次调用析构时,只需要将引用计数减1即可,当指向该资源的引用计数 *_pCount变成0的时候,才真正的去释放资源。
     
    和前面一样,在boost中也有一个shared_array版本的智能指针用来管理new[]的对象数组。(C++11没有这个版本)
     
    代码:
       > File Name: sharedPtr.cc
       > Author: tp
       > Mail: 
       > Created Time: Sun 13 May 2018 06:11:02 PM CST
      ************************************************************************/
     
     #include <iostream>
     using namespace std;
     struct A
     {
         int age;
         string name;
         A(string na, int a = 0)
             :age(a), name( na)
         { }
     };
     //引用计数版本
     template <class T>
     class SharedPtr
     {
     public:
         SharedPtr( T* ptr)  
             :_ptr(ptr)
              ,_pCount( new int(1))
         { }
         T* operator->( )
         { 
             return _ptr;
         }
         T& operator*( )
         { 
             return *_ptr;
         }
         SharedPtr(const SharedPtr<T>& sp)  //加上const
             :_ptr(sp._ptr)
              ,_pCount(sp._pCount)
         { 
             ++(*_pCount);   
         }
         SharedPtr<T>& operator=(const SharedPtr<T>& sp)
         { 
             if(this != &sp) 
             { 
                 Release( );
                 _ptr = sp._ptr;
                 _pCount = sp._pCount;
                 ++(*_pCount);
             }
             return *this;
         }
         void Release( )
         { 
             if(--(*_pCount) == 0)
             { 
                 cout<<"释放空间"<<endl;
                 delete _ptr;
                 delete _pCount;
                 _ptr = NULL;
                 _pCount = NULL;
             }
         }
         ~SharedPtr()
         { 
             //cout<<"析构调用"<<endl;
             Release( );
         }
     protected:
         T* _ptr;
         int* _pCount;
     };
     int main( void)
     {   
         SharedPtr<A> sp1(new A("gene"));
         cout<<sp1->name<<endl;
     
         SharedPtr<A> sp2(sp1);
         cout<<sp2->name<<endl;
     
         SharedPtr<A> sp3(new A("codfish"));
         sp3 = sp2;
         cout<<sp3->name<<endl;
     
         return 0;
     }                                                                                           
    
    看一下结果:
    我们发现它几乎完美的完成了这些功能,确实!这种指针算是比较完美的思想,不过再完美也会有瑕疵,要不然也不会boost::weak_ptr的存在,
    boost::weak_ptr的存在就是为boost::shared_ptr解决一点点瑕疵的。这个瑕疵藏得相对比较深,不会遇到的,但是当我们真的遇到的时候,那可能就一个“通宵找Bug的不眠之夜”。还是用例子来说明,
    1. struct Node  
    2.  
    3.     shared_ptr<ListNode> _prev;  
    4.     shared_ptr<ListNode> _next;  
    5.   
    6.     ListNode(int x)  
    7.         : _prev(NULL)  
    8.         ,_next(NULL)  
    9.     {}  
    10.     ~Node()  
    11.     {  
    12.         cout << "~Node" << endl;  
    13.     }  
    14. };  
    15. int main()  
    16. {  
    17.     shared_ptr<Node> cur(new Node(1));  
    18.     shared_ptr<Node> next(new Node(2));  
    19.     cur->_next = next;  
    20.     next->_prev = cur;  
    21.     cout << "cur.count: " << cur.use_count() << endl;  
    22.     cout << "next.count: " << next.use_count() << endl;  
    23.     return 0;  
    24. }  

    现在我们验证shared智能指针的缺陷,我们用系统给我们shared_ptr指针,然后再来构造两个双向链表里面的结点,这里这个双向链表可能有一点简陋,但是我们只是需要它的prev和next指针就够了。现在我们运行代码看看会发生什么情况:
     
    明显这里没有调用结点析构,是有问题的。这都源于原来cur和next指针所管理的结点现在都有两个智能指针管理,然后在这里会发生这样一件事:
     
     
     
    循环引用一般都会发生在这种"你中有我,我中有你"的情况里面,这里导致的问题就是内存泄漏,这段空间一直都没有释放,现在很明显引用计数在这里就不是很合适了,但是shared_ptr除了这里不够完善,其他的地方表现都令我们比较满意,所以boost社区的大牛们在这里仅是补充了最后一个智能指针week_ptr,
     
     

    weak_ptr


    weak_ptr是为了配合shared_ptr而引入的一种智能指针,它更像是shared_ptr的一个助手而不是智能指针,为它不具有普通指针的行为,没有重载operator*和->,它的最大作用在于协助shared_ptr工作,像旁观者那样观测资源的使用情况.具体一点讲就是,首先weak_ptr 是专门为shared_ptr 准备的。它 boost::shared_ptr 的观察者对象,作为观察者,那也就意味着weak_ptr它只对shared_ptr 进行引用却不会去改变其引用计数,当被观察的shared_ptr 失效后,相应的weak_ptr 也相应失效,然后它就什么都不管 光是个删 , 也就是这里的cur和next在析构的时候 ,它都不用引用计数减1(因为这里引用计数一直保持是1,可以直接释放资源) , 直接删除结点就好。这样也就间接地解决了循环引用的问题,当然week_ptr指针的功能不是只有这一个。但是现在我们只要知道它可以解决循环引用就好。
     struct Node
     {
     //  shared_ptr<Node> _prev;
     //  shared_ptr<Node> _next;
         weak_ptr<Node> _prev;
         weak_ptr<Node> _next;
        // Node()
        // :_prev(NULL)
        // ,_next(NULL)
       //  {}
         ~Node()
         {
             cout<<"~Node"<<endl;
         }
     };
     void TestCycleReference( void)
     {
         shared_ptr<Node> cur( new Node);
         shared_ptr<Node> next( new Node);
     
         cur->_next = next;
         next->_prev = cur;
     
         cout<<"cur.count:"<<cur.use_count()<<endl;
         cout<<"next.count:"<<next.use_count()<<endl;
     
     }
    

     

     
    对上面shared_ptr优化weak_ptr
     
    关于c++11库中关于weak_ptr的实现接口

    1.  拷贝构造

    1 constexpr weak_ptr() noexcept;
    2 
    3 weak_ptr (const weak_ptr& x) noexcept;
    4 template <class U> weak_ptr (const weak_ptr<U>& x) noexcept;
    5 
    6 template <class U> weak_ptr (const shared_ptr<U>& x) noexcept;

    如果一个参数x被传递,而x不是空的,那么弱ptr对象就变成了拥有的x组的一部分,在没有所有权本身的情况下(并且不增加它的使用数量),就可以访问该对象的资产。

    如果x是空的,或者如果没有参数传递,构造的弱ptr是空的。

    如果x是一个别名,弱ptr保存了所有的数据和存储的指针。

     

    2.operator=重载

    1 weak_ptr& operator= (const weak_ptr& x) noexcept;
    2 template <class U> weak_ptr& operator= (const weak_ptr<U>& x) noexcept;
    3 
    4 template <class U> weak_ptr& operator= (const shared_ptr<U>& x) noexcept

    对象成为拥有的x组的一部分,允许对该对象的资源进行访问,直到过期,而不需要获得所有权本身(并且不增加其引用计数)。

    如果x是空的,构造的弱ptr也是空的。

    如果x是一个别名,弱ptr保存了所有的数据和存储的指针。

    shared_ptr对象可以直接分配给弱ptr对象,但是为了将弱ptr对象分配给sharedptr,它应该使用成员锁(lock)来完成。

     

    包括上面成员,它一共有这些成员

    可参考cpulsplus官网:http://www.cplusplus.com/reference/memory/weak_ptr/

    定置删除器


    在前面用到了的shared_ptr的时候,如果够仔细,你可能注意C++11没有shared_array版本的智能指针,也就是说,对于new[]开出的对象数组,C++11好像没有相应的处理办法了? 当然,这是不可能的。C++11对于此,实际上站在了一个更高的角度来处理。虽然在boost中有_array版本的智能指针管理new[]出来的对象数组,但是实际中还有malloc,fopen..等方式打开资源,单纯的用delete关闭资源显然是力不从心的。所以对此,C++11提供用一个叫删除器的东西来帮助释放资源,它由程序员自己去定置。它的实现其实就是定义一个类出来,然后在类中重载了operator() 在该函数当中进行相应释放资源操作(由于重载了operator(),该类的实例就拥有函数的使用特性和功能.所以也把这样类的一个实例叫做仿函数。如我们shared_ptr<int> sp(new int[2]),就可以实现一个这样的类

    template<class T>
    struct DeleteArray
    {
         void operator()(T* ptr)         
         {
               delete[] ptr;
         }
    } ;

     然后可以DeleteArray da定置一个删除器da了 。随后,前面定义智能指针相应改成shared_ptr<int> sp(new int[2], da)即可。

    其实它原理也比较简单,为了更方便剖析,我们这里来对上面自定义SharePtr改造,让它支持定置删除功能。

     template<class T> 
     struct DelArr 
     {  
         void operator()(T* ptr) 
         {  
             cout<<"delete[ ]"<<endl; 
             delete[] ptr; 
         } 
     }; 
     template <class T, class Del= DelArr<T> >   //为模板参数添加默认值
     class SharedPtr 
     {  
         public: 
             SharedPtr( T* ptr)   
                 :_ptr(ptr) 
                  ,_pCount( new int(1)) 
         { } 
             T* operator->( ) 
             {  
                 return _ptr; 
             } 
             T& operator*( ) 
             {  
                 return *_ptr; 
             } 
             SharedPtr(const SharedPtr<T>& sp)  //加上const
                 :_ptr(sp._ptr) 
                  ,_pCount(sp._pCount) 
             {  
                 ++(*_pCount);    
             } 
             SharedPtr<T>& operator=(const SharedPtr<T>& sp)
             {  
                 if(this != &sp)  
                 {  
                     Release( ); 
                     _ptr = sp._ptr; 
                     _pCount = sp._pCount; 
                     ++(*_pCount); 
                 } 
                 return *this; 
             } 
             void Release( ) 
             {  
                 if(--(*_pCount) == 0) 
                 {  
                     if(_ptr) 
                     { 
                         cout<<"释放空间"<<endl; 
                         //delete _ptr; 
                 //_ptr = NULL;
    //_pCount = NULL; Del _del; //定义定置删除仿函数 _del(_ptr); //调用该仿函数 }
              delete _pCount;  } } ~SharedPtr() { cout<<"析构调用"<<endl; Release( ); } protected: T* _ptr; int* _pCount; }; void TestSharedPtr() { //SharedPtr<A, DelArr<A> > sp(new A[2]); SharedPtr<int, DelArr<int> >sp1(new int[2]); }

     

    实现其实就是在析构时创建一个Del对象,也就是我们前面定置好的删除器的对象。这里Del是Delete,那我们的_del(_ptr)的内部,就是用delete释放_ptr,所以我们就这样把模板和仿函数联系在一起。
     
    而对于malloc、fopen方式打开的资源,就可以这样
     1  class Free
     2  {
     3  public:
     4      void operator()(void* ptr)
     5      {   
     6          free(ptr);
     7      }
     8  };
     9  struct FClose
    10  {
    11      void operator()(void* fp)
    12      {
    13          fclose((FILE*)fp);
    14      }
    15  };
    16 vod Test()
    17  {
    18      shared_ptr<void> sp1(malloc(sizeof(int)*3), Free());
    19      shared_ptr<FILE> sp2(fopen("test.txt", "r"), FClose());
    20 }

    最后,智能指针大致原理就是这样,当然这只是本人很粗浅的一点总结,对智能指针使用还有很多东西需要探索。

    不过为了平常使用智能指针能更高效的使用,最后小结一下

    ·在可以使用 boost 库的场合下,拒绝使用 std::auto_ptr,因为其不仅不符合 C++ 编程思想。

    ·在确定对象无需共享的情况下,使用 boost::scoped_ptr。

    ·在对象需要共享的情况下,使用 boost::shared_ptr。

    ·在需要访问 boost::shared_ptr 对象,而又不想改变其引用计数的情况下(循环引用)使用boost::weak_ptr。

     
     
    附:  
     
     
     
     
     
  • 相关阅读:
    让GoogleCode的SVN下的HTML文件在FireFox下正常显示
    添加验证控件出错
    【转载】SQLServer中char、varchar、nchar、nvarchar的区别:
    人生第一篇博客
    二叉排序树
    最小编辑距离
    面试题集锦_4
    面试题集锦_3
    键树
    B树
  • 原文地址:https://www.cnblogs.com/tp-16b/p/9033370.html
Copyright © 2011-2022 走看看