在operator=中检查给自己赋值的情况
做类似下面的事时,就会发生自己给自己赋值的情况:
class X { ...};
X a;
a = a;
这种事做起来好象很无聊,但它完全是合法的,所以看到程序员这样做不要感到丝毫的怀疑。更重要的是,给自己赋值的情况还可以以下面这种看起来更隐蔽的形式出现:
a = b;
如果 b 是a 的另一个名字(例如,已被初始化为a 的引用),那这也是对自己赋值,虽然表面上看起来不象。这是别名的一个例子:同一个对象有两个以上的名字。在本条款的最后将会看到,别名可以以大量任意形式的伪装出现,所以在写函数时一定要时时考虑到它。
在赋值运算符中要特别注意可能出现别名的情况,其理由基于两点。其中之一是效率。如果可以在赋值运算符函数体的首部检测到是给自己赋值,就可以立即返回,从而可以节省大量的工作,否则必须去实现整个赋值操作.
另一个更重要的原因是保证正确性。一个赋值运算符必须首先释放掉一个对象的资源(去掉旧值),然后根据新值分配新的资源。在自己给自己赋值的情况下,释放旧的资源将是灾难性的,因为在分配新的资源时会需要旧的资源。
看看下面 String 对象的赋值,赋值运算符没有对给自己赋值的情况进行检查:
class String
{
public:
String(const char *value);
~String(); // 函数定义参见条款11
...
String& operator=(const String& rhs);
private:
char *data;
};
// 忽略了给自己赋值的情况
// 的赋值运算符
String& String::operator=(const String& rhs)
{
delete [] data; // delete old memory
// 分配新内存,将rhs 的值拷贝给它
data = new char[strlen(rhs.data) + 1];
strcpy(data, rhs.data);
return *this;
}
看看下面这种情况将会发生什么:
String a = "Hello";
a = a; // same as a.operator=(a)
赋值运算符内部,*this 和rhs 好象是不同的对象,但在现在这种情况下它们却恰巧是同一个对象的不同名字。可以这样来表示这种情况:
*this data ------------> "Hello\0"
/
/
rhs data ------------
赋值运算符做的第一件事是用delete 删除data,其结果将如下所示:
*this data ------------> ???
/
/
rhs data -----------
现在,当赋值运算符对rhs.data 调用strlen 时,结果将无法确定。这是因为data被删除的时候 rhs.data 也被删除了,data,this->data 和rhs.data 其实都是同一个指针!从这一点看,情况只会越变越糟糕。
对此解决的方法:
如果两个对象具有相同的值,就说它们是相同的(具有相同的身份)。例如,两个String 对象如果都表示的是相同顺序的字符序列,它们就是相同的:
String a = "Hello";
String b = "World";
String c = "Hello";
a 和c 具有相同值,所以它们被认为是完全相同的;b 和它们都不同。如果把这个定义用到String 类中,赋值运算符看起来就象这样:
String& String::operator=(const String& rhs)
{
if (strcmp(data, rhs.data) == 0) return *this;
...
}
值相等通常由operator==来检测,所以对于一个用值相等来检测对象身份的类C 来说,它的赋值运算符的一般形式是:
C& C::operator=(const C& rhs)
{
// 检查对自己赋值的情况
if (*this == rhs) // 假设operator=存在
return *this;
...
}
注意这个函数比较的是对象(通过operator=),而不是指针。用值相等来确定对象身份和两个对象是否占用相同的内存没有关系;有关系的只是它们所表示的值。
另一个确定对象身份是否相同的方法是用内存地址。采用这个定义,两个对象当且仅当它们具有相同的地址时才是相同的。这个定义在C++程序中运用更广泛,可能是因为它很容易实现而且计算很快,而采用值相等的定义则不一定总具有这两个优点。采用地址相等的定义,一个普通的赋值运算符看起来象这样:
C& C::operator=(const C& rhs)
{
// 检查对自己赋值的情况
if (this == &rhs) return *this;
...
}
它对很多程序都适用。
如果需要一个更复杂的机制来确定两个对象是否相同,这就要靠程序员自己来实现。最普通的方法是实现一个返回某种对象标识符的成员函数:
class C {
public:
ObjectID identity() const; //
...
};
对于两个对象指针 a 和b,当且仅当 a->identity() == b->identity()的时候,它们所指的对象是完全相同的。当然, 必须自己来实现ObjectIDs 的operator==。别名和object identity 的问题不仅仅局限在operator=里。在任何一个用到的函数里都可能会遇到。在用到引用和指针的场合,任何两个兼容类型的对象名称都可能指的是同一个对象。下面列出的是别名出现的其它情形:
class Base
{
void mf1(Base& rb); // rb 和*this 可能相同
...
};
void f1(Base& rb1,Base& rb2); // rb1 和rb2 可能相同
//
class Derived: public Base
{
void mf2(Base& rb); // rb 和*this 可能相同
//
...
};
int f2(Derived& rd, Base& rb); // rd 和rb 可能相同
可以看到,别名可以以各种形式出现,所以决不要忘记它或期望自己永远不会碰到它。也许你不会碰到,但我们大多数会碰到。而很明显的一条是,处理它会达到事半功倍的效果。所以任何时候写一个函数,只要别名有可能出现,就必须在写代码时进行处理。