zoukankan      html  css  js  c++  java
  • [笔记]极大极小过程的alphabeta剪枝不可与记忆化搜索一起使用

    今天做SGU 423,WA得我眼泪汪汪。后来发现原来这个问题很早就被何牛提到过

    极大极小过程的alpha-beta剪枝不可与记忆化搜索一起使用。

    原因是这样的:

    在一个博弈图中,可能存在这样的情况:一个状态有不止一个前继。

    比如,设状态u和状态v都可以转移到同一个状态w。

    假设极大极小过程先搜索到u,为了得到u的估值f(u),我们要搜索w并且给本次搜索一个估值上界beta(u),一旦在w的搜索过程中发现f(w)当前值>=beta(u),则立刻停止搜索因为f(u)的估值不会用到w这个分支。这就是alpha-beta剪枝。

    但是请注意,此时并不保证f(w)的正确性,我们仅仅知道f(w)>=beta(u)而已。这次剪枝仅仅保证u的搜索结果的正确性。

    为了得到v的估值f(v)我们会再次搜索到w,注意此时所给的估值上界是beta(v)而不是beta(u),也就是这两次搜索对于w的限制是不同的。如果使用记忆化,就相当于默认f(w)为精确值。但是由于之前的剪枝,我们得到的仅仅是f(w)的一个界而已,这里就会出现错误。更确切地,当beta(v)>beta(u)时,就会由于u与beta(u)对于w的限制被记忆,导致计算v的估值所需要的w的信息被误剪。

    T_T

    顺便贴个alpha-beta剪的思路模板吧:

    //alpha-beta剪枝
    //不可以和记忆化搜索混用
    //需要在外部记录状态(局面以及当前先手者),通过make_move和unmake_move函数进行改变。
    int ab(int alpha, int beta, int depth, bool pass) {
        // 当前最佳估值,预设为负无穷大
        int best = -INF;
        // 如果到达预定的搜索深度
        if (depth <= 0) {
            // 计算出估值
            return eval();
        }
        // 尝试每个后继状态
        foreach (move) {
            // 试着走后继状态
            if (make_move(move)) {
                // 如果合法,对所形成的局面进行递归搜索
                int now = -alpha_beta(-beta, -alpha, depth-1, 0);
                // 恢复原来的局面
                unmake_move(move);
                // 如果这步棋引发剪枝
                if (now >= beta) {
                    // 停止对当前局面的搜索,立即返回。
                    return now;
                }
                // 如果这步更好
                if (now > best) {
                    // 保存更好的结果
                    best = now;
                    // 更新估值下限
                    if (now > alpha) {
                        alpha = now;
                    }
                }
            }
        }
        // 如果没有合法后继,则此步为弃着
        if (best == -INF) {
            // 如果上一步也是弃着,表明对局结束
            if (pass) {
                // 计算出精确值
                return calc();
            }
            // 否则这步棋弃着,局面不变先后手互换
            make_move(PASS_MOVE);
            // 递归搜索,并标明该步弃着。
            best = -alpha_beta(-beta, -alpha, depth, 1);
            // 恢复原来的局面
            unmake_move(PASS_MOVE);
        }
        // 返回最佳估值
        return best;
    }
  • 相关阅读:
    K好数
    蓝桥杯 安慰奶牛
    蓝桥杯 节点选择
    模拟链表
    10588
    八数码的 八种境界
    HIT 2051
    概率DP
    数组越界溢出
    FATFS在SD卡里,写入多行数据出的问题
  • 原文地址:https://www.cnblogs.com/jffifa/p/2618960.html
Copyright © 2011-2022 走看看