zoukankan      html  css  js  c++  java
  • 对 游戏 《 2048 》 的一些思考

    游戏  《2048》  是 Gabriele Cirulli出品手机数字游戏,  以下给出百度介绍:

    https://baike.baidu.com/item/2048/13383511?fr=aladdin

    游戏的网上地址:

    http://gabrielecirulli.github.io/2048/

    github 上的源码地址:

    https://github.com/gabrielecirulli/2048

    今天,一位老友与我闲聊中提起了最近在玩的一个小程序,就是这个传说中的2048游戏,一开始并没有太在意,但是听老友多次提起也就有了一丢丢的兴趣, 老友提到要自己写一个程序来让电脑自己玩这个游戏,并给出了自己的一些想法,听了以后感觉蛮神奇和高大上的,其思想可以概括为使用遗传算法和神经网络对 该问题建模后  进行求解,也就是说使用某种算法对问题的解空间进行搜索, 这个想法咋一听起来感觉不错不错,细细想来又总感觉差一些什么,随后老友又具体的讲了一下想法,那就是采用两个神经网络 对 问题 求解,  一个负责棋子的 移动, 一个负责搜索, 总之,感觉这个想法和有名的alfago 下围棋方法很像,只不过很无奈,alfago 过于高大上 以至于只是听说过它的一些方法。

    抱着好奇的态度我便打开了这个游戏的网址,直观感觉这个游戏很简单,随后我发现这个游戏和平时的棋盘类游戏还是有一些不同的。这个游戏的初始两个棋子的位置是完全随机的, 虽然棋子 可以是 2  和  4  中的任意一个(其中 ,  是2 的概率为0.9,  是4 的概率为0.1),   但是这个初始状态可以看做是完全随机的,  然后每一次移动棋子后产生的棋子也是随机的(2 的概率为0.9,  是4 的概率为0.1), 并且位置也是随机的。也就是说,这个游戏在下棋过程中所有的操作都是随机的, 这个样子的话好像传统的那些解法不是很一样, 虽然说不上是简单了还是容易的。

    对于这个游戏的解法我的观点不太同于我的老友,我总感觉这个游戏的步骤是需要算下到每一步位置后能够WIN的概率或者是下一步可以更好的概率。

    这个游戏每次操作可以选择上  下   左   右  四个方向的操作,也就是4种可供选择。每次操作后空白 的  位置假设 为K, 那么也就是说这次操作后棋盘可能变化成的状态为  4 × k ×2,  ( 2是因为 新生成的棋子可以是2  也可以是  4)。如果能够给出一个判断函数,来确定哪一种变化后的状态更优秀,当然还要考虑到变为该种状态的概率, 那么也就是说  我们要求  下个状态的优秀估值  和  概率的乘积, 即 期望值,  来选择 下一步的 操作。

    有了以上想法后,本人决定亲自玩一次,给它打通关,结果万万没有想到 整整打了一天 也没有打赢, 真心是败给它了。随后,在网上搜了搜其他网友给出的解决方法,搜到了这个 不错的版本, 2048AI版本, 以下给出具体地址:

    http://ovolve.github.io/2048-AI/

    github 地址:

    https://github.com/ovolve/2048-AI

    以下给出演示图:

                    

    为了可以更好的理解该游戏是如何运行及设计的,本人在网上找了一个PYTHON版本的代码,当然由于其界面为命令行,其效果难以与JS写的相比,以下给出地址:

    http://rosettacode.org/wiki/2048#Python

    #!/usr/bin/env python3
     
    import curses
    from random import randrange, choice # generate and place new tile
    from collections import defaultdict
     
    letter_codes = [ord(ch) for ch in 'WASDRQwasdrq']
    actions = ['Up', 'Left', 'Down', 'Right', 'Restart', 'Exit']
    actions_dict = dict(zip(letter_codes, actions * 2))
     
    def get_user_action(keyboard):    
        char = "N"
        while char not in actions_dict:    
            char = keyboard.getch()
        return actions_dict[char]
     
    def transpose(field):
        return [list(row) for row in zip(*field)]
     
    def invert(field):
        return [row[::-1] for row in field]
     
    class GameField(object):
        def __init__(self, height=4, width=4, win=2048):
            self.height = height
            self.width = width
            self.win_value = 2048
            self.score = 0
            self.highscore = 0
            self.reset()
     
        def reset(self):
            if self.score > self.highscore:
                self.highscore = self.score
            self.score = 0
            self.field = [[0 for i in range(self.width)] for j in range(self.height)]
            self.spawn()
            self.spawn()
     
        def move(self, direction):
            def move_row_left(row):
                def tighten(row): # squeese non-zero elements together
                    new_row = [i for i in row if i != 0]
                    new_row += [0 for i in range(len(row) - len(new_row))]
                    return new_row
     
                def merge(row):
                    pair = False
                    new_row = []
                    for i in range(len(row)):
                        if pair:
                            new_row.append(2 * row[i])
                            self.score += 2 * row[i]
                            pair = False
                        else:
                            if i + 1 < len(row) and row[i] == row[i + 1]:
                                pair = True
                                new_row.append(0)
                            else:
                                new_row.append(row[i])
                    assert len(new_row) == len(row)
                    return new_row
                return tighten(merge(tighten(row)))
     
            moves = {}
            moves['Left']  = lambda field:                                
                    [move_row_left(row) for row in field]
            moves['Right'] = lambda field:                                
                    invert(moves['Left'](invert(field)))
            moves['Up']    = lambda field:                                
                    transpose(moves['Left'](transpose(field)))
            moves['Down']  = lambda field:                                
                    transpose(moves['Right'](transpose(field)))
     
            if direction in moves:
                if self.move_is_possible(direction):
                    self.field = moves[direction](self.field)
                    self.spawn()
                    return True
                else:
                    return False
     
        def is_win(self):
            return any(any(i >= self.win_value for i in row) for row in self.field)
     
        def is_gameover(self):
            return not any(self.move_is_possible(move) for move in actions)
     
        def draw(self, screen):
            help_string1 = '(W)Up (S)Down (A)Left (D)Right'
            help_string2 = '     (R)Restart (Q)Exit'
            gameover_string = '           GAME OVER'
            win_string = '          YOU WIN!'
            def cast(string):
                screen.addstr(string + '
    ')
     
            def draw_hor_separator():
                top = '' + ('┬──────' * self.width + '')[1:]
                mid = '' + ('┼──────' * self.width + '')[1:]
                bot = '' + ('┴──────' * self.width + '')[1:]
                separator = defaultdict(lambda: mid)
                separator[0], separator[self.height] = top, bot
                if not hasattr(draw_hor_separator, "counter"):
                    draw_hor_separator.counter = 0
                cast(separator[draw_hor_separator.counter])
                draw_hor_separator.counter += 1
     
            def draw_row(row):
                cast(''.join('│{: ^5} '.format(num) if num > 0 else '|      ' for num in row) + '')
     
            screen.clear()
            cast('SCORE: ' + str(self.score))
            if 0 != self.highscore:
                cast('HGHSCORE: ' + str(self.highscore))
            for row in self.field:
                draw_hor_separator()
                draw_row(row)
            draw_hor_separator()
            if self.is_win():
                cast(win_string)
            else:
                if self.is_gameover():
                    cast(gameover_string)
                else:
                    cast(help_string1)
            cast(help_string2)
     
        def spawn(self):
            new_element = 4 if randrange(100) > 89 else 2
            (i,j) = choice([(i,j) for i in range(self.width) for j in range(self.height) if self.field[i][j] == 0])
            self.field[i][j] = new_element
     
        def move_is_possible(self, direction):
            def row_is_left_movable(row): 
                def change(i): # true if there'll be change in i-th tile
                    if row[i] == 0 and row[i + 1] != 0: # Move
                        return True
                    if row[i] != 0 and row[i + 1] == row[i]: # Merge
                        return True
                    return False
                return any(change(i) for i in range(len(row) - 1))
     
            check = {}
            check['Left']  = lambda field:                                
                    any(row_is_left_movable(row) for row in field)
     
            check['Right'] = lambda field:                                
                     check['Left'](invert(field))
     
            check['Up']    = lambda field:                                
                    check['Left'](transpose(field))
     
            check['Down']  = lambda field:                                
                    check['Right'](transpose(field))
     
            if direction in check:
                return check[direction](self.field)
            else:
                return False
     
    def main(stdscr):
        curses.use_default_colors()
        game_field = GameField(win=32)
        state_actions = {} # Init, Game, Win, Gameover, Exit
        def init():
            game_field.reset()
            return 'Game'
     
        state_actions['Init'] = init
     
        def not_game(state):
            game_field.draw(stdscr)
            action = get_user_action(stdscr)
            responses = defaultdict(lambda: state)
            responses['Restart'], responses['Exit'] = 'Init', 'Exit'
            return responses[action]
     
        state_actions['Win'] = lambda: not_game('Win')
        state_actions['Gameover'] = lambda: not_game('Gameover')
     
        def game():
            game_field.draw(stdscr)
            action = get_user_action(stdscr)
            if action == 'Restart':
                return 'Init'
            if action == 'Exit':
                return 'Exit'
            if game_field.move(action): # move successful
                if game_field.is_win():
                    return 'Win'
                if game_field.is_gameover():
                    return 'Gameover'
            return 'Game'
     
        state_actions['Game'] = game
     
        state = 'Init'
        while state != 'Exit':
            state = state_actions[state]()
     
    curses.wrapper(main)

    对于该游戏的  AI 版本, 外国技术网站上有以下的分析:

    https://stackoverflow.com/questions/22342854/what-is-the-optimal-algorithm-for-the-game-2048/22389702#22389702

    对于该游戏,个人的观点则是AI版本的重点是在各个评分函数的选择上,对此由于源码是JS写的,并不熟悉,再加上并无太多注解,对于外文论坛上的分析也是看得似懂非懂,不甚了了。

  • 相关阅读:
    Tensorflow API解读
    《deep learning book》-- 引言
    算法导论--第一部分(基础知识)
    leetcode解题笔记--part1--array
    TensorFlow实战--阅读笔记part4
    TensorFlow实战--阅读笔记part3
    Pro Git阅读笔记--part1
    TensorFlow实战--阅读笔记part2
    周长最长分析
    VC维含义的个人理解
  • 原文地址:https://www.cnblogs.com/devilmaycry812839668/p/7748441.html
Copyright © 2011-2022 走看看