zoukankan      html  css  js  c++  java
  • 人工智能2:智能Agent

    一、Agent基本定义

      基于理性行为的Agent是本书人工智能方法的核心。Agent由传感器、执行器两个重要元件组成,具有与环境交互的能力,其能力是通过分析感知序列,经过Agent函数映射到相应的行动。

    二、评价Agent行为

      理性Agent:对每一个可能的感知序列,根据已知的感知序列提供的证据和Agent具有的先验知识,理性Agent应该选择能使其性能度量最大化的行动。

      要素:①性能度量②先验知识③行动④已有的感知序列

      收集信息->学习->行动

    三、任务环境

    1. 定义

      理性Agent面对的问题可用PEAS描述:

      (1)Performance性能

      (2)Environment环境

      (3)Actuators执行器

      (4)Sensors传感器

    2. 性质

      (1)完全可观察与部分可观察

      (2)单Agent与多Agent

      (3)确定的与随机的

      (4)片段式的与延续式的

      (5)静态的与动态的

      (6)离散的与连续的

      (7)已知的与未知的

    四、Agent的结构

      Agent = 体系结构(物理传感器和执行器) + 程序(感知信息映射到行动的Agent函数)

      仅仅用表产生Agent函数映射是不可行的,因为表中的数据非常多,使得表庞大到在这个世界中不可能实现。

    1. 简单反射Agent

      基于当前的感知选择行动,不关注感知历史。

      条件-行为规则

      只考虑当前状态,和此状态对应的行动。

      简洁,但智能有限。要求环境完全可观察。

    2. 基于模型的反射Agent

      处理部分可观测环境:跟踪记录现在看不到的那部分世界。

      世界模型:①世界如何独立于Agent而发展的信息;②Agent自身的行动如何影响世界的信息。

      需要记住历史感知信息。

    3. 基于目标的Agent

      需要目标信息来描述想要达到的状况。

      虽然显得效率较低,但更灵活。因为支持它决策的知识被显示表现出来,且可以修改。

    4. 基于效用的Agent

      Agent的效用函数是性能度量的内在化。实际实现时因为计算复杂性而不可能完美达成。

      以上4种应该是不断递进、改进的方式。

    五、学习Agent

      4个组件:

    1. 学习元件

      负责改进提高,利用来自评判元件的反馈评价Agent做得如何,并确定应该如何修改性能元件以便将来做得更好。

    2. 性能元件

      接受感知信息并决策。

    3. 评判元件

      根据固定的性能标准告诉学习元件Agent的运转情况。

    4. 问题产生器

      建议探索性行动,负责可以得到新的和有信息的经验的行动建议。

    六、Agent的工作逻辑

    1. 原子表示

      没有内部结构的表示。

      相关内容:搜索、博弈论、隐马尔可夫模型、马尔可夫决策过程。

    2. 要素化表示

      一个状态中包含多个要素(原子),即多个变量和特征的集合。

      相关内容:约束满足算法、命题逻辑、规划、Bayesian网、机器学习算法。

    3. 结构化表示

      一个状态包含对象、每个对象可能有自身的特征值,以及与其他对象的关系。

      相关内容:关系数据库、一阶逻辑、一阶概率模型、基于知识的学习、自然语言理解。

      从1到3的表达能力是增长的。

  • 相关阅读:
    utils04_搭建私有Git服务器
    utils03_clone远程仓库
    java 22
    java 22
    java 22
    java 22
    java 22
    java 22
    java 22
    java 22
  • 原文地址:https://www.cnblogs.com/r1ce/p/5235174.html
Copyright © 2011-2022 走看看