zoukankan      html  css  js  c++  java
  • 遗传算法

    1 基本概念

      遗传算法(GA)的概念是由Holland于1973年受生物进化论的启发而首次提出的。它是一种通过模拟生物界自然选择和遗传机制的随机搜索算法。

      遗传算法基本思想是模拟自然界优胜劣汰的进化现象,把搜索空间映射为遗传空间,把可能的解编码成一个向量——染色体,向量的每个元素称为基因。 通过不断计算各染色体的适应值,选择最好的染色体,获得最优解。 

      个体就是模拟生物个体而对问题中的对象(一般就是问题的解)的一种称呼,一个个体也就是搜索空间中的一个点。  

      种群就是模拟生物种群而由若干个体组成的群体, 它一般是整个搜索空间的一个很小的子集。 

      适应度(fitness)就是借鉴生物个体对环境的 适应程度,而对问题中的个体对象所设计的 表征其优劣的一种测度。

      适应度函数(fitness function)就是问题中的 全体个体与其适应度之间的一个对应关系。 它一般是一个实值函数。该函数就是遗传算 法中指导搜索的评价函数。 

      染色体(chromosome)就是问题中个体的某种字符串形式的编码表示。字符串中的字符也就称为基因(gene)。

        例如: 个体      染色体

            9 ---- 1001

       (2,5,6)---- 010 101 110

      遗传操作,也称遗传算子(genetic operator),就是关于染色体的运算。遗传算法中有三种遗传操作:

        选择-复制(selection-reproduction) 

          通常做法是:对于一个规模为N的种群S,按每个染色体xi∈S的选择概率P(xi)所决定的选中机会,分N次从S中随机选定N个染色体, 并进行复制。

              

        交叉(crossover,亦称交换、交配或杂交) 

          就是互换两个染色体某些位上的基因。

          例如, 设染色体 s1=01001011, s2=10010101, 交换其后4位基因, 即:

              

          s1′=01000101, s2′=10011011 可以看做是原染色体s1和s2的子代染色体。

        变异(mutation,亦称突变)

          就是改变染色体某个(些)位上的基因。

          例如, 设染色体 s=11001101 将其第三位上的0变为1, 即:

          s=11001101 →11101101= s′。 s′也可以看做是原染色体s的子代染色体。

    2遗传算法基本流程

      

      基本遗传算法步骤:

        步1 在搜索空间U上定义一个适应度函数f(x),给定种群规模N,交叉率Pc和变异率Pm,代数T;  

        步2 随机产生U中的N个个体s1, s2, …, sN,组成初始种群S={s1, s2, …, sN},置代数计数器t=1;  

        步3 计算S中每个个体的适应度f() ;   

        步4 若终止条件满足,则取S中适应度最大的个体作为所求结果,算法结束。

        步5 按选择概率P(xi)所决定的选中机会,每次从S中随机选定1个个体并将其染色体复制,共做N次,然后将复制所得的N个染色体组成群体S1;

        步6 按交叉率Pc所决定的参加交叉的染色体数c,从S1中随机确定c个染色体,配对进行交叉操作,并用产生的新染色体代替原染色体,得群体S2;

        步7 按变异率Pm所决定的变异次数m,从S2中随机确定m个染色体,分别进行变异操作,并用产生的新染色体代替原染色体,得群体S3;   

        步8 将群体S3作为新一代种群,即用S3代替S,t = t+1,转步3;

    3举例

    例: 利用遗传算法求解区间[0,31]上的二次函数y=x2的最大值。

        

      分析:原问题可转化为在区间[0, 31]中搜索能使y取最大值的点a的问题。那么[0, 31]中的点x就是个体, 函数值f(x)恰好就可以作为x的适应度,区间[0, 31]就是一个(解)空间 。这样, 只要能给出个体x的适当染色体编码, 该问题就可以用遗传算法来解决。

      (1) 设定种群规模,编码染色体,产生初始种群。

        将种群规模设定为4;用5位二进制数编码染色体;取下列个体组成初始种群

        S1: s1= 13 (01101), s2= 24 (11000) s3= 8 (01000), s4= 19 (10011)

      (2) 定义适应度函数, 取适应度函数:f (x)=x*x

      (3) 计算各代种群中的各个体的适应度, 并对其染色体进行遗传操作,直到适应度最高的个体(即31(11111))出现为止。

        首先计算种群S1中各个体s1= 13(01101), s2= 24(11000) s3= 8(01000), s4= 19(10011) 的适应度f (si) 。

        容易求得 f (s1) = f(13) = 13*13= 169

             f (s2) = f(24) = 242*24= 576

             f (s3) = f(8) = 8*8 = 64

             f (s4) = f(19) = 19*19 = 361

        再计算种群S1中各个体的选择概率。选择概率的计算公式为

            

        由此可求得 P(s1) = P(13) = 0.14

              P(s2) = P(24) = 0.49

              P(s3) = P(8) = 0.06

              P(s4) = P(19) = 0.31

        赌轮选择法:

          在算法中赌轮选择法可用下面的子过程来模拟:

            ① 在[0, 1]区间内产生一个均匀分布的随机数r。   

            ② 若r≤q1,则染色体x1被选中。  

            ③ 若qk-1<r≤qk(2≤k≤N), 则染色体xk被选中。 其中的qi称为染色体xi (i=1, 2, …, n)的积累概率, 其计算公式为

                

      (4)选择-复制 

        设从区间[0, 1]中产生4个随机数如下:

          r1 = 0.450126, r2 = 0.110347 r3 = 0.572496, r4 = 0.98503

        

      染色体

      适应度

    选择概率

    积累概率

    选中次数

    s1=01101

        169

        0.14

        0.14

          1

    s2=11000

        576

        0.49

        0.63

          2

    s3=01000

          64

        0.06

        0.69

          0

    s4=10011

        361

        0.31

        1.00

          

          于是,经复制得群体: s1’ =11000(24), s2’ =01101(13) s3’ =11000(24), s4’ =10011(19)

      (5)交叉

        设交叉率pc=100%,即S1中的全体染色体都参加交叉运算。

        设s1’与s2’配对,s3’与s4’配对。分别交换后两位基因,得新染色体:

          s1’’=11001(25), s2’’=01100(12) s3’’=11011(27), s4’’=10000(16)  

      (6)变异

        设变异率pm=0.001。

        这样,群体S1中共有 5×4×0.001=0.02 位基因可以变异。 0.02位显然不足1位,所以本轮遗传操作不做变异。

        于是,得到第二代种群S2: s1=11001(25), s2=01100(12) s3=11011(27), s4=10000(16)

          

      显然,在迭代好多代种群中已经出现了适应度最高的染色体s1=11111。于是,遗传操作终止,将染色体“11111”作为最终结果输出。   

      然后,将染色体“11111”解码为表现型,即得所求的最优解:31。 将31代入函数y=x2中,即得原问题的解,即函数y=x2的最大值为961。

      

  • 相关阅读:
    linux系统中输入输出重定向 0<、<、1>、>、2>、1>>、>>、2>>、&>、>&、&>>、2>&1、<<
    linux系统统计某一行出现特定字符的次数
    linux系统中常用的通配符*、?、[ ]、[^xxx]、{}
    R语言strsplit函数用法
    linux系统统计某一字符出现的次数
    什么时候你需要一个虚构函数是虚的
    strcpy的返回值有什么用?
    boost.array 使用实例
    《DB 查询分析器》使用技巧之(七)
    《微型电脑应用》2011年第11期刊登出《万能数据库查询分析器中的事务管理在Oracle中的应用》
  • 原文地址:https://www.cnblogs.com/chamie/p/4552066.html
Copyright © 2011-2022 走看看