进入课题组,开始搞数据挖掘,刚刚接触了遗传算法,在这里分享一些心得。
一、简介
遗传算法是仿生学,主要步骤与生物的遗传相似,不过生物的遗传是不可控制的,它可能向好的方向发展也可能向坏的方向发展,但是遗传算法可以认为进行控制,即舍弃不好的基因,留下好的基因再进行遗传。因为与遗传有关所以算法中很多与生物相关的名词,在这里介绍两个。一个是染色体,一个染色体即为一个解。另一个是基因,一个基因即为解的一个维度。
二、算法详情
- 随机抽取几个解,并将其映射成为高纬度或者二进制。
- 将其进行基因对应位置的交叉(交叉方法在下面进行介绍)
- 根据个体适应度(个人理解为距离最优解的距离)进行染色体的舍弃
- 将剩余的染色体进行变异
- 重复执行步骤2-4,直到有个体适应度满足条件
三、几种简单的交叉方法
- PMX
随机选择一对染色体的几个连续的基因,将对应位置的基因进行交换,然后再做基因冲突(即每个基因不能相同)检测 - OX
先选择一个父代的基因片段,然后按对应位置插到子代中,再选择另一个父代将没有基因冲突的依次插入到子代中,这样就省去了基因冲突检测的麻烦。 - PBX
类似于PMX,但是选取的基因片段不是连续的 - OBX
类似于OX,但是选取的基因片段不是连续的