zoukankan      html  css  js  c++  java
  • 数学建模方法-遗传算法(实战篇part 2)

    一、引言

      在上一个篇章中,我们用遗传算法来计算一个一元函数的最大值,但是,有人会讲,这样是不是有些大材小用了,明明我可以用更少的代码来实现求最大值的功能。确实,将遗传算法用在那里确实大材小用了,但是,博主的目的并不是为求最大值,而是为了给大家展示,遗传算法是一种可行的算法,并且博主编写的matlab代码是可行的。现在,我们就要利用上一篇写的代码作为基本代码,来解决本篇的问题。放心,本篇的问题可不是用普通的方法就能就解决的。遗传算法的春天终于来了。让我们开始吧。。

    二、问题描述和建模

      负载均衡调度问题:假设有N个任务,需要负载均衡器分配给M个服务器节点去处理。每个任务的任务长度、每台服务器节点(下面简称“节点”)的处理速度已知,请给出一种任务分配方式,使得所有任务的总处理时间最短。

      好,那么现在题目有了,但是我们要想办法对题目进行数学建模。显然,我们需要2个矩阵,一个存放任务(含任务数量、任务长度),一个存放服务器节点(含节点数量、处理速度)。

    (1)任务长度矩阵(简称:任务矩阵)

      我们将所有任务的任务长度用矩阵tasks表示,其中tasks(i)中的i表示任务的编号,tasks(i)表示任务i的任务长度。比如

      tasks = [2, 4, 6, 8]                

      表明,任务1的长度是2;任务2的长度是4,以此类推。

    (2)节点处理速度矩阵(简称:节点矩阵)

      我们将所有服务器节点的处理速度用nodes表示,其中nodes(i)中的i表示节点的编号,nodes(i)表示节点j的处理速度。比如

      nodes = [2, 1]

      表明,节点1的速度是2;节点2的速度是1,以此类推。

    (3)任务处理时间矩阵

      当任务矩阵task和节点矩阵nodes确定下来后,那么所有任务分配给所有节点的任务处理时间就可以确定了,我们用矩阵timeMat来存所有节点的任务处理时间,那么timeMat(i, j)表示任务i分配给节点j处理所需的时间,它通过以下公式计算:

      timeMat(i, j) = task(i) / nodes(j);

      有了上面三个矩阵后,我们就算是成功将题目用数学的方式描述出来了。

      我们用matlab代码创建一个createData.m文件,用来对题目进行建模并且保存数据。如下:

    %% I. 清空自变量
    clear all
    clc
    %% II. 题目建模
    % 参数定义
    taskNum = 100;												% 任务数量
    taskLengthRange = [10, 100];								% 任务长度范围
    nodeNum = 10;												% 节点数量
    nodeSpeedRange = [10, 100];									% 节点长度范围
    
    tasks = initRandomMat(taskNum, taskLengthRange);			% 构建任务矩阵(含任务数量和任务长度)
    
    nodes = initRandomMat(nodeNum, nodeSpeedRange);				% 构建节点矩阵(含节点数量和节点处理速度)
    
    timeMat = zeros(taskNum, nodeNum);							% 构建处理时间矩阵
    for i = 1: taskNum
        for j = 1: nodeNum
            timeMat(i, j) = tasks(1, i) / nodes(1, j);
        end
    end
        
    %% III. 数据保存
    save('data', 'tasks', 'nodes', 'timeMat');
    

      其中initRandomMat()函数代码如下:

    % [name] 	--		initRandomMat(初始化随机矩阵)
    % [function]--		
    % [input]	--		length (数组的长度)
    %			--		range (数组元素的取值范围range(1) to range(2))
    % [output]	--		randomMat
    
    function randomMat = initRandomMat(length, range)
        randomMat = zeros(1, length);
        for i = 1: length
            randomMat(1, i) = round(rand() * (range(2) - range(1)) + range(1));
        end
    

      三、遗传算法解决问题

      还是老样子,我们先回顾下遗传算法的步骤,如下:

      1.  种群初始化
      2. 计算每个种群的适应度值
      3. 选择(Selection)
      4. 交叉(Crossover)
      5. 变异(Mutation)
      6. 重复2-5步直至达到进化次数

      正如我们上一篇所说,为了让我们的代码有更好的包容性,我们需要先写几个函数包,到时再main.m里面引用,就很方便了。

      (1)种群初始化函数popInit(),能根据提供的种群大小染色体长度产生初始的种群。代码如下:

    % [name] 	--		popInit(种群初始化函数)
    % [function]--		构建种群矩阵,其中行数为种群个数,列数为染色体长度(即基因的个数),并随机分配染色体的样式
    % [input]	--		1. popSize(种群大小/个数)
    %			--		2. cLength(染色体长度)
    %			--		3. range (染色体上基因的数值范围0 - range)
    % [output]	--		popMat(种群矩阵)
    
    function popMat = popInit(popSize, cLength, range)
    	popMat = zeros(popSize, cLength);                           % 预分配内存
    	for i = 1: popSize
    		for j = 1: cLength
    			popMat(i, j) = ceil(rand() * range);                % rand产生(1,range)之间的随机数
    		end
    	end
    
    clear i;
    clear j;
    

       (2)计算每个种群的适应度值函数getfitnessValue()。代码如下:

    % [name] 	--		getfitnessValue(计算种群个体适应度值)
    % [function]--		根据不同的题目要求,设计适应度方程计算的算法
    %			--		在实际的负载均衡调度中,各个节点的任务处理是并行计算的,所以,所有任务的完成时间应该是所有节点任务完成时间的最大值,并非所有任务完成时间的总和。
    % [input]	--		timeMat (时间处理矩阵)		-- timeMat(i, j): 第i个任务分配到第j个节点,需要的处理时间
    %			--		popMat (种群矩阵)				-- popMat(i, j): 第i个染色体上, 第j个任务分配到的节点标号
    %			--		nodeNumMax (节点的最大标号)
    % [output]	--		fitValMat(每个染色体的适应度值)
    
    function fitnessValueMatrix = getfitnessValue(popMat, timeMat, nodeNumMax)
    	[popSize, cLength] = size(popMat);														% 获取种群的数目(行)和染色体长度(列)
    	fitnessValueMatrix = zeros(popSize, 1);													% 初始化适应度矩阵																		% 最大的节点标号											
    	for i = 1: popSize
    		maxLength = eps;																	% 大于0的最小正数
    		for nodeIndex = 1: nodeNumMax
    			sumLength = 0;                                                            		% 清零
    			for j = 1: cLength
    				if popMat(i, j) == nodeIndex
    					sumLength = sumLength + timeMat(j, nodeIndex);
    				end				
    			end
    			if sumLength > maxLength
    				maxLength = sumLength;
                end 
    		end
    		fitnessValueMatrix(i) = maxLength;
    	end
    
    clear i;
    clear j;
    clear nodeIndex;
    

      (3)选择函数selection(),可以对种群进行选择,具体算法和代码如下:

    % [name] 	--		selection(选择操作)
    % [function]--		采用轮盘赌的一个形式来进行选择,增加不确定性,这样种群就不容易趋向局部最优
    % [input]	--		1. fitnessValueMatrix (适应度值矩阵)
    %			--		2. popMat(未选择的种群矩阵)
    %			--		3. type        --       1: 保留亲代最优个体
    %                                           0: 不保留亲代最优个体
    % [output]	--		updatedPopMat(经选择后的种群矩阵)
    
    function updatedPopMat = selection(fitnessValueMatrix, popMat, type)
    	[popSize, cLength] = size(popMat);
        updatedPopMat = zeros(popSize, cLength);
        fitnessValueMatrix = 100 ./ fitnessValueMatrix;
    	% 剔除适应值为负的种群,使其适应值为0
    	for i = 1: popSize
    		if fitnessValueMatrix(i, 1) < 0
    			fitnessValueMatrix(i, 1) = 0;
    		end
    	end
    	% 轮盘赌算法
    	P = fitnessValueMatrix / sum(fitnessValueMatrix);
    	Pc = cumsum(P);
    	
    	for i = 1: popSize
    		index = find(Pc >= rand);
    		updatedPopMat(i, :) = popMat(index(1), :);
    	end
    
    	% 是否要保留亲本适应度值最高的,若是,则type = 1,否则为0
    	if type
    		[~, bestIndex] = max(fitnessValueMatrix);
    		updatedPopMat(popSize, :) = popMat(bestIndex, :);		% 将亲代最优染色体放到子代的最后一个个体中
    	end
    
    clear i;
    clear j;
    

      (4)交叉函数crossover(),可以对种群进行交叉,交叉的方式又分为单点交叉多点交叉,根据输入不同的参数来选择不同的实现方式,具体算法和代码如下:

    % [name] 	--		crossover(交叉操作)
    % [function]--		选定交叉点并进行互换
    % [input]	--		1. popMat (未交叉的种群矩阵)
    %			--		2. type		--		1: 单点交叉
    %								--		2: 多点交叉
    %			--		3. crossrate (交叉率)	 -- 建议值为0.6
    % [output]	--		updatedPopMat(经交叉后的种群矩阵)
    
    function updatedPopMat = crossover(popMat, type, crossrate)
    	[popSize, cLength] = size(popMat);
    	if type == 1
    		% 单点交叉
    		for i = 1: 2: popSize
    			if crossrate >= rand
    				crossPosition = round(rand() * (cLength - 2) + 2);		% 随机获取交叉点,去除0和1
    				% 对 crossPosition及之后的二进制串进行交换
    				for j = crossPosition: cLength
    					temp = popMat(i, j);
    					popMat(i, j) = popMat(i + 1, j);
    					popMat(i + 1, j) = temp;
    				end
    			end
            end
            updatedPopMat = popMat;
    	elseif type == 2
    		% 多点交叉
    		for i = 1: 2: popSize
    			if crossrate >= rand
    				crossPosition1 = round(rand() * (cLength - 2) + 2);		% 第一个交叉点
    				crossPosition2 = round(rand() * (cLength - 2) + 2);		% 第二个交叉点
    				first = min(crossPosition1, crossPosition2);
    				last = max(crossPosition1, crossPosition2);
    				for j = first: last
    					temp = popMat(i, j);
    					popMat(i, j) = popMat(i + 1, j);
    					popMat(i + 1, j) = temp;
    				end
    			end
    
            end
            updatedPopMat = popMat;
    	else
    		h = errordlg('type的类型只能为1(单点交叉)或者2(多点交叉)', '进行交叉时发生错误');
        end
        
    
    clear i;
    clear j;
    

      (5)变异函数mutation(),可以对种群进行变异,具体算法和代码如下:

    % [name] 	--		mutation(变异操作)
    % [function]--		单点变异:随机选择变异点,将其变为0或1
    % [input]	--		1. popMat (未交叉的种群矩阵)
    %			--		2. mutateRate (交叉率)	 -- 建议值为0.1
    %			--		3. randValur (变异后的随机数范围0-randValue)
    % [output]	--		updatedPopMat(经交叉后的种群矩阵)
    
    function updatedPopMat = mutation(popMat, mutateRate, randValue)
    	[popSize, cLength] = size(popMat);
    	for i = 1: popSize
    		if mutateRate >= rand
    			mutatePosition = ceil(rand() * cLength);			% 随机获取交叉点,去除0
    			% 对mutatePosition点进行变异
    			popMat(i, mutatePosition) = ceil(rand() * randValue);
    		end
    	end
    	updatedPopMat = popMat;
    clear i;
    clear j;
    

      (6)画图函数plotGraph:用于直观的显示在进化的过程中,种群平均总处理时间的变化。代码如下:

    % [name] 	--		plotGraph(画图)
    % [function]--		直观的展示在进化过程中,平均适应度值的趋势变化
    % [input]	--		1. generationTime(进化次数)
    %					2. fitnessAverageValueMatrix(平均适应度值矩阵)
    % [output]	--		none
    
    function plotGraph(fitnessAverageValueMatrix, generationTime)
    x = 1: 1: generationTime;
    y = fitnessAverageValueMatrix;
    
    plot(x, y);
    xlabel('迭代次数');
    ylabel('平均总处理时间');
    title('种群平均总处理时间的进化曲线');
    

      好了,至此,我们就完成了解决本题目需要的函数块。接下来,我们只需要编写主函数main.m,针对本章的题目,对其进行求解即可。代码如下:

    %% I. 清空变量
    clear all
    clc
    %% II. 导入数据和参数初始化
    %导入参数数据
    tasks = load('data', 'tasks');                                                          % 导入任务矩阵(含任务数量和任务长度)
    tasks = tasks.tasks;                                                                    % 导入的是struct格式,因此要再多此一步
    
    nodes = load('data', 'nodes');                                                          % 导入节点矩阵(含节点数量和节点处理速度)
    nodes = nodes.nodes;
    
    timeMat = load('data', 'timeMat');                                                      % 导入处理时间矩阵
    timeMat = timeMat.timeMat;
    
    taskNum = length(tasks);                                                                % 任务数量
    nodeNum = length(nodes);                                                                % 节点数量
    
    iteratorNum = 1000;                                                                     % 迭代次数
    popSize = 300;                                                                          % 种群大小(染色体数量)
    crossRate = 0.6;                                                                        % 交叉概率
    mutateRate = 0.01;                                                                      % 变异概率 
    
    fitnessAverageValueMatrix = zeros(iteratorNum, 1);                                      % 每代平均适应度值
    fitnessBestValueMatrix = zeros(iteratorNum, 1);                                         % 每代最优适应度值
    bestIndividual = zeros(iteratorNum, taskNum);                                           % 每代最佳自变量
    
    %% III. 初始化种群
    	popMat = popInit(popSize, taskNum, nodeNum);
    
    %% IV. 迭代繁衍获取更好的个体(选择、交叉、变异)
    for currentNum = 1: iteratorNum
    	% 求单个染色体的总处理时间和适应度矩阵
    	sumTimeMat = getfitnessValue(popMat, timeMat, nodeNum);								% 染色体的总处理时间	
        % 记录当前最好的数据
        if currentNum == 1
            [~, bestIndex] = min(sumTimeMat);
            fitnessBestValueMatrix(currentNum) = min(sumTimeMat);
            fitnessAverageValueMatrix(currentNum) = mean(sumTimeMat);
            bestIndividual(currentNum, :)= popMat(bestIndex, :);							% 最佳适应度值所对应的染色体(分配方案)
        else
            [~, bestIndex] = min(sumTimeMat);
            fitnessBestValueMatrix(currentNum) = min(fitnessBestValueMatrix(currentNum - 1), min(sumTimeMat));
            fitnessAverageValueMatrix(currentNum) = mean(sumTimeMat);
            if fitnessBestValueMatrix(currentNum) == fitnessBestValueMatrix(currentNum - 1)
                bestIndividual(currentNum, :) = bestIndividual(currentNum - 1, :);              
            elseif fitnessBestValueMatrix(currentNum) == min(sumTimeMat)
                bestIndividual(currentNum, :) = popMat(bestIndex, :);                           
            else
                h = errordlg('请检查代码', '意外错误');
            end 
        end
        
        if currentNum ~= iteratorNum
            % 选择
            popMat = selection(sumTimeMat, popMat, 1);										% 保留亲代最佳个体
            % 交叉
            popMat = crossover(popMat, 1, crossRate);										% 单点交叉
            % 变异
            popMat = mutation(popMat, mutateRate, nodeNum);
        end
    end
    
    %% V. 画图并展示结果
     
    % 画图
    plotGraph(fitnessAverageValueMatrix, iteratorNum);
    % 展示数据
     
    disp 最短处理时间
    fitnessBestValueMatrix(currentNum, 1)
     
    plan = bestIndividual(currentNum, :);
    

      运行上述程序,可以得到:

    ans = 
                9.5278
    

      可以得知,经过我们的遗传算法,可以设计出一套方案,让总处理时间大大减小(不能保证是最小,但接近最小)。下面大家可以看看,随着迭代次数的增加,遗传算法对方案的优化进而平均总处理时间的变化。

      可以看到,随着迭代次数的增加,平均总处理时间从30多降到最后的9点多。

  • 相关阅读:
    elasticsearch设置共享目录、创建备份、恢复备份
    elasticsearch通过logstash去重数据
    Densite_RANK 函数
    Echarts立体地图加3D柱图可点击可高亮选中的开发
    Hadoop3.x-Yarn
    Hadoop3.x-MapReduce
    python dvwa时间盲注自动化脚本(level=low)
    python dvwa布尔盲注自动化脚本(level=low)
    时序数据库 Apache-IoTDB 源码解析之元数据索引块(六)
    网易2020校招笔试- 系统开发/研发工程师(提前批) [编程题]序列维护
  • 原文地址:https://www.cnblogs.com/Qling/p/9518039.html
Copyright © 2011-2022 走看看