快速入门

经过历代版本的更迭,Geatpy目前支持多种使用风格。分别为:“求解器模式”写法、“面向对象”写法、“面向过程”写法。 其中“求解器模式”是Geatpy2.7.0之后新增的写法。可以大大节省代码量、更加专注于问题的定义。

入门案例

先以“求解器模式”为例来快速入门。帮助您掌握如何快速构建问题、定义算法以及求解问题。

案例1

用增强精英保留策略的遗传算法求解以下问题:

$$min\ f(x_1, x_2, x_3, x_4, x_5) = (x_1-r)^2+(x_2-r)^2+...+(x_5-r)^2, r=1$$$$s.t.\ \ (x_1-0.5)^2\leq0.25$$$$(x_1-1)^2\leq1$$$$-1 \leq x_1\leq 1$$$$0 \leq x_2\leq 4$$$$1 \leq x_3\leq 5$$$$1 \leq x_4\leq 2$$$$1 \leq x_5\leq 1$$

其中$x_1, x_2, x_3, x_4, x_5$为决策变量。$-1 \leq x_1\leq 1 \ ; \ 0 \leq x_2\leq 4 \ ; \ 1 \leq x_3\leq 5 \ ; \ 1 \leq x_4\leq 2 \ ; \ 1 \leq x_5\leq 1$ 为每个决策变量的范围。下面来看该问题如何用Geatpy求解:

分析

  1. 从上述代码可见,我们可以先定义一个目标函数,然后创建问题,再是构建算法,最后调用optimize()函数求解。 在上面的例子中,我们在定义目标函数时,加了一个@ea.Problem.single的标记。它可以让目标函数evalVars()的传入参数是一个Numpy ndarray类型的一维数组,它的实际含义是种群的某个个体对应的决策变量。在evalVars()中,我们通过f=np.sum((Vars - r) ** 2)计算出这组决策变量对应的目标函数值。
  1. 然后通过CV = np.array([(x1 - 0.5)**2 - 0.25, (x2 - 1)**2 - 1])来计算违反约束程度值。这是因为该问题除了变量范围外,有2个不等式约束。如果$(x_1-0.5)^2 - 0.25$的值大于0,就说明违反了$(x_1-0.5)^2\leq0.25$的约束,并且$(x_1-0.5)^2 - 0.25$的值越大,违反约束的程度就越大。我们把计算得到的两个约束的违反约束程度值拼合在一起组成一个一维数组,就得到一个数组表示这组决策变量所有的违反约束程度值。
  1. 代码的第15行,这里调用了Geatpy的Problem问题类的构造函数,得到一个问题对象。 其中maxormins是一个记录着各个目标函数是最小化抑或是最大化的Numpy array行向量,其中元素为1表示对应的目标是最小化目标;为-1表示对应的是最大化目标。例如M=3,maxormins=array([1,-1,1]),此时表示有三个优化目标,其中第一、第三个是最小化目标,第二个是最大化目标。varTypes是一个记录着决策变量类型的行向量,其中的元素为0表示对应的决策变量是连续型变量;为1表示对应的是离散型变量。
  1. 接着,第24行,我们实例化了Geatpy内置实现的一个进化算法类的对象。其中第25行定义了该进化算法用什么样的种群去进化。Encoding='RI'表示改种群的染色体是'RI'编码,即“实数整数混合编码”,简称“实整数编码”。类似的还有'P'编码(排列编码,可以让对应的变量互不相同)、'BG'编码(二进制/格雷码编码)。然后NIND=20设定了种群有20个个体。
  1. 最后,在第31行,调用geatpy的optimize()函数进行求解。其中seed=1表示设置随机数种子。如果不想设置随机数种子,则把它设为None,或者不把它传入到optimize()函数中。dirName='result'表示把求解结果以文件的形式保存在当前工作目录下的result文件夹中。如果不传入dirName或者设dirName为None,则默认会以求解的起始时间的信息作为文件夹,把结果保存在里面。optimize()函数的其他传入参数以及31行获得的返回值res(类型为python字典)的内容可以用help(ea.optimize)或跳转进入源码查看。例如res['ObjV']表示算法搜索到的最佳目标函数值(它是个Numpy ndarray二维数组,每一行表示一组目标函数值。);res['Vars']表示对应的决策变量值矩阵(Numpy ndarray二维数组,每一行表示一组决策变量值)。

案例2

同样是求解案例1的问题,这里我们在定义目标函数时不加ea.Problem.single标记。这意味着evalVars()传入的是一个Numpy ndarray二维数组。下面直接看代码:

可以发现,发生最大变化的是目标函数的定义上。不加ea.Problem.single标记后,传入目标函数evalVars()的参数Vars是一个Numpy ndarray二维数组。它是NIND行Dim列。NIND即种群的个体数,即种群规模;Dim即自定义的问题的决策变量个数。

因此我们可以用Numpy向量化的方法同时算出所有个体对应的目标函数值和违反约束程度值。结果分别保存为ObjV和CV。其中ObjV是一个NIND行1列的Numpy ndarray二维数组。CV是一个NIND行2列的Numpy ndarray二维数组。

案例3

用NSGA2算法求解下面的双目标优化问题:

$$min\ f(x_1) = x_1^2$$$$min\ f(x_1) = (x_1-2)^2$$$$s.t.\ \ x_1^2 - 2.5x_1^2+1.5\geq0$$

下面展示第二种风格——“面向对象”风格的写法:

这里通过构建geatpy问题类Problem的子类来定义问题。第14行定义了目标函数evalVars,它重写了Problem类中的evalVars()。注意这个名字不能随便更改。Geatpy的Problem问题类提供两种目标函数的定义,分别是evalVars和aimFunc。前者(evalVars)是Geatpy2.7.0之后新增的写法,它传入决策变量矩阵Vars且需要返回对应的目标函数值矩阵ObjV和违反约束程度矩阵CV(若待求解的问题没有约束条件,则可以只返回目标函数矩阵)。后者(aimFunc)是传统的写法,它传入一个种群对象,且不需要返回值。

采用aimFunc()的传统写法如下:

Geatpy的种群信息保存在种群对象中。Geatpy中有Population单染色体种群类(每个个体只有一条染色体)和PsyPopulation多染色体种群类(每个个体有多条染色体)。Population种群对象主要拥有以下属性:Encoding(染色体编码方式)、sizes(种群规模)、ChromNum(染色体条数(Population类的对象这里ChromNum固定为1))、Field(译码矩阵)、Chrom(染色体矩阵)、Lind(染色体长度)、ObjV(目标函数值矩阵)、FitnV(适应度列向量)、CV(违反约束程度值矩阵)、Phen(种群表现型矩阵(等价于决策变量组成的矩阵))。【详见《Geatpy数据结构》文档】

案例4

调用内置的benchmark测试问题。

Geatpy2.7.0把已实现的测试问题归档进了benchmarks文件夹中。比如ZDT1、DTLZ1、WFG1,等等。以DTLZ1为例,可以通过ea.benchmarks.DTLZ1()直接实例化DTLZ1问题对象。用NSGA3算法求解DTLZ1的代码如下:

Geatpy架构说明

Geatpy2整体上看由工具箱内核函数(内核层)和面向对象进化算法框架(框架层)两部分组成。其中面向对象进化算法框架主要有四个大类:Problem问题类、Algorithm算法模板类、Population种群类和PsyPopulation多染色体种群类。UML图如下所示:

Problem类定义了与问题相关的一些信息,如问题名称name、优化目标的维数M、决策变量的个数Dim、决策变量的范围ranges、决策变量的边界borders等。maxormins是一个记录着各个目标函数是最小化抑或是最大化的Numpy array行向量,其中元素为1表示对应的目标是最小化目标;为-1表示对应的是最大化目标。例如M=3,maxormins=array([1,-1,1]),此时表示有三个优化目标,其中第一、第三个是最小化目标,第二个是最大化目标。varTypes是一个记录着决策变量类型的行向量,其中的元素为0表示对应的决策变量是连续型变量;为1表示对应的是离散型变量。待求解的目标函数定义在aimFunc()的函数中。calReferObjV()函数则用于计算或读取目标函数参考值(一般用理论上的目标函数的最优值作为参考值),该参考值可以用于后续的指标分析。在实际使用时,不是直接在Problem类的文件中修改相关代码来使用的,而是通过定义一个继承Problem的子类来完成对问题的定义的。这些在后面的章节中会详细讲述。getReferObjV()是Problem父类中已经实现了的一个函数,它先尝试读取特定文件夹中的目标函数值参考数据,如果读取不到,则调用calReferObjV()进行计算。对于Problem类中各属性的详细含义可查看Problem.py源码。

Population 类是一个表示种群的类。一个种群包含很多个个体,而每个个体都有一条染色体(若要用多染色体,则使用多个种群、并把每个种群对应个体关联起来即可)。除了染色体外,每个个体都有一个译码矩阵Field(或俗称区域描述器) 来标识染色体应该如何解码得到表现型,同时也有其对应的目标函数值以及适应度。种群类就是一个把所有个体的这些数据统一存储起来的一个类。比如里面的Chrom 是一个存储种群所有个体染色体的矩阵,它的每一行对应一个个体的染色体;ObjV 是一个目标函数值矩阵,每一行对应一个个体的所有目标函数值,每一列对应一个目标。对于Population 类中各属性的详细含义可查看Population.py 源码以及下一章“Geatpy 数据结构”。

PsyPopulation类是继承了Population的支持多染色体混合编码的种群类。一个种群包含很多个个体,而每个个体都有多条染色体。用Chroms列表存储所有的染色体矩阵(Chrom);Encodings列表存储各染色体对应的编码方式(Encoding);Fields列表存储各染色体对应的译码矩阵(Field)。EncoIdxs是一个list,其元素表示每条染色体对应编码哪一个变量。比如EncoIdxs = [[0], [1,2,3,4]],表示一共有5个变量,其中第一个变量编码成第一条子染色体;后4个变量编码成第二条子染色体。

Algorithm 类是进化算法的核心类。它既存储着跟进化算法相关的一些参数,同时也在其继承类中实现具体的进化算法。比如Geatpy 中的moea_NSGA3_templet.py 是实现了多目标优化NSGA-III 算法的进化算法模板类,它是继承了Algorithm 类的具体算法的模板类。关于Algorithm 类中各属性的含义可以查看Algorithm.py 源码。这些算法模板通过调用Geatpy 工具箱提供的进化算法库函数实现对种群的进化操作,同时记录进化过程中的相关信息,其基本层次结构如下图:

其中“算子类”是Geatpy2.2.2版本之后增加的特性,通过实例化算子类来调用低级操作函数,可以利用面向对象编程的优势使得对传入低级操作函数的一些参数的修改变得更加方便。目前内置的“算子类”有“重组算子类”和“变异算子类”。用户可以绕开对底层的低级操作函数的修改而直接通过新增“算子类”来实现新的算子例如自适应的重组、变异算子等。

例如:mutpolyn是多项式变异的低级变异算子。其对应的高级变异算子为:Mutpolyn。

附录

  1. 进化算法介绍:http://geatpy.com/index.php/ea_introduction/

  2. Geatpy数据结构:http://geatpy.com/index.php/2020/10/19/2-geatpy%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%842-6-x/

  3. Geatpy总览:http://geatpy.com/index.php/%e6%80%bb%e8%a7%88/

  4. Geatpy案例:http://geatpy.com/index.php/demos/