(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111581871.3
(22)申请日 2021.12.2 2
(71)申请人 华东师范大学
地址 200241 上海市闵行区东川路5 00号
(72)发明人 郝昊 周爱民 钱鸿 邵非
李丙栋 王帅
(74)专利代理 机构 上海德禾翰通 律师事务所
31319
代理人 夏思秋
(51)Int.Cl.
G06F 30/27(2020.01)
G06N 3/12(2006.01)
G06K 9/62(2022.01)
G06N 20/20(2019.01)
G06F 111/06(2020.01)
(54)发明名称
一种基于数据关系学习和预测的多目标优
化代理模型设计方法及系统
(57)摘要
本发明公开了一种基于数据关系学习和预
测的代理模 型设计方法, 用于提高多目标演化算
法的求解效率。 其特点是将演化算法中的个体构
造为关系对, 并利用集成分类学习的方法学习关
系数据特征, 然后指导演化算法的搜索过程。 本
发明可以利用已有数据构造高保真的代理模型,
并对未知数据提供高鲁棒性的预测结果。 在极端
有限的计算量下, 本发明可以辅助演化算法对问
题进行求解。 与现有方法相比, 本发明首次将数
据关系用于代理模型构造, 同时表现出更高的建
模准确性和预测鲁棒性。 在工业优化优化领域,
该方法可以用百秒量级的建模与预测成本替代
高代价的真实模 型评估。 将优化成本降低为原优
化过程的十分之一内, 将优化效率提高10倍以
上。
权利要求书2页 说明书6页 附图2页
CN 114357869 A
2022.04.15
CN 114357869 A
1.一种基于数据关系学习和预测的多目标优化代理模型的设计方法, 其特征在于, 所
述方法将传统代理模型训练数据根据支配关系进 行划分, 然后 将划分后的数据构 造为关系
训练数据, 并训练分类机器学习模型表示当前的数据特征; 当有新解产生时, 用所述模型预
测由新解和已有划分解构造成的关系对标签, 并基于一组预测标签估计当前新解的类别;
类别“优”、“劣”作为新解对最优解集逼近情况优、 劣的度量指标, 最后 演化算法根据新解类
别搜索“优”数据作为后代解;
所述方法包括如下步骤:
步骤1、 输入一个待优化的种群: 根据待优化问题 的特征, 输入用于表示当前优化空间
解的种群P;
步骤2、 产生子代种群: 利用启发式算子对种群P进行作用, 产生子代种群Pc;
步骤3、 从外部数据库中选择训练数据: 从外部数据库中选择与种群P的分布最接近的t
个数据作为原 始训练数据Pt;
步骤4、 划分样本个体: 利用惩罚边界的聚合方法PBI, 将训练数据 Pt划分为“优”,“劣”两
个子集Pn、 Pd;
步骤5、 训练关系对构造: 将Pn、 Pd两个子集中的个体两两组合构成关系对, 并根据其所
属的子集类别赋予新的标签, 记为关系训练数据集R;
步骤6、 代理模型训练: 利用分类 器C对关系训练数据集R进行 学习, 得到代理模型;
步骤7、 预测关系对构造、 预测标签及投票计分: 待评估的个体u与Pn, Pd中的个体x组成
待评估关系对, 利用所述代理模型对待评估关系对进行 预测, 并计算当前u的得分 s(u);
步骤8、 选择优势个体: 根据每个个体的得分s, 将其根据得分s降序排列, 其中, 前50%
的高分个 体标记为“优”个体;
步骤9、 判断循环停止条件: 如果模型的使用次数超过阈值, 则跳出循环, 否则利用启发
式算子产生 新的解, 并跳转至步骤2;
步骤10、 输出子代种群: 种群个体经过启发式算子的不断进化, 质量得到提高, 输出经
过优化后的子代种群。
2.如权利要求1所述的方法, 其特征在于, 步骤3中, 所述外部数据库是利用实验设计方
法从搜索空间中均匀采样的一些点, 并使用高代价评估函数f(x)计算其函数值, 构成待优
化种群数据库
使代理模型的训练数据分布和待优化的种群P的数据
分布相似;
其中, xi表示第i个个体的解空间特征, yi≡f(xi)表示第i个个体在目标空间中的目标
函数值, 其 值是由映射关系f( ·)决定的。
3.如权利要求1所述的方法, 其特征在于, 步骤4中, 所述惩罚边界的聚合方法PBI是指
一种非线性聚合方法, 用于将优化目标空间中多个目标聚合为一个目标; 其中, “优”个体表
示其聚合后的目标值小于阈值的点, 即更接近最优目标; “劣”表示个体远离最优目标; 其
中, 阈值由PBI方法中的参 考点在当前参 考向量上的投影 计算获得。
4.如权利要求1所述的方法, 其特征在于, 步骤5中, 所述关系数据训练集R是由原训练
数据Pt构成的; 如下式所示:
R={<xi,xj>,lij≡r(xi,xj)|i,j∈|Pn∪Pd|and i≠j},权 利 要 求 书 1/2 页
2
CN 114357869 A
2其中, R表示关系训练数据集, <xi,xj>表示样本 数据, 由xi, xj构成, 其数据来源于训练
数据集Pt,lij表示关系数据样本的标签, 其值由函数r( ·)确定; Pn表示Pt中的“优”个体, Pd
表示Pt中的“劣”个体。
5.如权利要求1所述的方法, 其特征在于, 步骤6中, 对步骤5中获得的标签 ‘+1’,‘0’,‘‑
1’进行one‑hot编码操作, 得到如下代理模型:
[s1,s2,s3]=C(<xi,xj>),
其中, C是代理模型, 用于表示关系样本与输出 标签之间的映射关系。
6.如权利要求1所述的方法, 其特 征在于, 步骤7中, 所述得分 s(u)的计算方法如下:
其中,
表示由代理模型C预测后的输出on e‑hot编码i位的平均值, 下标i表示输出编码
的第i位, j表示 由上述第j个公式的计算得出; 当j=I时表示待评估个体u和属于Pn集合的
个体x组成关系对, 并且x在关系对的前一个元素位置; 当j=II时表示待评估个体u和属于
Pn集合的个体x组成关系对, 并且x在关系对的后一个元素位置; 当j=III时表示待评估个
体u和属于Pd集合的个体x组成关系对, 并且x在关系对的前一个元素位置; 当j=IV时表示
待评估个 体u和属于Pd集合的个体x组成关系对, 并且 x在关系对的后一个元 素位置。
7.如权利要求1所述的方法, 其特征在于, 步骤9中, 所述阈值根据模型最大使用次数进
行设定, 即利用当前训练的代理模 型C评估个体u的次数; 所述启发 式算子为GA 算子, 利用启
发式信息进行搜索。
8.一种实现如权利要求1 ‑7之任一项所述方法的系统, 其特征在于, 所述系统包括: 关
系对数据构建模块, 代理模型训练模块, 候选解预测模块;
所述关系对数据构建模块, 利用外部数据库中已有的评估数据, 基于PBI方法自适应地
构建一组标签平衡的关系型 数据, 为后续模型训练提供 数据支撑;
所述代理模型训练模块, 利用监督机器学习方法, 学习样本侧正与标签之前的映射关
系, 得到用于替代高代价评估器的三分类代理模型;
所述候选解预测模块, 将代评估的新解与已评估解组成新的待评估关系对, 并利用代
理模型对数据进行 预测, 基于标签利用投票计分策略对待评估解得优劣进行估计。权 利 要 求 书 2/2 页
3
CN 114357869 A
3
专利 一种基于数据关系学习和预测的多目标优化代理模型设计方法及系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 05:18:33上传分享