说明:最全专利文库
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111575582.2 (22)申请日 2021.12.21 (71)申请人 深圳晶泰科技有限公司 地址 518000 广东省深圳市福田区福保街 道福保社区红柳道2号顺丰工业厂房3 层 (72)发明人 付文博 曾群  (74)专利代理 机构 北京中知君达知识产权代理 有限公司 1 1769 代理人 李春伟 (51)Int.Cl. G06F 30/27(2020.01) G16C 10/00(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 数据处理方法、 装置、 模型训练方法和预测 自由能方法 (57)摘要 本申请涉及了一种数据处理方法、 装置、 模 型训练方法和预测自由能方法。 该数据处理方法 包括: 获得待处理数据, 待处理数据包括针对目 标分子中的多个原子各自的属性信息; 响应于多 个原子各自的属性信息, 生 成针对目标分子的节 点集合和节 点位置集合; 生 成针对节 点集合的节 点标量特征Ns和节点矢量特征Nv, 并且基于节点 位置集合中各节点的坐标信息生成针对节点集 合的边标量特征Es和边矢量特征Ev; 基于针对节 点集合的节点标量特征Ns、 节点矢量特征Nv、 边 标量特征Es和边矢量特征Ev构建虚拟分子图, 以 基于虚拟分子图确定目标分子的分子特征X, 并 基于目标分子的分子特征X确定溶剂化自由能。 本申请能够提升确定的溶剂化自由能的精准度。 权利要求书5页 说明书21页 附图9页 CN 114218869 A 2022.03.22 CN 114218869 A 1.一种数据处 理方法, 其特 征在于, 包括: 获得待处 理数据, 所述待处 理数据包括针对目标分子中的多个原子各自的属性信息; 响应于所述多个原子各自的属性信 息, 生成针对所述目标分子的节点集合和节点位置 集合, 其中, 所述节点集合中的多个节点分别表征特定原子类型的原子, 所述节点位置集合 包括所述节点 集合中各节点在特定坐标系下的坐标信息; 生成针对所述节点集合 的节点标量特征Ns和节点矢量特征Nv, 并且基于所述节点位置 集合中各节点的坐标信息生成针对所述节点 集合的边标量特 征Es和边矢量特 征Ev; 基于针对所述节点集合的节点标量特征Ns、 节点矢量特征Nv、 边标量特征Es和边矢量特 征Ev构建虚拟分子图, 以基于所述虚拟分子图确定所述目标分子的分子特征X, 便于至少基 于所述目标分子的分子特 征X确定溶剂化自由能。 2.根据权利要求1所述的方法, 其特征在于, 所述目标分子包括N个原子, 所述节点集合 中的多个节点各自具有F维特 征; 所述节点标量特征Ns的维度包括N ×F×1维, 所述节点矢量特征Nv的维度包括N ×F×3 维, 所述边标量特 征Es的维度包括 N×1×1维, 所述边矢量特 征Ev的维度包括 N×3×1维。 3.根据权利要求1所述的方法, 其特征在于, 还包括: 在所述响应于所述多个原子各自 的属性信息, 生成针对所述目标分子的节点 集合和节点 位置集合之后, 确定截断半径 rcut; 从所述节点集合中确定节点之间距离小于或者等于所述截断半径rcut的目标节点, 得 到目标节点 集合Ni; 所述基于所述节点位置集合中各节点的坐标信息生成针对所述节点集合的边标量特 征和边矢量特 征包括: 基于所述节点位置集合中针对所述目标节点的坐标信息生成针对所述目标节点集合Ni 的边标量特 征Es和边矢量特 征Ev。 4.根据权利要求3所述的方法, 其特征在于, 所述目标节点集合包括E个节点, 所述E个 节点各自具有F维特 征; 所述节点标量特征Ns的维度包括N ×F×1维, 所述节点矢量特征Nv的维度包括N ×F×3 维, 所述边标量特 征Es的维度包括E ×1×1维, 所述边矢量特 征Ev的维度包括E ×3×1维。 5.根据权利要求2或4所述的方法, 其特征在于, 所述基于所述虚拟分子 图确定所述目 标分子的分子特 征X, 包括: 基于所述虚拟分子图更新所述节点标量特征Ns和所述节点矢量特征Nv, 得到更新节点 标量特征New_Ns和更新节点矢量特 征New_Nv; 重复以下操作, 直至达到指定循环次数num_conv, 以将达到所述指定循环次数num_ conv时得到的更新节点标量特 征New_Ns, 作为所述分子特 征X: 将所述更新节点标量特征New_Ns和所述更新节点矢量特征New_Nv分别作为当前节点标 量特征Now_Ns和当前节点矢量特 征Now_Nv; 利用所述当前节点标量特征Now_Ns、 所述当前节点矢量特征Now_Nv、 所述边标量特征Es 和所述边矢量特 征Ev构建更新虚拟分子图; 基于所述更新虚拟分子图更新所述更新节点标量特征New_Ns和所述更新节点矢量特征 New_Nv。权 利 要 求 书 1/5 页 2 CN 114218869 A 26.根据权利要求5所述的方法, 其特征在于, 所述基于所述虚拟分子图更新所述节点标 量特征Ns和所述节点矢量特征Nv, 得到更新节点标量特征New_Ns和更新节点矢量特征New_ Nv, 包括: 对所述节点标量特征Ns依序进行第一线性操作、 第二激活函数和第二线性操作得到第 一子处理结果Q1, 并且, 对所述 边标量特 征Es进行第三线性操作, 得到第二子处 理结果Q2; 对所述第一子处理结果Q1和所述第二子处理结果Q2进行第一矩阵对应乘法操作, 得到 第三子处 理结果Q3; 基于所述第三子处理结果Q3和所述节点矢量特征Nv进行第二矩阵对应乘法操作, 得到 第四子处理结果Q4, 并且, 基于所述第三子处理结果Q3和 所述边矢量特征Ev进行第三矩阵 对应乘法操作, 得到第五子处 理结果Q5; 对所述第四子处理结果Q4和所述第五子处理结果Q5进行第一矩阵加和操作, 得到第六 子处理结果Q6; 对所述第六子处理结果Q6分别经过第四线性操作和第五线性操作, 得到第七子处理结 果Q7和第八子处 理结果Q8; 对所述第七子处理结果Q7依序 经过第六线性操作、 第 二激活函数、 第七线性操作, 得到 第九子处理结果Q9, 并且, 基于所述第三子处理结果Q3、 所述第七子处理结果Q7和所述第八 子处理结果Q8进行内积 操作Inner, 得到第十 子处理结果Q10; 对所述第九子处理结果Q9和所述第十子处理结果Q10进行第四矩阵对应乘法操作, 得 到第十一子处 理结果Q11; 对所述第八子处理结果Q8和所述第九子处理结果Q9进行第五矩阵对应乘法操作, 得到 所述更新节点矢量特 征NewNv; 对所述第九子处理结果Q9和所述第十一子处理结果Q11进行第二矩阵加和操作, 得到 所述更新节点标量特 征NewNs。 7.根据权利要求5所述的方法, 其特 征在于, 所述目标分子是 溶质分子和/或溶剂分子; 所述方法还 包括: 确定溶质分子的溶质分子特征, 以及与 所述溶质分子相关联的至少一个溶剂分子的溶 剂分子特征, 以便基于所述溶质分子的溶质分子特征以及与所述溶质分子相关联的至少一 个溶剂分子的溶剂分子特 征, 确定所述溶剂化自由能。 8.根据权利要求7所述的方法, 其特征在于, 还包括: 在所述确定溶质分子的溶质分子 特征, 以及与所述溶质分子相关联的至少一个溶剂分子的溶剂分子特 征之后, 将所述溶剂分子特征和所述溶质分子特征的矩阵乘积作为所述溶剂分子和所述溶质 分子之间的溶剂化作用矩阵; 基于所述溶剂化作用矩阵确定溶剂化作用特 征。 9.根据权利要求8所述的方法, 其特征在于, 其中, 所述基于所述溶剂化作用矩阵确定 溶剂化作用特 征包括: 基于所述溶剂化作用矩阵计算与 预设溶质权重对应的溶剂特征, 并且基于所述溶剂化 作用矩阵计算与预设溶剂权 重对应的溶质特 征; 将所述溶剂特 征和所述溶质特 征分别转换为 一维的包括F个元 素的行向量; 拼接所述行向量, 得到所述溶剂化作用特 征。权 利 要 求 书 2/5 页 3 CN 114218869 A 3

.PDF文档 专利 数据处理方法、装置、模型训练方法和预测自由能方法

文档预览
中文文档 36 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、装置、模型训练方法和预测自由能方法 第 1 页 专利 数据处理方法、装置、模型训练方法和预测自由能方法 第 2 页 专利 数据处理方法、装置、模型训练方法和预测自由能方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 05:20:38上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。