说明:最全专利文库
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111560423.5 (22)申请日 2021.12.20 (71)申请人 江苏大学 地址 212013 江苏省镇江市京口区学府路 301号 (72)发明人 张佳楠 薛安荣  (51)Int.Cl. G06F 30/27(2020.01) G06F 16/215(2019.01) G06F 113/06(2020.01) G06F 119/02(2020.01) (54)发明名称 基于LSTM-AE集成共享框架的风电机组异常 数据检测及清洗方法 (57)摘要 本发明公开了基于LSTM ‑AE集成共享框架的 风电机组异常数据检测及清洗方法, 对同一风电 场中多个近邻风电机组的SCADA数据预处理获得 多个拥有相同时间戳的原始时间序列; 构建基于 LSTM‑AE集成共享框架引入近邻机组间数据的相 关性; 通过叠加多机组的重构误差并引入共享隐 藏状态作为惩罚项的损失函数进行多机组联合 训练; 将训练后的集成共享框架中的编码器Ei与 解码器Di对应拆分并构建单个风电机组的LSTM ‑ AE模型, 并进行异常数据检测输出误差序列; 对 误差序列进行多元高斯分布建模, 通过AE网络构 建误差的概率密度与重构值的期望函数; 通过对 比重构值的期望误差概率密度与实际误差的概 率密度进行自适应阈值的异常判定并清洗; 本方 法提高整体风电场中风电机组模型的异常数据 检测精度及清洗准确性。 权利要求书2页 说明书8页 附图2页 CN 114357866 A 2022.04.15 CN 114357866 A 1.基于LSTM ‑AE集成共享框架的风电机组异常数据检测及清洗方法, 其特征在于, 包括 如下步骤: 步骤一、 对同一风电场 中n个近邻风电机组的SCADA数据预处理获得n个拥有相同时间 戳的原始时间序列; 步骤二、 构 建基于LSTM ‑AE集成共享框架, 集成共享框架包括滑动窗口扩增层、 编码层、 隐藏状态共享层和解码层; 所述滑动窗口扩增层的输入为原始 时间序列, 滑动窗口扩增层 对对齐后的数据进行 特征工程处 理得到扩增时序 序列; 编码层中的编码器对扩增时序序列进行学习得到隐藏状态, 并输入至隐藏状态共享 层; 隐藏状态共享层在模型训练过程中优化并调整各个机组隐藏状态的影响比重得到共 享隐藏状态, 输出共享隐藏状态至解码层; 解码层通过输入的共享隐藏状态对扩增时序序列进行重构, 输出对应的扩增时序序 列; 通过叠加风电机组的重构误差以及惩罚项获得集成共享框架损失函数, 将损失函数引 入共享隐藏状态作为 惩罚项进行多机组模型 联合训练; 步骤三、 基于训练好集成共享框架, 将训练后的集成共享框架中的编码器Ei与解码器Di 对应拆分, 由再编码器Ei与解码器Di构建单个风电机组的LSTM ‑AE模型; 并进行异常数据检 测; 步骤四、 设定清洗指标ξ, 通过对比重构值的期望误差概率密度与实际误差的概率密度 进行异常判定并清洗 。 2.根据权利要求1所述的基于LSTM ‑AE集成共享框架的风电机组异常数据检测及清洗 方法, 其特 征在于, 构建隐藏状态共享层的方法为: 在编码层与 解码层中添加隐藏状态共享模块, 为编码层E=(E1, E2...En)中的每个编码 器设计一个线性权重矩阵 共享隐藏状态 是通过叠加每个隐藏状态 与对应线性权 重矩阵 的积组成, 表示如下: 其中, 函数f(·)为线性叠加函数, 将共享隐藏状态 作为解码层D=(D1, D2...Dn)中每 个解码器的输入。 3.根据权利要求2所述的基于LSTM ‑AE集成共享框架的风电机组异常数据检测及清洗 方法, 其特 征在于, 多机组模型 联合训练: 基于每个风电机组的重构误差lossi以及惩罚项获得集成共享框架损失函数, 表示如 下: 其中, lossi表示机组i的重构误差, loss表示集成共享框架损失函数, 为惩罚项, λ是控制 在损失函数中惩罚效果的重要权重; 分别是机组i 中扩增序列与重构 序列中第j个向量。 4.根据权利要求1所述的基于LSTM ‑AE集成共享框架的风电机组异常数据检测及清洗权 利 要 求 书 1/2 页 2 CN 114357866 A 2方法, 其特 征在于, 异常数据检测: 使用机组i经过滑动窗口扩增后的扩增时序序列 作为机组i的LSTM ‑ AE模型的输入, 通过解码器得到模型输出的重构序列 是第i个机 组的重构序列中的第x个重构值; 计算输入的扩增时序序列与重构序列的误差, 得到误差向 量序列 表示如下: ej=|hj‑h″j| E′i=(e1, e2...) 其中, ej为误差向量中第j个向量参数; | ·|为绝对值函数, hj及h″j分别是扩增向量与 重构向量中第j个参数, 为Ei中的第x个误差向量。 5.根据权利要求1所述的基于LSTM ‑AE集成共享框架的风电机组异常数据检测及清洗 方法, 其特 征在于, 自适应阈值清洗过程: 步骤1, 建立多元高斯分布模型: 对误差向量序列Ei标准化处理, 再建立Ei的多元高斯分 布模型Ei~N( μ, ∑), 通过最大似然法给 出多元高斯分布模型参数 μ和∑的估计量; 步骤2, 拟合误差向量 的概率密度与重构值 间的非线性期望函数: 误差向量在多 元高斯分布中的概 率密度 如下: 使用AE网络拟合误差概率密度 与重构值 的非线性期望函数, 即期望误差概率密 度估计器f: 如下: 其中, WP为拟合AE网络的权重系数矩阵, bP为其偏移量, f为期望误差概率密度估计函 数; 步骤3, 设定清洗指标ξ, 通过对比重构值的期望误差概率密度与实际误差的概率密度 进行异常判定并清洗, 如下: 其中, f(·)为期望误差概率密度估计器, η为设定的误差偏移量; 通过设置η, 自适应调 整误差阈值, 若 ξ 为 正, 则表示该误差向量所对应的输入向量 为异常数据, 需要 进行清洗 。 6.根据权利要求1所述的基于LSTM ‑AE集成共享框架的风电机组异常数据检测及清洗 方法, 其特征在于, 将开始时间的最晚时刻至结束时间的最早时刻作为整体风电机组S CADA 数据的时间区间, 根据时间区间, 对各个风电机组的SCADA数据进行过滤并排序, 得到每个 机组对应的相同时间戳的原 始时间序列, 完成对SCADA数据的预处 理。 7.根据权利要求1所述的基于LSTM ‑AE集成共享框架的风电机组异常数据检测及清洗 方法, 其特征在于, 滑动窗口扩增层生成扩增时序序列: 在输入的每个机组的原始时间序列 T=(S1, S2...SC)上使用跨度 2n, 以n为间隔的窗口进行滑动, 并计算每个窗口区间内向量集 合中每个向量参数 的统计特征与衍生特征, 将统计特征与衍生特征作为新的扩增向量, 进 而得到新的短时相关性扩增时序 序列T′=(H1, H2...Hk)。权 利 要 求 书 2/2 页 3 CN 114357866 A 3

.PDF文档 专利 基于LSTM-AE集成共享框架的风电机组异常数据检测及清洗方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于LSTM-AE集成共享框架的风电机组异常数据检测及清洗方法 第 1 页 专利 基于LSTM-AE集成共享框架的风电机组异常数据检测及清洗方法 第 2 页 专利 基于LSTM-AE集成共享框架的风电机组异常数据检测及清洗方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 05:20:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。