可左右滑动选省市

一种面向大型风电机组实时出力性能的评估方法

更新时间:2023-12-15
一种面向大型风电机组实时出力性能的评估方法 专利申请类型:发明专利;
地区:浙江-杭州;
源自:杭州高价值专利检索信息库;

专利名称:一种面向大型风电机组实时出力性能的评估方法

专利类型:发明专利

专利申请号:CN202111313388.7

专利申请(专利权)人:浙江大学,浙江运达风电股份有限公司
权利人地址:浙江省杭州市西湖区余杭塘路866号

专利发明(设计)人:陈棋,傅凌焜,孙勇,王琳,杨秦敏,陈积明,孟文超,刘广仑

专利摘要:本发明公开了一种面向大型风电机组实时出力性能的评估方法。该方法基于风电机组正常运行状态下数据采集与监视控制系统记录数据集,设计利用滑窗技术的离群点检测方法,并设计带有时间信息提取的特征提取模型,选取XGBoost模型拟合风能利用系数与输入特征的等效数学模型,并统计训练集中超限程度,用于在线应用时出力性能的实时评估。在本发明的实时出力性能评估方法中,对每个数据点能够进行多次判断,并统计其离群程度进行离群点检测,从而获取更鲁棒、更灵活的检测结果;在特征提取中考虑变量时间依赖性,解决了机器学习XGBoost模型没有利用时间信息的问题,基于训练集超限程度作为在线实时评估依据,避免了人为主观因素的干扰,保证了评估的准确性。

主权利要求:
1.一种面向大型风电机组实时出力性能的评估方法,其特征在于,该方法包括以下步骤:
1)选取待进行实时出力性能评估的风电机组,获取该风电机组SCADA系统中所记录的正常运行状态下的运行数据,运行参数包括风速v、空气密度ρ、转速ω、桨距角β、偏航角θ和T有功功率P,记为数据集X,X={v,ρ,ω,β,θ,P},并获取风电机组的结构参数,包括风轮半径R和功率转换效率η;
2)计算风能利用系数Cp,计算公式为 并基于风能利用系数‑风速数据
集进行离群点剔除,首先进行风速区间划分,风速区间长度设置为Lv,所划分风速区间个数为 之后设置风速滑窗长度Wv为k倍的风速区间长度,表示为Wv=k·Lv,滑窗自风机切入风速vcut‑in移动至风机切出风速vcut‑out,利用每个滑窗内的风能利用系数数值绘制箱型图,并基于箱型图结果进行离群点检测;
3)每个数据点能够在多个滑窗内进行检测,得到多个是否为离群点的检测结果,检测结果认定是离群点的次数与总检测次数比值作为该数据点的离群程度;
4)统计所有数据点的离群程度,并设置离群程度阈值h,h∈[0,1),离群程度大于h的数据点予以剔除,得到离群点剔除后的数据集X′;
5)设计带有时间信息提取的自编码(AE‑TIE)模型进行特征提取;为输入时间信息,首先利用滑窗技术,设置滑窗长度W,滑窗内的数据表示为 其中T为当前时刻,n为数据集中的变量个数,将X″输入至编码器中,编码器由LSTM单元构成,编码器输出为隐藏向量 m为隐藏向量的维度,之后为进行隐藏向量中的短期时间信息提取,设计一层卷积神经网络CNN层,CNN层中有p个滤波器,每个滤波器的维度设置为从而能够对隐藏向量中不同时刻的时间信息进行提取,得到新的隐藏向量最后将新的隐藏向量h′输入至解码器中,解码器也由LSTM单元构成,得到重构的输入向量 通过最小化重构误差进行模型训练;
6)将AE‑TIE模型中新的隐藏向量h′作为输入特征,离群点剔除后的风能利用系数作为目标变量y,构造训练集[h′,y];
7)选取机器学习模型XGBoost作为变量估计模型拟合风能利用系数与隐藏向量h′之间的等效模型y=f(h′),训练完成后,获取训练集中风能利用系数实际值与模型估计值的残差序列,并设置残差阈值上下限,之后设置评估周期Tperiod,统计训练集中每个周期Tperiod时间内,残差值超过残差阈值上限或低于残差阈值下限的数据点的个数,并统计所有评估周期内超限数据点的最大个数cmax;
8)在线应用进行风电机组实时出力性能评估时,通过SCADA系统中运行数据,首先基于步骤5)设计的AE‑TIE模型提取特征h′,之后通过训练完成的变量估计模型实时获取风能利用系数的模型估计值 求取风能利用系数实时计算值Cp与变量估计模型输出值 之间的残差 每经过预先设置的时间周期Tperiod后,统计残差值超过残差阈值上限或低于残差阈值下限的数据点个数,当该周期内残差值超限的个数大于cmax时,认定风电机组此时的出力性能出现异常。
2.根据权利要求1所述的一种面向大型风电机组实时出力性能的评估方法,其特征在于,所述步骤2)中,基于每个滑窗的风能利用系数数值绘制箱型图时,首先求取上四分位数Q3以及下四分位数Q1,以及四分位距IQR=Q3‑Q1,之后设置箱型图上边缘U=Q3+1.5IQR及下边缘L=Q1‑1.5IQR,处于箱型图上下边缘之外的数据点认定为离群点。
3.根据权利要求1所述的一种面向大型风电机组实时出力性能的评估方法,其特征在于,所述步骤3)中,在区间i∈[k,Nv‑k+1]内的每个数据点进行k次检测,得到k个是否为离群点的检测结果,每个数据点的检测结果中为离群点的次数记为c1,c1∈[0,k],将比值 作为该数据点的离群程度;在区间i∈[1,k‑1]内的每个数据点进行i次检测,区间[Nv,Nv‑k+2]内数据点检测次数与区间[1,k‑1]对应相同,每个数据点的检测结果中为离群点的次数记为c2,c2∈[0,i],将比值 作为该数据点的离群程度。
4.根据权利要求1所述的一种面向大型风电机组实时出力性能的评估方法,其特征在于,所述步骤5)中,编码器部分将输入 通过非线性映射得到隐藏向量h=f(W1X″+b1),其中f(·)为Sigmoid函数, 与 为编码器的权重矩阵和偏置向量,由训练得到;之后隐藏向量 经CNN层得到新的隐藏向量
作为解码器输入,解码器通过非线性映射得到重构向量 表示为
其中g(·)为Sigmoid函数, 和 为解码器的权重矩阵, 为解码器
的偏置向量,由训练得到;重构误差表示为 其中s为训练集样本个数。
5.根据权利要求1所述的一种面向大型风电机组实时出力性能的评估方法,其特征在于,所述步骤7)中,假设训练集残差序列服从t分布,取t分布99%分位数作为残差阈值上限,1%分位数作为残差阈值下限。 说明书 : 一种面向大型风电机组实时出力性能的评估方法技术领域[0001] 本发明涉及一种面向大型风电机组实时出力性能的评估方法,基于风机正常运行状态数据集设计离群点检测方法,设计带有时间信息提取的自编码模型进行特征提取,从而拟合风能利用系数与输入特征之间等效数学模型,实时获取风能利用系数进行风机出力性能评估。背景技术[0002] 随着社会的不断发展,高耗能的企业对于石油、天然气等不可再生能源的消耗日益增加,全世界已经出现了能源紧缺,以及消耗不可再生能源带来的环境污染问题,因此开发清洁的,可再生的能源成为解决能源问题的有效途径。风能作为一种可再生能源,储量丰富,清洁无污染,得到了迅速发展,在全球风力发电迅速发展的背景下,我国是全球风力发电增长速度最快的市场,我国的风机装机总容量已位于世界前列。但近几年风力发电市场的快速发展也导致了研发时期的准备不足,准备不足以及风机运行环境的复杂多变导致了风机故障率高,风机的运行维护费用居高不下。[0003] 风电机组最重要的特性为输出功率特性,即出力性能,对每台机组准确评估其出力性能,能够准确评估机组的当前运行状态,及时发现性能下降并找出性能降低的原因,避免出力性能持续下降,进而引起停机造成更大损失,对提高风电场的运营管理水平和经济效益有至关重要的意义。风电机组的出力性能通常由风能利用系数表征,风能利用系数反映了风电机组对风能的利用效率,是机组性能优劣的重要标志。结合数据挖掘技术,通过拟合风能利用系数与相关变量模型,实时获取风机正常运行状态下风能利用系数基准值,通过计算风能利用系数实际运行值与基准值的残差对风机出力性能实时评估便成为重中之重。发明内容[0004] 本发明目的在于通过拟合风能利用系数与相关特征的等效数学模型,在线实时获取风能利用系数计算值与模型拟合值残差,从而对风电机组出力性能进行实时评估,提出一种面向大型风电机组实时出力性能的评估方法。该方法选取风电机组正常运行状态的数据集,设计基于每个数据点能够保证有多次判断的离群点检测方法,进行更鲁棒的离群点剔除,从而保证了输入数据的有效性,通过设计带有时间信息提取的自编码AutoencoderwithTemporalInformationExtraction(AE‑TIE)模型,在特征提取时加入历史时间信息,解决了机器学习XGBoost模型没有考虑时间依赖性的缺陷,保证了模型的精确性,通过统计训练集中超限程度进行在线应用时的判断基准,避免了孤立异常值引起的错误判断,保证了出力性能评估的准确性,具有理论意义与实用价值。[0005] 本发明的目的通过以下的技术方案实现:一种面向大型风电机组实时出力性能的评估方法,该方法包括以下步骤:[0006] 1)选取待进行实时出力性能评估的风电机组,获取该风电机组数据采集与监视控制(SCADA)系统中所记录的正常运行状态下的运行数据,运行参数包括风速v、空气密度ρ、T转速ω、桨距角β、偏航角θ和有功功率P等,记为数据集X,x={v,ρ,ω,β,θ,P,...},并获取风电机组的结构参数,包括风轮半径R和功率转换效率η;[0007] 2)计算风能利用系数Cp,计算公式为 并基于风能利用系数‑风速数据集进行离群点剔除,首先进行风速区间划分,风速区间长度设置为Lv,所划分风速区间个数为 之后设置风速滑窗长度Wv为k倍的风速区间长度,表示为Wv=k·Lv,滑窗自风机切入风速vcut‑in移动至风机切出风速vcut‑out,利用每个滑窗内的风能利用系数数值绘制箱型图,并基于箱型图结果进行离群点检测;[0008] 3)每个数据点能够在多个滑窗内进行检测,得到多个是否为离群点的检测结果,检测结果认定是离群点的次数与总检测次数比值作为该数据点的离群程度;[0009] 4)统计所有数据点的离群程度,并设置离群程度阈值h,h∈[0,1),离群程度大于h的数据点予以剔除,得到离群点剔除后的数据集X′;[0010] 5)设计带有时间信息提取的自编码AutoencoderwithTemporalInformationExtraction(AE‑TIE)模型进行特征提取;为输入时间信息,首先利用滑窗技术,设置滑窗长度W,滑窗内的数据表示为 其中T为当前时刻,n为数据集中的变量个数,将X″输入至编码器中,编码器由LSTM单元构成,编码器输出为隐藏向量m为隐藏向量的维度,之后为进行隐藏向量中的短期时间信息提取,设计一层卷积神经网络CNN层,CNN层中有p个滤波器,每个滤波器的维度设置为 从而能够对隐藏向量中不同时刻的时间信息进行提取,得到新的隐藏向量 最后将新的隐藏向量h′输入至解码器中,解码器也由LSTM单元构成,得到重构的输入向量 通过最小化重构误差进行模型训练;[0011] 6)将AE‑TIE模型中新的隐藏向量h′作为输入特征,离群点剔除后的风能利用系数作为目标变量y,构造训练集[h′,y];[0012] 7)选取机器学习模型XGBoost作为变量估计模型拟合风能利用系数与隐藏向量h′之间的等效模型y=f(h′),训练完成后,获取训练集中风能利用系数实际值与模型估计值的残差序列,并设置残差阈值上下限,之后设置评估周期Tperiod,统计训练集中每个周期Tperiod时间内,残差值超过残差阈值上限或低于残差阈值下限的数据点的个数,并统计所有评估周期内超限数据点的最大个数cmax;[0013] 8)在线应用进行风电机组实时出力性能评估时,通过SCADA系统中运行数据,首先基于步骤5)设计的AE‑TIE模型提取特征h′,之后通过训练完成的变量估计模型实时获取风能利用系数的模型估计值 求取风能利用系数实时计算值Cp与变量估计模型输出值之间的残差 每经过预先设置的时间周期Tperiod后,统计残差值超过残差阈值上限或低于残差阈值下限的数据点个数,当该周期内残差值超限的个数大于训练集中所有评估周期内超限数据点的最大个数cmax时,认定风电机组此时的出力性能出现异常。[0014] 进一步地,所述步骤2)中,基于每个滑窗的风能利用系数数值绘制箱型图时,首先求取上四分位数Q3以及下四分位数Q1,以及四分位距IQR=Q3‑Q1,之后设置箱型图上边缘U=Q3+1.5IQR及下边缘L=Q1‑1.5IQR,处于箱型图上下边缘之外的数据点认定为离群点。[0015] 进一步地,所述步骤3)中,在区间i∈[k,Nv‑k+1]内的每个数据点进行k次检测,得到k个是否为离群点的检测结果,每个数据点的检测结果中为离群点的次数记为c1,c1∈[0,k],将比值 作为该数据点的离群程度;在区间i∈[1,k‑1]内的每个数据点进行i次检测,区间[Nv,Nv‑k+2]内数据点检测次数与区间[1,k‑1]对应相同,每个数据点的检测结果中为离群点的次数记为c2,c2∈[0,i],将比值 作为该数据点的离群程度。[0016] 进一步地,所述步骤5)中,编码器部分将输入 通过非线性映射得到隐藏向量h=d(W1X″+b1),其中f(·)为Sigmoid函数, 与为编码器的权重矩阵和偏置向量,由训练得到;之后隐藏向量 经CNN层得到新的隐藏向量 作为解码器输入,解码器通过非线性映射得到重构向量 表示为其中g(·)为Sigmoid函数, 和 为解码器的权重矩阵, 为解码器的偏置向量,由训练得到;重构误差表示为 其中s为训练集样本个数。[0017] 进一步地,所述步骤7)中,假设训练集残差序列服从t分布,取t分布99%分位数作为残差阈值上限,1%分位数作为残差阈值下限。[0018] 与现有技术相比,本发明具有以下创新优势及显著效果:[0019] 1)针对风电机组SCADA系统所记录数据,利用滑窗技术设计离群点检测方法,保证每个数据点均能进行多次检测,并基于多次检测结果,求取离群程度进行离群点判断,使离群点检测结果更具有鲁棒性与合理性;[0020] 2)针对机器学习模型XGBoost模型没有考虑变量时间依赖性的缺陷,设计带有时间信息提取的自编码AutoencoderwithTemporalInformationExtraction(AE‑TIE)模型,在所提取特征中加入变量历史时间信息,从而使机器学习的输入中包含变量历史信息,提升了模型估计的准确性;[0021] 3)出力性能实时评估中,评估准则基于训练集中的超限程度,没有人为主观因素干扰,保证了出力性能评估的准确性;[0022] 4)通过拟合风能利用系数与输入特征的等效数学模型,实现风能利用系数的在线软测量,并可扩展到状态监测与故障预警方面的研究中,具有较强的扩展性。附图说明[0023] 图1是本发明的风电机组实时出力性能评估方法流程图;[0024] 图2是本发明实施例中原始数据集风速‑风能利用系数散点图;[0025] 图3是本发明实施例中基于所设计的离群点检测方法进行离群点剔除后的风速‑风能利用系数散点图;[0026] 图4是本发明所设计的带有时间信息提取的自编码AutoencoderwithTemporalInformationExtraction(AE‑TIE)模型示意图;[0027] 图5是本发明实施例中风能利用系数实际计算值;[0028] 图6是本发明实施例中风能利用系数模型估计值。具体实施方式[0029] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。[0030] 在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。[0031] 实施例[0032] 本实施例针对某风电场的某风力发电机组SCADA系统在2016至2017年采集到的数据进行风电机组实时出力性能的评估,其中风力发电机SCADA系统的数据采样间隔为5min,数据信息为期近20个月,时间范围为2016.01.0100:00:00至2017.08.1623:55:00,本发明方法实施步骤具体如下:[0033] 1)选取待进行实时出力性能评估的风电机组,获取该机组的数据采集与监视控制(SCADA)系统中所记录的正常运行状态下的运行数据,运行参数包括风速v、空气密度ρ、转T速ω、桨距角β、偏航角θ和有功功率P等,记为数据集X,x={v,ρ,ω,β,θ,P,...},并获取风电机组的结构参数,包括风轮半径R以及功率转换效率η,在本实施例中功率转换效率η=30.9,风轮半径R=62m,采用标准空气密度ρ=1.225kg/m,共计171072条数据;[0034] 2)计算风能利用系数Cp,计算公式为 并基于风能利用系数‑风速数据集进行离群点剔除,首先进行风速区间划分,风速区间长度设置为Lv,所划分风速区间个数为 之后设置风速滑窗长度Wv为k倍的风速区间长度,表示为Wv=k·Lv,本实施例中取k=4,滑窗自风机切入风速vcut‑in移动至风机切出风速vcut‑out,利用每个滑窗内的风能利用系数数值绘制箱型图,求取上四分位数Q3以及下四分位数Q1,以及四分位距IQR=Q3‑Q1,设置箱型图上边缘U=Q3+1.5IQR及下边缘L=Q1‑1.5IQR,处于箱型图上下边缘之外的数据点认定为本次滑窗内的离群点;[0035] 3)每个数据点能够在多个滑窗内进行检测,在区间i∈[k,Nv‑k+1]内的每个数据点进行k次检测,得到k个是否为离群点的检测结果,每个数据点的检测结果中为离群点的次数记为c1,c1∈[0,k],将比值 作为该数据点的离群程度;在区间i∈[1,k‑1]内的每个数据点进行i次检测,区间[Nv,Nv‑k+2]内数据点检测次数与区间[1,k‑1]对应相同,每个数据点的检测结果中为离群点的次数记为c2,c2∈[0,i],将比值 作为该数据点的离群程度;[0036] 4)统计所有数据点的离群程度,并设置离群程度阈值h,h∈[0,1),离群程度大于h的数据点予以剔除,得到离群点剔除后的数据集X′,在本实施例中离群程度阈值设置为h=0.5,图2为原始数据集的风速‑风能利用系数散点图,图3为离群点剔除后的风速‑风能利用系数散点图;[0037] 5)设计带有时间信息提取的自编码AutoencoderwithTemporalInformationExtraction(AE‑TIE)模型进行特征提取,为输入时间信息,首先利用滑窗技术,设置滑窗长度W,滑窗内的数据表示为 其中T为当前时刻,n为数据集中的变量个数,将X″输入至编码器中,编码器由LSTM单元构成,将输入通过非线性映射得到隐藏向量h=f(W1X″+b1),其中f(·)为Sigmoid函数, 与 为编码器的权重矩阵和偏置向量,由训练得到;之后为进行隐藏向量中的短期时间信息提取,设计一层卷积神经网络CNN层,CNN层中有p个滤波器,每个滤波器的维度设置为 从而能够对隐藏向量中不同时刻的时间信息进行提取,得到新的隐藏向量 最后将新的隐藏向量h′输入至解码器中,解码器也由LSTM单元构成,得到重构的输入向量,表示为 其中g(·)为Sigmoid函数, 和 为解码器的权重矩阵, 为解码器的偏置向量,由训练得到;通过最小化重构误差进行模型训练,重构误差表示为 其中s为训练集样本个数,在本实施例中,选取2016年数据集,共105408条数据作为训练集进行模型训练,其余数据作为测试集,用于在线测试数据,图4为本发明所设计的带有时间信息提取的自编码AE‑TIE模型示意图;[0038] 6)将AE‑TIE模型中新的隐藏向量h′作为输入特征,离群点剔除后的风能利用系数作为目标变量y,构造训练数据集[h′,y];[0039] 7)选取机器学习模型XGBoost作为变量估计模型拟合风能利用系数与隐藏向量h′之间的等效模型y=f(h′),训练完成后,获取训练集中风能利用系数实际值与模型估计值的残差序列,并设置残差阈值上下限,假设训练集残差序列服从t分布,取t分布99%分位数作为残差阈值上限,1%分位数作为残差阈值下限,之后设置评估周期Tperiod,统计训练集中每个周期Tperiod时间内,残差值超过残差阈值上限或低于残差阈值下限的数据点的个数,并统计所有评估周期内超限数据点的最大个数cmax;在本实施例中评估周期为一天,图5为本发明实施例中训练集加测试集的风能利用系数实际计算值,图6为本发明实施例中训练集加测试集的风能利用系数模型估计值,训练集中的cmax=31;[0040] 8)在线应用进行风电机组实时出力性能评估时,通过SCADA系统中运行数据,首先基于本发明设计的AE‑TIE模型提取特征h′,之后通过训练完成的变量估计模型实时获取风能利用系数的模型估计值 求取风能利用系数实时计算值Cp与变量估计模型输出值 之间的残差 每经过预先设置的时间周期Tperiod后,统计残差值超过阈值上限或下限的数据点个数,当该周期内残差值超限的个数大于训练集中所有评估周期内超限数据点的最大个数cmax时,认定风电机组此时的出力性能出现异常,在测试集中超限数据点的最大个数为22,因此认为本机组出力性能正常。[0041] 本发明风电机组实时出力性能评估方法,主要包括风能利用系数离群点检测,带有时间信息提取的特征提取模型设计,选取机器学习模型XGBoost离线训练得到风能利用系数与输入特征的等效数学模型,训练集超限程度统计,以及在线应用进行出力性能实时评估等环节。图1为本发明的风电机组实时出力性能评估方法具体流程,图2为本发明实施例中原始数据集风速‑风能利用系数散点图,图3为本发明实施例中基于所设计的离群点检测方法进行离群点剔除后的风速‑风能利用系数散点图,图4为本发明所设计的带有时间信息提取的自编码AutoencoderwithTemporalInformationExtraction(AE‑TIE)模型示意图,图5为本发明实施例中风能利用系数实际计算值,图6为本发明实施例中风能利用系数模型估计值,该结果显示,本发明能够对风机出力性能进行实时评估,而且由于在特征提取中加入时间,从而保证了实时评估的准确性。[0042] 以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

专利地区:浙江

专利申请日期:2021-11-08

专利公开日期:2024-06-18

专利公告号:CN114021992B

电话咨询
读内容
搜本页
回顶部