专利名称:一种基于风机功率曲线的风电场功率数据清洗方法
专利类型:发明专利
专利申请号:CN202111225106.8
专利申请(专利权)人:明阳智慧能源集团股份公司
权利人地址:广东省中山市火炬开发区火炬路22号
专利发明(设计)人:史仍辉,李义强,张洪鑫,周彦彤
专利摘要:本发明公开了一种基于风机功率曲线的风电场功率数据清洗方法,包括:1)根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段;2)根据风机技术资料中的“风速‑功率”曲线数据拟合在三个风速区间内风电场整场的“风速‑功率”曲线Pwfr(v);3)对风电场在三个风速区间内原始的整场风速‑功率数据集W,使用Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速‑功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速‑功率”拟合曲线Po(v);4)对数据集W,使用Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。本发明方法简单可靠、高效且通用性强。
主权利要求:
1.一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,包括以下步骤:步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段:其中,Vi、Vr、Vo和v为风速值,单位m/s;
步骤2:根据风机技术资料中的“风速‑功率”曲线数据拟合在三个风速区间内风电场整场的“风速‑功率”曲线Pwfr(v);
步骤3:对风电场在三个风速区间内原始的整场风速‑功率数据集W,其中风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和;使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速‑功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速‑功率”拟合曲线Po(v);
数据集W表示如下:
W={(v1,p1),…,(vi,pi),…,(vn,pn)}其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速‑功率数据点的总数;
步骤3.1:风电场在风速区间2内原始的整场风速‑功率子数据集W2表示如下:W2={(v1,p1),…,(vj,pj),…,(vm,pm)}其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速‑功率数据点的总个数;
对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速‑功率偏差大于阈值的数据,得到清洗后的数据Wdc2,子数据集W2内的风速‑功率数据点(vj,pj)剔除规则如下:其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整;
步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速‑功率”曲线Pr(v);
步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速‑功率特性,在三个风速区间分段拟合形成“风速‑功率”曲线Po(v):其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值;v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率;
步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。
2.根据权利要求1所述的一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,所述步骤2的具体过程如下:步骤2.1:根据风机技术资料中切入风速Vi和额定风速Vr区间内“风速‑功率”数据,使用多项式拟合的方法拟合风速区间2内风机单机的“风速‑功率”拟合曲线Pwtr(v);
步骤2.2:再根据风电场内风机数量Nwt分段得到三个风速区间内风电场整场的“风速‑功率”拟合曲线Pwfr(v)如下:其中,Pwtr(Vr)为风机单机在额定风速Vr时拟合曲线Pwtr(v)的拟合功率值。
3.根据权利要求1所述的一种基于风机功率曲线的风电场功率数据清洗方法,其特征在于,在步骤4中,数据集W内的风速‑功率数据点(vi,pi)数据清洗剔除异常数据的规则如下:其中,Po(vi‑1)为风速(vi‑1)时的拟合功率;Pwmax为数据集W中功率最大值;c为数据清洗判断阈值。 说明书 : 一种基于风机功率曲线的风电场功率数据清洗方法技术领域[0001] 本发明涉及风力发电大数据的技术领域,尤其是指一种基于风机功率曲线的风电场功率数据清洗方法。背景技术[0002] 新能源的发展已经成为推动全球能源转型的重要力量,是全球绿色低碳转型的重要方向。由于风能的随机波动性、间歇性、不可控性等,其大规模并入电网,其发电量和输出功率随机性较大,接入电网后对电网的安全和管理可能带来一系列的问题,将给电力系统的生产和运行带来极大的挑战。因此需要对风力发电场的输出功率进行科学预测,以便合理安排运行方式和应对措施,充分利用风能资源,降低风力接入对电网的不利影响,提高电网运行的安全性和稳定性,提高电网接纳风电的能力,减少电力系统的运行成本,提升经济效益和社会效益。[0003] 准确获得风电场实际运行的风速和功率数据,能够为风电场的输出功率预测、经济安全运行和优化控制策略提供根本的数据支撑。但是在风电场运行过程中,由于机组停机、减载、设备故障和限功率运行等因素,会产生大量异常数据。如果这些数据不经处理直接使用,得到的风力发电统计特性会发生畸变,会影响风电场的输出功率预测和运行特性分析结果等。为了提高数据质量,数据清洗已成为数据挖掘过程中不可或缺的环节。目前,应用较广泛的聚类、统计模型等数据挖掘方法,其清洗过程较为繁琐,清洗条件苛刻。考虑到风电场实际功率曲线复杂多变的特点,传统的数据清洗方法普遍缺乏通用性,且当只存在风速和功率两个数据维度或者缺少历史训练数据时,大部分数据清洗方法失效。发明内容[0004] 本发明的目的在于克服现有技术的缺点与不足,提出了一种基于风机功率曲线的风电场功率数据清洗方法,该方法简单可靠、高效且通用性强。[0005] 为实现上述目的,本发明所提供的技术方案为:一种基于风机功率曲线的风电场功率数据清洗方法,包括以下步骤:[0006] 步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo,将风速区间分为三段:[0007][0008] 其中,Vi、Vr、Vo和v为风速值,单位m/s;[0009] 步骤2:根据风机技术资料中的“风速‑功率”曲线数据拟合在三个风速区间内风电场整场的“风速‑功率”曲线Pwfr(v);[0010] 步骤3:对风电场在三个风速区间内原始的整场风速‑功率数据集W,其中风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和;使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速‑功率偏差大于阈值的数据后,对三个风速区间分段拟合风电场整场的“风速‑功率”拟合曲线Po(v);[0011] 数据集W表示如下:[0012] W={(v1,p1),…,(vi,pi),…,(vn,pn)}[0013] 其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速‑功率数据点的总数;[0014] 步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。[0015] 进一步,所述步骤2的具体过程如下:[0016] 步骤2.1:根据风机技术资料中切入风速Vi和额定风速Vr区间内“风速‑功率”数据,使用多项式拟合的方法拟合风速区间2内风机单机的“风速‑功率”拟合曲线Pwtr(v);[0017] 步骤2.2:再根据风电场内风机数量Nwt分段得到三个风速区间内风电场整场的“风速‑功率”拟合曲线Pwfr(v)如下:[0018][0019] 其中,Pwtr(Vr)为风机单机在额定风速Vr时拟合曲线Pwtr(v)的拟合功率值。[0020] 进一步,所述步骤3的具体过程如下:[0021] 步骤3.1:风电场在风速区间2内原始的整场风速‑功率子数据集W2表示如下:[0022] W2={(v1,p1),…,(vj,pj),…,(vm,pm)}[0023] 其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速‑功率数据点的总个数;[0024] 对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速‑功率偏差大于阈值的数据,得到清洗后的数据Wdc2,子数据集W2内的风速‑功率数据点(vj,pj)剔除规则如下:[0025][0026] 其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整;[0027] 步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速‑功率”曲线Pr(v);[0028] 步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速‑功率特性,在三个风速区间分段拟合形成“风速‑功率”曲线Po(v):[0029][0030] 其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值;v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率。[0031] 进一步,在步骤4中,数据集W内的风速‑功率数据点(vi,pi)数据清洗剔除异常数据的规则如下:[0032][0033] 其中,Po(vi‑1)为风速(vi‑1)时的拟合功率;Pwmax为数据集W中功率最大值;c为数据清洗判断阈值。[0034] 本发明与现有技术相比,具有如下优点与有益效果:[0035] 本发明方法数据清洗过程简单、清洗条件宽松,仅使用风机功率曲线即可完成风电场功率数据清洗,效率极高,且清洗效果佳,具有实际应用价值,值得推广。附图说明[0036] 图1为某风电场2020年全年风速‑功率数据散点图。[0037] 图2为本发明方法的流程框图。[0038] 图3为某风电场风机的“风速‑功率”曲线图。[0039] 图4为某风电场整场的“风速‑功率”拟合曲线图。[0040] 图5为某风电场风速区间2内数据集清洗后数据点及拟合曲线图。[0041] 图6为某风电场风速区间2内未清洗原始数据点及拟合曲线图。[0042] 图7为某风电场风速区间分段拟合的“风速‑功率”曲线图。[0043] 图8为使用本发明方法进行数据清洗后的效果图。具体实施方式[0044] 下面以对某风电场功率数据进行数据清洗为实施例,详细说明本发明的方法。[0045] 某风电场装机容量为49.5MW,安装2MW风机24台、1.5MW风机1台,共25台;其中,2MW风机切入风速为3m/s、额定风速为11m/s、切出风速为25m/s,1.5MW风机切入风速为3m/s、额定风速为11.3m/s、切出风速为25m/s;2MW和1.5MW风机技术参数基本一致,将1台1.5MW风机等效为0.75台2MW风机,则该风电场等效为安装24.75台2MW风机。[0046] 该风电场2020年全年风速‑功率数据散点如图1所示,可以看出,在曲线下面有堆积和分散的异常数据。[0047] 如图2所示,本实施例所提供的基于风机功率曲线的风电场功率数据清洗方法,包括如下步骤:[0048] 步骤1:根据风机切入风速Vi、额定风速Vr和切出风速Vo将风速区间分为三段:[0049][0050] 其中,Vi、Vr、Vo和v为风速值,单位m/s。[0051] 本实施例中某风电场风机的切入风速为3m/s、额定风速为11m/s、切出风速为25m/s,其风速区间划分如下:[0052][0053] 步骤2:根据风机技术资料中的“风速‑功率”曲线数据拟合在三个风速区间内风电场整场的“风速‑功率”曲线Pwfr(v)。具体如下:[0054] 步骤2.1:根据风机技术资料中切入风速Vi和额定风速Vr区间内“风速‑功率”数据,使用多项式拟合的方法拟合风速区间2内风机单机的“风速‑功率”拟合曲线Pwtr(v);[0055] 步骤2.2:再根据风电场内风机数量Nwt分段得到三个风速区间内风电场整场的“风速‑功率”拟合曲线Pwfr(v)如下:[0056][0057] 其中,Pwtr(Vr)为风机单机在额定风速Vr时拟合曲线Pwtr(v)的拟合功率值。[0058] 本实施例中某风电场单个风机的“风速‑功率”曲线如图3所示。根据图3曲线数据拟合得到的三个风速区间内风电场整场的“风速‑功率”拟合曲线Pwfr(v)如图4所示。[0059] 步骤3:对风电场在三个风速区间内原始的整场风速‑功率(风速为风电场所有风机机舱风速的平均值,功率为风电场所有风机输出功率之和)数据集W,使用步骤2中的曲线Pwfr(v)对风速区间2内的子数据集W2进行清洗,剔除风速‑功率偏差过大的数据后,对三个风速区间分段拟合风电场整场的“风速‑功率”拟合曲线Po(v)。[0060] 数据集W表示如下:[0061] W={(v1,p1),…,(vi,pi),…,(vn,pn)}[0062] 其中,vi表示第i个数据点的风速,pi表示第i个数据点的功率,i=1,2,…,n,n为数据集W中风速‑功率数据点的总数。具体步骤如下:[0063] 步骤3.1:风电场在风速区间2内原始的整场风速‑功率子数据集W2表示如下:[0064] W2={(v1,p1),…,(vj,pj),…,(vm,pm)}[0065] 其中,vj表示第j个数据点的风速,pj表示第j个数据点的功率,j=1,2,…,m,m为子数据集W2中风速‑功率数据点的总个数。[0066] 对子数据集W2使用步骤2中的曲线Pwfr(v)进行数据清洗,剔除风速‑功率偏差过大的数据,得到清洗后的数据Wdc2,子数据集W2内的风速‑功率数据点(vj,pj)剔除规则如下:[0067][0068] 其中,Pwfr(vj)为风电场在在风速vj时拟合曲线Pwfr(v)的拟合功率值;c为数据清洗判断阈值,能够根据风电场装机容量动态调整。[0069] 步骤3.2:对步骤3.1清洗后的数据Wdc2,使用多项式拟合的方法拟合风速区间2内风电场整场的“风速‑功率”曲线Pr(v);[0070] 步骤3.3:根据步骤3.2拟合的曲线Pr(v)和风机的风速‑功率特性,在三个风速区间分段拟合形成“风速‑功率”曲线Po(v):[0071][0072] 其中,Vi为切入风速值、Vr为额定风速值、Vo切出风速值、v为某一时刻的风速值,单位m/s;Pwmax为数据集W中功率最大值,Po(v)为风速v时的拟合功率。[0073] 本实施例中某风电场装机容量为49.5MW,数据清洗判断阈值c设置为装机容量的十分之一,即为4.95MW。针对该风电场子数据集W2清洗后数据点及风速区间2内拟合曲线如图5所示。图6为子数据集W2未清洗的原始数据拟合曲线,可以看出,该曲线在高风速(8‑11m/s)时拟合值偏小,拟合曲线受到下方异常数据的影响,该拟合曲线无法用于后续的数据清洗。[0074] 该风电场2020年数据集W中功率最大值Pwmax为48.23MW,步骤3.3分段拟合的“风速‑功率”曲线Po(v)见图7所示。[0075] 步骤4:对步骤3中的数据集W,使用步骤3中的曲线Po(v)进行数据清洗,剔除异常数据,得到清洗后的风电场功率数据Wdc。[0076] W数据集内的风速‑功率数据点(vi,pi)数据清洗剔除异常数据的规则如下:[0077][0078] 实施例根据图7中分段拟合的“风速‑功率”曲线Po(v)及步骤4中异常数据剔除规则清洗后的效果见图8所示,可以看出,依照本发明方法的实施例具有较好的数据清洗效果,值得推广。[0079] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
专利地区:广东
专利申请日期:2021-10-21
专利公开日期:2024-06-18
专利公告号:CN114020729B