专利名称:电网母线典型负荷曲线识别方法
专利类型:发明专利
专利申请号:CN202111055709.8
专利申请(专利权)人:中国南方电网有限责任公司,北京清软创新科技股份有限公司
权利人地址:广东省广州市萝岗区科学城科翔路11号
专利发明(设计)人:王巍,李豹,马骞,王子强,卢伟辉,张蔷,刘梅,李海坤
专利摘要:本发明提供一种电网母线典型负荷曲线识别方法。该方法包括:获取电网中各条母线分别对应的负荷曲线集;针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集。本发明能够提高电网工作的可靠性。
主权利要求:
1.一种电网母线典型负荷曲线识别方法,其特征在于,包括:获取电网中各条母线分别对应的负荷曲线集;
针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;
将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;
利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集;
所述第一聚类算法为改进的DBSCAN聚类算法;所述利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线,包括:设定搜索半径ε为: 其中,T为该母线的日采样点的个数,Pmax为该母线的日最大负荷;
核心点划分步骤:针对该母线的负荷曲线集中的每条负荷曲线,获取在该负荷曲线的搜索半径ε范围内覆盖的该母线对应的负荷曲线集中其它负荷曲线的数量,若该数量大于预设数量,则将该负荷曲线划分为核心点;
在所述核心点的数量为零时,将所述搜索半径ε以预设步长Δε增长,得到增长后的搜索半径,并将所述增长后的搜索半径作为新的搜索半径,跳转到所述核心点划分步骤循环执行,直至所述核心点的数量大于零;
在所述核心点数量大于零时,将该母线的所有核心点取平均,得到该母线对应的标准负荷曲线;
所述利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,包括:利用第二聚类算法,对电网标准负荷曲线集进行聚类分类,得到第一数量类别的电网标准负荷曲线分类集;
针对每一个类别,利用第三聚类算法对该类别对应的电网标准负荷曲线分类集进行聚类剔除;
所述第二聚类算法为K‑Means聚类算法;所述第三聚类算法为GKLOF算法。
2.根据权利要求1所述的电网母线典型负荷曲线识别方法,其特征在于,所述利用第二聚类算法,对电网标准负荷曲线集进行聚类分类,得到第一数量类别的电网标准负荷曲线分类集,包括:利用肘部法则,从电网标准负荷曲线集中选取第一数量的标准负荷曲线作为中心向量;
迭代计算步骤:针对每一条标准负荷曲线,分别计算该标准负荷曲线与第一数量的中心向量的距离,根据计算结果,将该标准负荷曲线和距离该标准负荷曲线最近的中心向量归为一个类簇;
重新计算每一个类簇的中心向量位置,根据重新计算得到的每一个类簇的中心向量位置,跳转到所述迭代计算步骤循环执行,直至标准负荷曲线的归类变化量小于预设变化量,得到第一数量类别的电网标准负荷曲线分类集。
3.根据权利要求1所述的电网母线典型负荷曲线识别方法,其特征在于,所述利用第三聚类算法对该类别对应的电网标准负荷曲线分类集进行聚类剔除,包括:针对该类别对应的电网标准负荷曲线分类集中的每一条标准负荷曲线,计算该标准负荷曲线的高斯核局部离群因子,并根据该标准负荷曲线的高斯核局部离群因子判断该标准负荷曲线是否异常;
剔除该类别对应的电网标准负荷曲线分类集中的所有判定结果为异常的标准负荷曲线,得到该类别对应的典型负荷曲线集。
4.根据权利要求3所述的电网母线典型负荷曲线识别方法,其特征在于,所述根据该标准负荷曲线的高斯核局部离群因子判断该标准负荷曲线是否异常,包括:在该标准负荷曲线的高斯核局部离群因子大于预设阈值时,判定该标准负荷曲线异常;
在该标准负荷曲线的高斯核局部离群因子不大于预设阈值时,判定该标准负荷曲线正常。
5.一种电网母线典型负荷曲线识别装置,其特征在于,包括:获取模块,用于获取电网中各条母线分别对应的负荷曲线集;
第一聚类模块,用于针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;
集合模块,用于将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;
第二聚类模块,用于利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集;
所述第一聚类算法为改进的DBSCAN聚类算法;第一聚类模块,包括:设定单元,用于设定搜索半径ε为: 其中,T为该母线的日采样点的个数,Pmax为该母线的日最大负荷;
划分单元,用于执行核心点划分步骤,所述核心点划分步骤为:针对该母线的负荷曲线集中的每条负荷曲线,获取在该负荷曲线的搜索半径ε范围内覆盖的该母线对应的负荷曲线集中其它负荷曲线的数量,若该数量大于预设数量,则将该负荷曲线划分为核心点;
搜索单元,用于在所述核心点的数量为零时,将所述搜索半径ε以预设步长Δε增长,得到增长后的搜索半径,并将所述增长后的搜索半径作为新的搜索半径,跳转到所述核心点划分步骤循环执行,直至所述核心点的数量大于零;
计算单元,用于在所述核心点数量大于零时,将该母线的所有核心点取平均,得到该母线对应的标准负荷曲线;
第二聚类模块包括:
第一聚类单元,用于利用第二聚类算法,对电网标准负荷曲线集进行聚类分类,得到第一数量类别的电网标准负荷曲线分类集;
第二聚类单元,用于针对每一个类别,利用第三聚类算法对该类别对应的电网标准负荷曲线分类集进行聚类剔除;
所述第二聚类算法为K‑Means聚类算法;所述第三聚类算法为GKLOF算法。
6.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至4中任一项所述电网母线典型负荷曲线识别方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至4中任一项所述电网母线典型负荷曲线识别方法的步骤。 说明书 : 电网母线典型负荷曲线识别方法技术领域[0001] 本发明涉及电网识别技术领域,尤其涉及一种电网母线典型负荷曲线识别方法。背景技术[0002] 电网从输电网或地区发电厂接受电能,通过配电设施就地分配或按电压逐级分配给各类用户,在电力网中起重要分配电能的作用。电网可以包括多条母线,每条母线向多个用户供电,每个用户可以相当于一个负荷。剔除由于用户自身的用电习惯、采集过程中受到的干扰等一些原因造成的“异常数据”,提取出电网母线对应的典型负荷曲线,对于母线负荷预测具有重要的意义。[0003] 目前,电网母线对应的典型负荷曲线提取的思路通常如下:基于原始的负荷曲线数据,利用模糊C均值聚类算法,通过提取较为集中簇的曲线特征,获取电网母线对应的典型负荷曲线。[0004] 然而,部分母线负荷受其用户自身用电习惯的影响,在一定时期内呈现较为相似的形状,而在某些时间内则呈现与平时较大差异的形状,“异常时段内的真实用电数据”通常会对母线负荷预测精度产生较大的影响,该类数据通常会被认为“异常数据”不予纳入数据样本。因此,现有技术提取的典型负荷曲线可能不具备代表性,进而影响负荷预测的准确性,以致电网工作的可靠性降低。发明内容[0005] 本发明实施例提供了一种电网母线典型负荷曲线识别方法,以解决现有技术提取的典型负荷曲线可能不具备代表性,进而影响负荷预测的准确性,以致电网工作的可靠性降低的问题。[0006] 第一方面,本发明实施例提供了一种电网母线典型负荷曲线识别方法,包括:[0007] 获取电网中各条母线分别对应的负荷曲线集;[0008] 针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;[0009] 将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;[0010] 利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集。[0011] 在一种可能的实现方式中,第一聚类算法为改进的DBSCAN(Density‑BasedSpatialClusteringofApplicationswithNoise)聚类算法;利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线,包括:[0012] 设定搜索半径ε为: 其中,T为该母线的日采样点的个数,Pmax为该母线的日最大负荷;[0013] 核心点划分步骤:针对该母线的负荷曲线集中的每条负荷曲线,获取在该负荷曲线的搜索半径ε范围内覆盖的该母线对应的负荷曲线集中其它负荷曲线的数量,若该数量大于预设数量,则将该负荷曲线划分为核心点;[0014] 在核心点的数量为零时,将搜索半径ε以预设步长Δε增长,得到增长后的搜索半径,并将增长后的搜索半径作为新的搜索半径,跳转到核心点划分步骤循环执行,直至核心点的数量大于零;[0015] 在核心点数量大于零时,将该母线的所有核心点取平均,得到该母线对应的标准负荷曲线。[0016] 在一种可能的实现方式中,利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,包括:[0017] 利用第二聚类算法,对电网标准负荷曲线集进行聚类分类,得到第一数量类别的电网标准负荷曲线分类集;[0018] 针对每一个类别,利用第三聚类算法对该类别对应的电网标准负荷曲线分类集进行聚类剔除。[0019] 在一种可能的实现方式中,第二聚类算法为K‑Means聚类算法;利用第二聚类算法,对电网标准负荷曲线集进行聚类分类,得到第一数量类别的电网标准负荷曲线分类集,包括:[0020] 利用肘部法则,从电网标准负荷曲线集中选取第一数量的标准负荷曲线作为中心向量;[0021] 迭代计算步骤:针对每一条标准负荷曲线,分别计算该标准负荷曲线与第一数量的中心向量的距离,根据计算结果,将该标准负荷曲线和距离该标准负荷曲线最近的中心向量归为一个类簇;[0022] 重新计算每一个类簇的中心向量位置,根据重新计算得到的每一个类簇的中心向量位置,跳转到迭代计算步骤循环执行,直至标准负荷曲线的归类变化量小于预设变化量,得到第一数量类别的电网标准负荷曲线分类集。[0023] 在一种可能的实现方式中,第三聚类算法为高斯核密度局部离群因子(Gaussiankerneldensitybasedlocaloutlierfactor,GKLOF)算法;利用第三聚类算法对该类别对应的电网标准负荷曲线分类集进行聚类剔除,包括:[0024] 针对该类别对应的电网标准负荷曲线分类集中的每一条标准负荷曲线,计算该标准负荷曲线的高斯核局部离群因子,并根据该标准负荷曲线的高斯核局部离群因子判断该标准负荷曲线是否异常;[0025] 剔除该类别对应的电网标准负荷曲线分类集中的所有判定结果为异常的标准负荷曲线,得到该类别对应的典型负荷曲线集。[0026] 在一种可能的实现方式中,根据该标准负荷曲线的高斯核局部离群因子判断该标准负荷曲线是否异常,包括:[0027] 在该标准负荷曲线的高斯核局部离群因子大于预设阈值时,判定该标准负荷曲线异常;[0028] 在该标准负荷曲线的高斯核局部离群因子不大于预设阈值时,判定该标准负荷曲线正常。[0029] 第二方面,本发明实施例提供了一种电网母线典型负荷曲线识别装置,包括:[0030] 获取模块,用于获取电网中各条母线分别对应的负荷曲线集;[0031] 第一聚类模块,用于针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;[0032] 集合模块,用于将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;[0033] 第二聚类模块,用于利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集。[0034] 在一种可能的实现方式中,第一聚类算法为改进的DBSCAN聚类算法;第一聚类模块,包括:[0035] 设定单元,用于设定搜索半径ε为: 其中,T为该母线的日采样点的个数,Pmax为该母线的日最大负荷;[0036] 划分单元,用于执行核心点划分步骤,核心点划分步骤为:针对该母线的负荷曲线集中的每条负荷曲线,获取在该负荷曲线的搜索半径ε范围内覆盖的该母线对应的负荷曲线集中其它负荷曲线的数量,若该数量大于预设数量,则将该负荷曲线划分为核心点;[0037] 搜索单元,用于在核心点的数量为零时,将搜索半径ε以预设步长Δε增长,得到增长后的搜索半径,并将增长后的搜索半径作为新的搜索半径,跳转到核心点划分步骤循环执行,直至核心点的数量大于零;[0038] 计算单元,用于在核心点数量大于零时,将该母线的所有核心点取平均,得到该母线对应的标准负荷曲线。[0039] 第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式电网母线典型负荷曲线识别方法的步骤。[0040] 第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式电网母线典型负荷曲线识别方法的步骤。[0041] 本发明实施例提供一种电网母线典型负荷曲线识别方法,通过获取电网中各条母线分别对应的负荷曲线集;针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集。得到的电网母线典型负荷曲线集可以较为准确的反映电网的工作特征,利用得到的电网典型曲线集进行负荷预测,得到的结果更加准确,根据负荷预测结果对电网进行调控,可以提高利用电网电力资源的效率,还可以提高电网工作的可靠性。附图说明[0042] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。[0043] 图1是本发明实施例提供的电网母线典型负荷曲线识别方法的实现流程图;[0044] 图2是本发明实施例提供的改进的DBSCAN聚类算法的流程图;[0045] 图3是本发明实施例提供的利用肘部法则计算得到的SSE‑k值关系图;[0046] 图4是本发明实施例提供的某一母线负荷曲线分布图;[0047] 图5是本发明实施例提供的对图4所示母线的提取结果;[0048] 图6是本发明实施例提供的广东电网1062条母线的标准负荷曲线分布图;[0049] 图7是本发明实施例提供的采用K‑Means聚类算法得到的第八类母线的分类结果;[0050] 图8是本发明实施例提供的采用GKLOF聚类算法对第八类母线进行异常识别的结果;[0051] 图9是本发明实施例提供的求得的第八类别对应的电网母线典型负荷曲线;[0052] 图10是本发明实施例提供的电网母线典型负荷曲线识别装置的结构示意图;[0053] 图11是本发明实施例提供的终端的示意图。具体实施方式[0054] 以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。[0055] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。[0056] 参见图1,其示出了本发明实施例提供的电网母线典型负荷曲线识别方法的实现流程图。如图1所示,一种电网母线典型负荷曲线识别方法,可以包括:[0057] S101,获取电网中各条母线分别对应的负荷曲线集。[0058] 可选的,电网中可以包括至少一条母线,每条母线至少向一个用户供电,每个用户的用电情况可以表示为一条负荷曲线。一条母线对应的负荷曲线集即为该母线上所有用户的负荷曲线形成的集合。[0059] S102,针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;[0060] 可选的,标准负荷曲线可以反映该母线的用电特征。利用第一聚类算法,可以求取反映该母线用电特征的标准负荷曲线,一条标准负荷曲线对应一条母线。[0061] 具体的,通过第一聚类算法,可以将该母线对应的负荷曲线集中的负荷曲线分为正常负荷曲线和异常负荷曲线,剔除异常负荷曲线,标准负荷曲线可以为所有正常负荷曲线求取平均得到。[0062] S103,将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;[0063] 可选的,每一条母线都对应一条标准负荷曲线,将所有母线的标准负荷曲线形成集合,即为电网标准负荷曲线集。[0064] S104,利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集。[0065] 可选的,利用第二聚类算法和地三聚类算法,可以将电网标准负荷曲线集进行分类,同时可以对各类别对应的电网标准负荷曲线集进行甄别,将各类别对应的电网标准负荷曲线集中的标准负荷曲线分为正常标准负荷曲线和异常标准负荷曲线,剔除其中所有异常的标准负荷曲线,根据剩下的所有的正常标准负荷曲线求取电网母线典型负荷曲线集。电网母线典型负荷曲线集中包括多条电网母线典型负荷曲线,电网母线典型负荷曲线可以反映电网的用电特征。[0066] 可选的,在本发明的一个实施例中,在确认电网母线典型负荷曲线集之后,该方法还包括:[0067] 根据电网母线典型负荷曲线集对该电网进行负荷预测,并根据负荷预测结果对电网接的电力资源分配进行指导。[0068] 本发明实施例通过获取电网中各条母线分别对应的负荷曲线集;针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集。得到的电网母线典型负荷曲线集可以较为准确的反映电网的工作特征,利用得到的电网典型曲线集进行负荷预测,得到的结果更加准确,根据负荷预测结果对电网进行调控,可以提高利用电网电力资源的效率,还可以提高电网工作的可靠性。[0069] 在本发明的一些实施例中,第一聚类算法为改进的DBSCAN聚类算法;上述S102中的“利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线”,可以包括:[0070] 设定搜索半径ε为: 其中,T为该母线的日采样点的个数,Pmax为该母线的日最大负荷;[0071] 核心点划分步骤:针对该母线的负荷曲线集中的每条负荷曲线,获取在该负荷曲线的搜索半径ε范围内覆盖的该母线对应的负荷曲线集中其它负荷曲线的数量,若该数量大于预设数量,则将该负荷曲线划分为核心点;[0072] 在核心点的数量为零时,将搜索半径ε以预设步长Δε增长,得到增长后的搜索半径,并将增长后的搜索半径作为新的搜索半径,跳转到核心点划分步骤循环执行,直至核心点的数量大于零;[0073] 在核心点数量大于零时,将该母线的所有核心点取平均,得到该母线对应的标准负荷曲线。[0074] 可选的,在某一实施例中,设定预设数量Nminpts可以为:NMinpts=Ndays/5,其中,Ndays为预设的工作日的数量;其中,Ndays可以为周一至周五的工作日,不包括节假日和周末,具体可以根据实际情况进行预设。[0075] 可选的,对于常规的DBSCAN聚类算法而言,参数的选择与设定最为关键,根据其算法原理可知,算法的聚类结果与搜索半径ε与最小对象数目Nminpts两个参数的选择高度相关。参数设置得合理与否,直接决定了异常负荷曲线能否被识别以及标准负荷曲线提取的效果。该算法参数通常采用经验公式计算获得。本发明实施例提出一种改进的DBSCAN聚类算法,可以提高异常负荷曲线识别的准确性。[0076] 参见图2,其示出了本发明实施例提供的改进的DBSCAN聚类算法的流程图。如图2所示,ε为搜索半径,εinitial为初试参数,Δε为预设步长,Nminpts为预设数量(也即最小对象数目)。运算过程中,ε初试参数设为εinitial,每次迭代过程搜索半径ε以预设步长Δε增加,直至改进的DBSCAN聚类算法的结果中核心点数目大于零结束。[0077] 改进的DBSCAN聚类算法的基本原理可以描述为:[0078] 将搜索空间中每个对象在搜索半径ε范围内覆盖的其他对象的数量与预先设置的Nminpts进行比较,将数量大于Nminpts的对象划分为核心点,将数量等于Nminpts的对象划分为边界点,数量小于Nminpts的对象归为噪声点。[0079] 由于母线负荷的多样性,母线的标准负荷曲线的形态与分布不尽相同,设置统一固定的DBSCAN参数对所有母线进行标准负荷曲线的提取,不能得到最好的识别效果。针对该问题,本文对原有算法进行改进,引入预设步长概念,改进的DBSCAN聚类算法可针对不同数据集的分布特点,动态的调整参数的选择,从而提高对不同数据的适应能力。[0080] 针对每一条母线,聚类得到的噪声点即为该母线对应的负荷曲线集中的异常负荷曲线,剔除这些异常负荷曲线后,对剩余负荷曲线取平均即为该母线对应的标准负荷曲线。[0081] 具体的,假设共有Ndays个预设的工作日的负荷中异常用电曲线一般不超过Ndays/5条,为了保证异常负荷曲线不分为一类,取:Nminpts=Ndays/5。对同一电力用户而言,考虑正常工作情况下不同天同一时段下负荷波动不超过该用户最大负荷的±10%,因此搜索半径取为:[0082] 对于某一母线来说,通过改进的DBSCAN聚类算法,该母线对应的负荷曲线集中的一部分负荷曲线被标记为核心点,标准负荷曲线可以通过对所有核心点求取平均获得,此外,改进的DBSCAN聚类算法运行完成后,经迭代得到的最终搜索半径ε可以用以刻画该母线对应的负荷曲线集的规律程度,ε数值越大,表明该母线对应的负荷曲线集中的负荷曲线的规律性较差;反之,ε数值越小,反映该母线对应的负荷曲线集中的负荷曲线在一段时期内更加规律。[0083] 在本发明的一些实施例中,上述S104中的“利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除”,可以包括:[0084] 利用第二聚类算法,对电网标准负荷曲线集进行聚类分类,得到第一数量类别的电网标准负荷曲线分类集;[0085] 针对每一个类别,利用第三聚类算法对该类别对应的电网标准负荷曲线分类集进行聚类剔除。[0086] 可选的,电网标准负荷曲线集包括电网中各个母线的标准负荷曲线,利用第二聚类算法可以将各个母线的标准负荷曲线进行分类,将表现较为相似的分为一类,具体可以分成第一数量类别,每一类别可以包括至少一条标准负荷曲线。第一数量类别也可以作为电网的第一数量的用电特征,实际使用时可以将得到的母线的标准负荷曲线归类到其中的类别中,具体进行负荷预测时可以根据类别进行预测。[0087] 可选的,每一个类别对应的电网标准负荷曲线分类集中的母线的标准负荷曲线包括正常的标准负荷曲线还包括异常的标准负荷曲线,异常的标准负荷曲线即与该类别的其余标准负荷曲线相差较大,可以利用第三聚类算法将异常的标准负荷曲线剔除,剩下的各个类别的正常标准负荷曲线可以组成电网的典型负荷曲线集。[0088] 在本发明的一些实施例中,第二聚类算法为K‑Means聚类算法;利用第二聚类算法,对电网标准负荷曲线集进行聚类分类,得到第一数量类别的电网标准负荷曲线分类集,包括:[0089] 利用肘部法则,从电网标准负荷曲线集中选取第一数量的标准负荷曲线作为中心向量;[0090] 迭代计算步骤:针对每一条标准负荷曲线,分别计算该标准负荷曲线与第一数量的中心向量的距离,根据计算结果,将该标准负荷曲线和距离该标准负荷曲线最近的中心向量归为一个类簇;[0091] 重新计算每一个类簇的中心向量位置,根据重新计算得到的每一个类簇的中心向量位置,跳转到迭代计算步骤循环执行,直至标准负荷曲线的归类变化量小于预设变化量,得到第一数量类别的电网标准负荷曲线分类集。[0092] 可选的,可以利用欧氏距离、曼哈顿距离或者余弦相似度计算标准负荷曲线与第一数量的中心向量的距离,具体可以根据实际情况进行选择。[0093] 示例性的,K‑means聚类算法的执行流程如下:[0094] 1)从n个向量对象任意选择k个向量作为初始聚类中心;[0095] 2)根据1)中设置的k个中心向量,计算每个对象与这k个中心向量的距离;[0096] 3)对于2)中的计算结果,每个向量与这k个向量都有一个距离。把此向量和距离它最近的中心向量归为一个类簇中;[0097] 4)重新计算每个类簇的中心向量位置;[0098] 5)重复步骤3)与4),直到类簇的向量归类变化极少为止。例如,一次迭代后只有少于1%的向量发生归类漂移,则认为聚类结束。[0099] 其中,针对每一类别,n个向量对象可以为n条标准负荷曲线,中心向量k为聚类的类别数量,具体是通过肘部法则选择和确定。[0100] 具体的,肘部法则的原理如下:[0101] 采用肘部法则进行分类数量k值的选择,通过给定k值的试验范围,分别计算k=1,2,......,10时,对应的聚类结果,并以簇内误差平方和(SSE)的大小对结果进行评估。[0102] 簇内误差平方和(SSE)表示为: 其中,μ(j)表示j簇的中心。[0103] 随着k值的增大,样本划分会更加精细,每个簇的聚合程度会逐渐提高,误差平方和SSE会逐渐变小。当k值小于最佳聚类数时,由于k值的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度较大;而当k值到达最佳聚类数时,再增加k值所得到的聚合程度回报会迅速变小,所以SSE的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,因此SSE和k值的关系图呈现类似手肘的形状,而这个肘部位置对应的k值,即SSE减幅变小的转折处,为最佳聚类数。参见图3,其示出了本发明实施例提供的利用肘部法则计算得到的SSE‑k值关系图。[0104] 在本发明的一些实施例中,第三聚类算法为GKLOF算法;利用第三聚类算法对该类别对应的电网标准负荷曲线分类集进行聚类剔除,包括:[0105] 针对该类别对应的电网标准负荷曲线分类集中的每一条标准负荷曲线,计算该标准负荷曲线的高斯核局部离群因子,并根据该标准负荷曲线的高斯核局部离群因子判断该标准负荷曲线是否异常;[0106] 剔除该类别对应的电网标准负荷曲线分类集中的所有判定结果为异常的标准负荷曲线,得到该类别对应的典型负荷曲线集。[0107] 可选的,利用GKLOF聚类算法进行异常标准负荷曲线的检测和识别过程如下:[0108] 1)高斯核局部密度基于高斯核距离,通过计算各点与对象的高斯核距离来确定距离邻域。高斯核距离反映了对象和其邻近点之间距离的衰减程度,对于离群点,它们与邻近点之间距离的衰减程度大于正常点,因此它们的高斯核局部密度较小。相反,正常点与邻近点之间距离的衰减程度较小,因此它们的高斯核局部密度接近于1。[0109] 2)计算高斯核局部离群因子GKLOF,通过比较GKLOF和1的大小,区分正常点和离群点。[0110] 3)对各类别异常检测结果进行确认,对判定结果为异常的标准负荷曲线对应的母线单独隔离。[0111] 具体的,高斯核密度局部离群因子算法(GKLOF)的原理描述如下:[0112] 1)高斯核局部密度[0113] 设q为正整数,则对象p的高斯核局部密度记作:[0114][0115] 式中,G(·)表示高斯核函数,||xo‑xp||表示对象p和对象o的欧式距离,h为高斯核函数的宽度参数,控制了函数的径向作用范围。本实施例中,h为所有样本点两两之间偏离的标准差,通过引用标准差来反应整个样本点之间距离的变化程度,[0116] 对象p和对象o的高斯核距离可以表示为:[0117] 高斯核局部密度基于高斯核距离,通过计算各点与对象的高斯核距离来确定距离邻域。[0118] 此外,高斯核距离反映了对象和其邻近点之间距离的衰减程度。对于离群点,它们与邻近点之间距离的衰减程度大于正常点,因此它们的高斯核局部密度较小。相反,正常点与邻近点之间距离的衰减程度较小,因此它们的高斯核局部密度接近于1。[0119] 2)高斯核局部离群因子[0120] 对象p的高斯核局部离群因子表示为:[0121] 在GKLOF中,那些高斯核局部密度比邻近点低的样本点被判定为离群点。若是被检测的点o是的一个邻近点,则由上式可知:若p是离群点而o是正常点,则gkldq(o)>gkldq(p),GKLOFq(p)>1;若p和o都是正常点,则gkldq(o)≈gkldq(p),GKLOFq(p)≈1。通过比较高斯核局部离群因子和1的大小,以此可以区分正常点和离群点。[0122] 在本发明的一些实施例中,根据该标准负荷曲线的高斯核局部离群因子判断该标准负荷曲线是否异常,包括:[0123] 在该标准负荷曲线的高斯核局部离群因子大于预设阈值时,判定该标准负荷曲线异常;[0124] 在该标准负荷曲线的高斯核局部离群因子不大于预设阈值时,判定该标准负荷曲线正常。[0125] 示例性的,采用本发明方案的示例如下:[0126] 选取2020年11月~12月广东电网母线负荷数据进行仿真计算,该电网共计1062条母线。[0127] 参见图4,其示出了本发明实施例提供的某一母线负荷曲线分布图;参见图5,其示出了本发明实施例提供的对图4所示母线的提取结果;参见图6,其示出了本发明实施例提供的广东电网1062条母线的标准负荷曲线分布图;参见图7,其示出了本发明实施例提供的采用K‑Means聚类算法得到的第八类母线的分类结果;参见图8,其示出了本发明实施例提供的采用GKLOF聚类算法对第八类母线进行异常识别的结果;参见图9,其示出了发明实施例提供的求得的第八类别对应的电网母线典型负荷曲线。[0128] 首先,采用改进的DBSCAN聚类算法对各个母线的负荷曲线集进行提取。以某一条母线为例(如图4),提取结果如图5,可以看出,基于改进的DBSCAN聚类算法的母线典型负荷曲线提取方法可以很好地将母线某一时期内的标准负荷曲线进行提取,对于图4中异常负荷曲线可以做到有效的剔除。按照上述方法,对广东电网1062条母线的标准负荷曲线提取结果,如图6所示。[0129] 其次,采用K‑Means聚类算法对1062条母线的标准负荷曲线进行聚类分类,共分为八类。其中,第八类母线的聚类结果如图7所示。[0130] 以第8类母线聚类结果为例,可以看到多数母线的日间负荷水平相对平稳,夜间负荷基本归零。但是,某一母线显示为异常标准负荷曲线,虽然夜间的负荷特点与类群整体趋势一致,然而在白天出现了较大的负荷波动,与类群整体表现出一定的差异性,需要将异常标准负荷曲线对应的母线暂时剔除。[0131] 再次,利用GKLOF聚类算法对异常标准负荷曲线进行识别及剔除,如图8所示,分为异常标准负荷曲线、聚类母线和正常标准负荷曲线。异常标准负荷曲线为一条,聚类母线为一条,其余为正常标准负荷曲线。可以看出,GKLOF聚类算法较好地将聚类结果中相对异常的母线对应的标准负荷曲线进行剥离。[0132] 最后,获取得到八种主要的电网母线典型负荷曲线(即第八类的聚类母线),第八类别的电网典型用电曲线如图9所示。[0133] 本发明利用广东电网母线负荷数据进行验证,本发明可以有效实现从负荷曲线集中提取出标准负荷曲线、从标准负荷曲线集中得到第一数量类别的电网标准负荷曲线分类集,最后从第一数量类别的电网标准负荷曲线分类集中得到电网母线典型负荷曲线集,得到的电网母线典型负荷曲线集可以较为准确的反映电网的工作特征,利用得到的电网典型曲线集进行负荷预测,得到的结果更加准确,根据负荷预测结果对电网进行调控,可以提高利用电网电力资源的效率,还可以提高电网工作的可靠性。[0134] 应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。[0135] 以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。[0136] 图10示出了本发明实施例提供的电网母线典型负荷曲线识别装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:[0137] 如图10所示,电网母线典型负荷曲线识别装置20可以包括:[0138] 获取模块,用于获取电网中各条母线分别对应的负荷曲线集;[0139] 第一聚类模块,用于针对每一条母线,利用第一聚类算法,对该母线对应的负荷曲线集进行聚类提取,得到该母线对应的标准负荷曲线;[0140] 集合模块,用于将各个母线对应的标准负荷曲线形成电网标准负荷曲线集;[0141] 第二聚类模块,用于利用第二聚类算法和第三聚类算法,对电网标准负荷曲线集进行聚类剔除,并根据聚类剔除后的结果确认电网母线典型负荷曲线集。[0142] 在本发明的一些实施例中,第一聚类算法为改进的DBSCAN聚类算法;第一聚类模块,包括:[0143] 设定单元,用于设定搜索半径ε为: 其中,T为该母线的日采样点的个数,Pmax为该母线的日最大负荷;设定预设数量Nminpts为:Nminpts=Ndays/5,其中,Ndays为预设的工作日的数量;[0144] 划分单元,用于执行核心点划分步骤,核心点划分步骤为:针对该母线的负荷曲线集中的每条负荷曲线,获取在该负荷曲线的搜索半径ε范围内覆盖的该母线对应的负荷曲线集中其它负荷曲线的数量,若该数量大于预设数量,则将该负荷曲线划分为核心点;[0145] 搜索单元,用于在核心点的数量为零时,将搜索半径ε以预设步长Δε增长,得到增长后的搜索半径,并将增长后的搜索半径作为新的搜索半径,跳转到核心点划分步骤循环执行,直至核心点的数量大于零;[0146] 计算单元,用于在核心点数量大于零时,将该母线的所有核心点取平均,得到该母线对应的标准负荷曲线。[0147] 在本发明的一些实施例中,第二聚类模块,可以包括:[0148] 第一聚类单元,用于利用第二聚类算法,对电网标准负荷曲线集进行聚类分类,得到第一数量类别的电网标准负荷曲线分类集;[0149] 第二聚类单元,用于针对每一个类别,利用第三聚类算法对该类别对应的电网标准负荷曲线分类集进行聚类剔除。[0150] 在本发明的一些实施例中,第二聚类算法为K‑Means聚类算法;第一聚类单元,可以包括:[0151] 选取子单元,用于利用肘部法则,从电网标准负荷曲线集中选取第一数量的标准负荷曲线作为中心向量;[0152] 迭代计算子单元,用于执行迭代计算步骤,迭代计算步骤为:针对每一条标准负荷曲线,分别计算该标准负荷曲线与第一数量的中心向量的距离,根据计算结果,将该标准负荷曲线和距离该标准负荷曲线最近的中心向量归为一个类簇;[0153] 重复计算子单元,用于重新计算每一个类簇的中心向量位置,根据重新计算得到的每一个类簇的中心向量位置,跳转到迭代计算步骤循环执行,直至标准负荷曲线的归类变化量小于预设变化量,得到第一数量类别的电网标准负荷曲线分类集。[0154] 在本发明的一些实施例中,第三聚类算法为GKLOF算法;第二聚类子单元,可以包括:[0155] 判断子单元,用于针对该类别对应的电网标准负荷曲线分类集中的每一条标准负荷曲线,计算该标准负荷曲线的高斯核局部离群因子,并根据该标准负荷曲线的高斯核局部离群因子判断该标准负荷曲线是否异常;[0156] 剔除子单元,用于剔除该类别对应的电网标准负荷曲线分类集中的所有判定结果为异常的标准负荷曲线,得到该类别对应的典型负荷曲线集。[0157] 在本发明的一些实施例中,判断子单元还用于在该标准负荷曲线的高斯核局部离群因子大于预设阈值时,判定该标准负荷曲线异常;在该标准负荷曲线的高斯核局部离群因子不大于预设阈值时,判定该标准负荷曲线正常。[0158] 图11是本发明实施例提供的终端的示意图。如图11所示,该实施例的终端30包括:处理器300、存储器301以及存储在存储器301中并可在处理器300上运行的计算机程序302。处理器300执行计算机程序302时实现上述各个电网母线典型负荷曲线识别方法实施例中的步骤,例如图1所示的S101至S104。或者,处理器300执行计算机程序302时实现上述各装置实施例中各模块/单元的功能,例如图10所示模块/单元201至204的功能。[0159] 示例性的,计算机程序302可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器301中,并由处理器300执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序302在终端30中的执行过程。例如,计算机程序302可以被分割成图10所示的模块/单元201至204。[0160] 终端30可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端30可包括,但不仅限于,处理器300、存储器301。本领域技术人员可以理解,图11仅仅是终端30的示例,并不构成对终端30的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端还可以包括输入输出设备、网络接入设备、总线等。[0161] 所称处理器300可以是中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field‑ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。[0162] 存储器301可以是终端30的内部存储单元,例如终端30的硬盘或内存。存储器301也可以是终端30的外部存储设备,例如终端30上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。进一步地,存储器301还可以既包括终端30的内部存储单元也包括外部存储设备。存储器301用于存储计算机程序以及终端所需的其他程序和数据。存储器301还可以用于暂时地存储已经输出或者将要输出的数据。[0163] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。[0164] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。[0165] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。[0166] 在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。[0167] 作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。[0168] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。[0169] 集成的模块/单元如果以软件功能单元的形式实现并作为独立地产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个电网母线典型负荷曲线识别方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read‑OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。[0170] 以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
专利地区:广东
专利申请日期:2021-09-09
专利公开日期:2024-06-18
专利公告号:CN113743519B