可左右滑动选省市

一种铁路轨道维修作业计划编制优化方法及系统

更新时间:2024-09-27
一种铁路轨道维修作业计划编制优化方法及系统 专利申请类型:发明专利;
源自:北京高价值专利检索信息库;

专利名称:一种铁路轨道维修作业计划编制优化方法及系统

专利类型:发明专利

专利申请号:CN202210007431.5

专利申请(专利权)人:北京交通大学
权利人地址:北京市海淀区西直门外上园村3号

专利发明(设计)人:唐源洁,王福田,常艳艳,胡志远,刘仍奎

专利摘要:本发明涉及一种铁路轨道维修作业计划编制优化方法及系统,所述优化方法包括如下步骤:构建用于铁路轨道维修作业计划编制的包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数;确定轨道状态的铁路轨道维修作业计划的约束条件;根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案。本发明通过构建包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数,并利用MOQPSO算法进行求解,实现了合理的进行维修计划编制,减少了维修成本。

主权利要求:
1.一种铁路轨道维修作业计划编制优化方法,其特征在于,所述优化方法包括如下步骤:构建用于铁路轨道维修作业计划编制的包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数;
确定轨道状态的铁路轨道维修作业计划的约束条件;
根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案;
所述目标函数为:
min:Tmc+Ttpc+Tpc
min:RL
min:WL
其中,Tmc为总的维修作业成本, I表示区段的数
量,Ei表示区段i的设备的种类数;Ji,e为区段i的第e类设备的施工活动类型总数,mti,e,j为区段i的第e类设备的第j类施工活动的维修次数;xi,e,j,k,d为区段i的第e类设备的第j类施工活动的第k次维修是否在第d个决策步长进行,mci,e,j,k为区段i的第e类设备的第j类施工活动的第k次维修在当前选定施工模式下的实际维修作业费,yi,e,j,k,m表示区段i的第e类设备的第j类施工活动的第k次维修的第m种施工模式的布尔变量,Mi,e,j表示区段i的第e类设备的第j类施工活动的第k次维修的施工模式的数量,mci,e,j,k,m为区段i的第e类设备的第j类施工活动的第k次维修在当前选定的第m种施工模式下的实际维修作业费;
Ttpc为总的轨道占用成本, zd为第d个决策步长是否有维修作业,zd=maxxi,e,j,k,d,tpc为轨道占用费用;
Tpc表示总的违反期望时间进行维修的成本, Δ
coni,e,d表示区段i的第e类设备在第d天优化前后的状态差值的绝对值,Δconi,e,d=|p_coni,e,d‑r_coni,e,d|,p_coni,e,d表示优化前区段i的第e类设备在第d天的状态,r_coni,e,d表示优化后区段i的第e类设备在第d天的状态;T表示规划周期,pc表示违反期望时间进行维修的单位时间成本;
RL表示总体资源均衡值, N表示资源的种类数,wn表示资源n的资源均衡值的权重,RLn表示资源n的资源均衡值, rsn,t表示整个规划周期第t天第n种资源的实际消耗,H表示规划周期内的天窗数量,WL表示天窗均衡值, wh和wh‑1分别代表第h‑1个和第h个天窗序列中的元素;
所述约束条件包括:
轨道状态约束:r_coni,e,d≤limi,e,j;其中,limi,e,j表示区段i的第e类设备的第j类施工活动的维修阈值;
维修资源可得量约束:rsan,t≥rsn,t;其中,rsan,t表示可更新资源n在第t天的可得量;
天窗维修能力约束: 其中,msi,e,j,k为区
段i的第e类设备的第j类施工活动的第k次维修在当前选定施工模式下的实际作业速率;li表示区段i的长度,Dh表示天窗h的时长,Ih表示第h个天窗进行维修作业的区段集合;
维修费用约束:Tmc+Ttpc≤EC;其中,EC表示维修费用期望值;
天窗均衡约束:WL≤EWL;其中,EWL表示天窗均衡期望值;
资源均衡约束:RLn≤ERLn和RL≤ERLT;其中,ERLn表示资源n的资源均衡期望值,ERLT表示各类资源加权资源均衡期望值;
逻辑约束:sti,e,k‑sti,e,k‑1≥intervali,e和distributemode≤Edistribute;其中,intervali,e表示区段i的第e类设备的最小时间间隔,sti,e,j,k和sti,e,k‑1分别表示区段i的第e类设备的第j类施工活动的第k次维修和第k‑1次维修的作业日期;distributemode为模式分布值,Edistribute为模式分布期望值;
所述根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案,具体包括:根据决策变量的取值,利用编码规则生成个体,将维修变量作为个体,初始化父代种群,维修决策变量包括维修作业的开始时间和维修作业的施工模式;
根据个体移动公式,对所述父代种群进行移动操作,产生子代种群;
根据局部搜索策略及连续多点变异策略,分别对当前种群的个体进行邻域搜索与变异,产生更新后的当前种群;所述当前种群包括父代种群和子代种群;
分别根据约束违反值和拥挤距离的计算公式,计算当前种群中个体的约束违反值和拥挤距离;
根据当前种群中个体的约束违反值和拥挤距离,选择当前种群中更优的个体组成下一次迭代的父代种群,并更新外部归档集;所述外部归档集中存储有所有非支配解的个体;
返回步骤“根据个体移动公式,对所述父代种群进行移动操作,产生子代种群”,直到满足算法迭代次数要求为止,随后输出外部归档集中的Pareto最优解;
所述个体移动公式为:
ppi=ω·pbesti+(1‑ω)·gbest
其中,mbest表示每个个体的最优位置向量的平均值,pbesti表示个体i的个体最优位置向量,M为个体群的种群规模,j为个体的维度,pi1、pi2和pij分别表示个体i的个体最优位置向量中第1个、第2个和第j个变量值;
ppi为pbesti与gbest之间的随机点,gbest为种群的全局最优位置向量,ω和u均为[0,
1]之间均匀分布的随机数,β为QPSO算法的收缩扩张系数;
xig和xij分别表示第i个个体的第g个维度和第j个维度的取值;
所述根据局部搜索策略及连续多点变异策略,分别对所述当前种群的个体进行邻域搜索与变异,产生更新后的当前种群,具体包括:在第t代时,从外部归档集中随机选择一个个体X1(t);
利用公式 和 计算个体X1(t)中相邻的两个区段i
和i+1的总维修次数numi和numi+1;
将区段i的numi个代表维修作业开始时间的基因和numi个代表施工模式的基因,分别与区段i+1相对应的基因互换,得到新的个体X2(t);
在当前种群中随机选择一个个体X3(t);
如果X2(t)支配X3(t),利用新的个体X2(t)替换X3(t);其中,X2(t)支配X3(t)的确定方式为:当个体X2(t)的每一个目标函数值均小于或等于个体X3(t)的目标函数值,且个体X2(t)至少有一个目标函数值小于个体X3(t)的目标函数值时,X2(t)支配X3(t);
随机选取一个个体X4(t),对个体X4(t)中的维修作业的开始时间序列和工作模式序列进行变异操作,产生新的个体X5(t),当新的个体X5(t)优于个体X4(t)时,将利用新的个体X5(t)替换个体X4(t)。
2.根据权利要求1所述的铁路轨道维修作业计划编制优化方法,其特征在于,约束违反值的计算公式为:其中,δ为小于预设阈值的正数,V(x)为约束违反值函数之和,当V(x)=0时,表示可行解,k'表示不等式约束的数量。
3.根据权利要求1所述的铁路轨道维修作业计划编制优化方法,其特征在于,拥挤距离的计算公式为:其中,CDi表示个体i的拥挤距离,M是目标函数的数量, 和 分别是第p层帕累托前沿上第i+1和第i‑1个解的第k个目标函数值, 和 分别是第p层帕累托前沿上所有解中第k个目标函数的最大值和最小值。
4.根据权利要求1所述的铁路轨道维修作业计划编制优化方法,其特征在于,所述根据当前种群中个体的约束违反值和拥挤距离,选择当前种群中更优的个体组成下一次迭代的父代种群,并更新外部归档集,具体包括:从当前种群中选择非支配个体用于下一代迭代优化,获得初始优化种群;所述非支配个体为不被任何个体支配的个体;
判断初始优化种群中个体的数量是否超出种群规模;
若是,则计算初始优化种群中每个个体的拥挤距离;
按照拥挤距离从大到小顺序从所述初始优化种群选取种群规模个数的个体组成下一次迭代的父代种群,并更新外部归档集;
若否,则将初始优化种群作为下一次迭代的父代种群。
5.一种铁路轨道维修作业计划编制优化系统,其特征在于,所述系统应用权利要求1‑4任一项所述的方法,所述优化系统包括:目标函数构建模块,用于构建用于铁路轨道维修作业计划编制的包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数;
约束条件确定模块,用于确定轨道状态的铁路轨道维修作业计划的约束条件;
优化求解模块,用于根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案。 说明书 : 一种铁路轨道维修作业计划编制优化方法及系统技术领域[0001] 本发明涉及轨道维修技术领域,特别是涉及一种铁路轨道维修作业计划编制优化方法及系统。背景技术[0002] 轨道是列车运行的基础,用于引导机车车辆的运行,直接承受来自列车的荷载,并将荷载传至路基或者桥隧结构物。受列车荷载及地理环境等多种因素的影响,轨道状态随时间的推移逐步劣化。为了保障列车运行安全,增加铁路网络的可靠性、可用性、可维修性和安全,延长轨道使用寿命,需要对轨道进行维修。受到多种因素的影响,例如不同轨道区段,其所处地质结构、横纵断面、设备型号、维修历史、通过总重等不同,轨道劣化具有异质性,具体表现为不同空间位置,轨道劣化速率、维修周期、使用寿命均不相同。为了体现轨道状态劣化的异质性,提高轨道状态预测精度,提高维修决策的空间分辨率,需要根据空间位置将轨道划分为较小的单元,充分考虑不同空间位置轨道几何状态劣化的差异,针对每个区段进行个性化分析。由于轨道劣化具有异质性,每个轨道区段的劣化速率、维修周期、任意时刻的状态均不相同,传统的周期修必然导致“过度修”和“欠维修”的情况,既增加了维修成本,又难以保障安全,影响使用寿命。为了在保障列车运行安全的情况下,节约维修成本,有必要根据轨道状态进行状态修。状态修可以兼顾经济和安全,然而,完全按照轨道状态达到阈值的时间点进行维修,存在以下问题:(1)维修活动在时间上离散,导致所需天窗数量增加,增加对行车的干扰,从而增加间接维修费用;(2)维修活动在空间上离散,增加走行距离,降低维修效率和天窗利用率。而考虑机会维修,将原本离散的维修活动在时间上连续化的维修策略,则可以更好地节约维修成本,提高维修效率,提高天窗利用率。铁路集中修作业模式是指集中调配施工机械和设备、人员、路料等,综合利用施工天窗,在短时期内集中完成一条线路行车设备大中修和技术改造任务的一种施工组织形式。同时考虑多种设备、多种施工活动的集中修模式有利于提高施工效率和质量,减少施工对运输的整体影响。此外,在实际维修过程中,同一种施工活动往往存在多种模式可供选择,其所需维修资源、维修费用及维修速率不同。[0003] 现有技术方案:(1)基于轨道状态的铁路轨道维修计划编制模型方面:状态修的前提是对轨道状态的准确预测。许多学者对铁路轨道状态劣化规律建模问题进行过研究,这些模型可以分为劣化机理类模型、统计模型(包括确定性模型、随机性模型)和机器学习模型三类。机理类模型无法处理轨道劣化的不确定性,且轨道中的复杂相互作用很难精确建模,计算效率很低。相较于机理模型,统计模型能够处理大量的数据,并且可以处理不同类别的输入变量,然而该类模型高度依赖于数据质量。机器学习类模型在轨道几何状态劣化规律建模领域的应用仍处于起步阶段,通常需要用大量历史数据对模型进行训练和验证。[0004] 既有维修计划编制模型多是以月、季度为决策步长的规划级模型,少量精确到天窗的维修计划研究将月度规划模型与天窗计划模型分阶段考虑,或者按照固定周期进行维修计划编制。[0005] 既有基于状态修的研究通常采用一种割裂的模式:假定设备的维修时刻仅仅由一个确定性的设备状态预测结果所决定,即,先进行状态预测,进而基于固定的预测结果进行计划编制。而在考虑机会维修策略、集中修策略及多种复杂约束条件的场景下,设备的维修时刻成为不再由固定的设备状态这一个因素所确定的变量,且不同的维修时刻又会反过来对设备的劣化状态产生影响。[0006] (2)求解算法方面:当前,求解多目标优化问题的方法主要分为两大类:传统优化算法与进化算法。传统优化算法,例如加权法、ε约束法、距离函数法等,主要优化思路为将多目标优化问题中的各目标赋予相应的权重,利用加权等方法,将多个优化目标转化为单一优化目标,再利用Gurobi等商业求解器进行求解。其中,权重的取值通常采用自适应方法确定或根据决策者经验确定。[0007] 进化多目标优化算法类型较多,其中最常用的有两类:(1)以遗传算法为基础的优化算法;(2)以粒子群优化为基础的优化算法。第一类算法以NSGA‑II为代表,是迄今为止知名度最高、使用最为广泛的进化多目标优化算法。[0008] 但是,基于粒子群的优化算法(ParticleSwarmOptimization,PSO),其在计划编制领域的求解质量与求解效率均优于基于遗传算法的优化算法。然而,粒子群算法也存在以下缺陷:(1)难以确定使得粒子可在解空间内进行有效搜索的合适参数,导致求解结果无法收敛;(2)粒子的位置变化缺少随机性,容易陷入局部最优。上述缺陷使得基于PSO开发出的多目标粒子群优化算法(MultiobjectiveParticleSwarmOptimization,MOPSO)不可避免地存在收敛性和多样性较差的问题。[0009] 既有基于轨道状态的铁路轨道维修计划编制模型的缺点如下:[0010] (1)状态预测时间分辨率较低,难以支撑对基于设备状态的高时间粒度的维修计划编制的探索。既有研究通常以月、季度为预测周期,时间粒度较粗,难以体现轨道状态每一天的变化情况,确定最佳维修时机,因此,难以支撑对基于设备状态的高时间粒度的维修计划编制的探索。[0011] (2)状态预测空间分辨率较低,难以体现轨道状态劣化的异质性特征。既有研究通常根据直线、曲线、桥梁、隧道、岔区等轨道结构特征对轨道进行分类,在区段划分过程中仅考虑了轨道结构因素,没有考虑空间位置因素可能对轨道状态劣化产生的影响。事实上如前文所述,轨道状态劣化具有典型的异质性特征,具体表现为不同空间位置处的轨道状态劣化规律不一致。这种忽略了空间位置因素的低时空分辨率的轨道状态预测方法将影响模型预测结果的精确性。[0012] (3)状态预测和维修计划编制相割裂。既有基于状态修的研究通常采用先进行状态预测,进而基于固定的预测结果进行计划编制(Sini_condition)的方法,这种模式下状态预测与维修计划编制之间互相割裂,无法体现状态预测与维修计划编制之间的双向反馈及动态影响。而事实上,由于受到多种约束条件的限制及机会维修等策略的使用,最终所得的实际的维修计划(Scond‑oppor‑constr)将不同于仅考虑设备初始状态的维修计划Sini_condition,这就使得Scond‑oppor‑constr将不可避免地偏离其所依据的真实的设备状态,难以实现真正意义上的状态修。[0013] (4)对复杂的实际应用场景考虑不足。针对多种设备开展的,多种维修活动同时进行的集中修策略是当前铁路行业的发展趋势,一类维修活动存在多种可供选择的施工模式是施工现场的实际情形。而既有研究通常对复杂的实际场景考虑不足,无法实现针对多种设备、多种施工活动、多种施工模式的维修计划编制。此外,既有研究对机会维修策略的考虑不充分,仅考虑了机会维修带来的优势,忽略了由于提前进行维修作业而造成的轨道寿命损失成本,使模型实用性降低。[0014] 既有多目标求解算法的缺点如下:[0015] (1)针对大规模多目标优化问题,Gurobi等商业求解器的求解效率较低,且需要根据决策者经验,主观确定各优化目标的权重,无法生成帕累托解集,供管理者决策。[0016] (2)常用的NSGA‑Ⅱ算法在实现复杂多目标优化问题求解过程中存在无法兼顾全局与局部搜索、无法有效地获取Pareto最优解、容易陷入早熟收敛等缺陷[21]。[0017] 本发明的目的是,针对以上不足,构建基于轨道状态的铁路维修作业计划优化模型,根据问题特性设计相应的求解算法进行求解。具体而言,包含以下内容:[0018] (1)以“天”为预测周期,建立具有高时间分辨率的状态预测模块,以实现基于设备状态的高时间粒度的维修计划编制。[0019] (2)从空间位置角度出发,以固定长度为空间对象,基于其自身的历史检测数据进行个性化的状态预测,充分考虑影响轨道状态劣化的异质性特征。[0020] (3)构建单阶段的精确到天窗的作业级维修计划编制模型,以“天”为预测周期建立高精度的个性化状态预测模块,同时以“天”为决策步长制定基于轨道状态的维修作业计划,以达到整体最优,实现对二者之间的双向动态反馈的刻画。[0021] (4)引入基于多种设备、多种维修活动、多种施工模式的集中修策略,同时考虑轨道占用成本降低和设备剩余使用寿命损失成本增加的机会维修策略,考虑设备状态约束、资源可得量约束、天窗维修能力约束、维修费用约束、逻辑约束等复杂约束,准确刻画复杂的实际铁路应用场景,提高模型的实用性。[0022] (5)基于TC‑RTMSOP特性,针对该问题所具有的NP‑hard、大规模、多目标优化特性,设计基于问题特性的约束处理规则,以提升模型的求解效率;融入局部搜索策略与连续多点变异策略,以增强粒子的搜索能力,避免算法陷入局部最优;引入用于保留精英个体信息的精英保留策略,以提高算法的求解质量。以Gurobi平台的精确算法、NSGA‑Ⅱ算法及无策略MOQPSO算法为对比对象,验证本研究所提出的TC‑RTMSOM及基于QPSO的混合多目标优化算法的有效性。[0023] 可见,如何合理的进行维修计划编制,以减少维修成本,成为一个亟待解决的技术问题发明内容[0024] 有鉴于此,本发明提供了一种铁路轨道维修作业计划编制优化方法及系统,以合理的进行维修计划编制,减少维修成本。[0025] 为实现上述目的,本发明提供了如下方案:[0026] 一种铁路轨道维修作业计划编制优化方法,所述优化方法包括如下步骤:[0027] 构建用于铁路轨道维修作业计划编制的包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数;[0028] 确定轨道状态的铁路轨道维修作业计划的约束条件;[0029] 根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案。[0030] 可选的,所述目标函数为:[0031] min:Tmc+Ttpc+Tpc[0032] min:RL[0033] min:WL[0034] 其中,Tmc为总的维修作业成本, I表示区段的数量,Ei表示区段i的设备的种类数;Ji,e为区段i的第e类设备的施工活动类型总数,mti,e,j为区段i的第e类设备的第j类施工活动的维修次数;xi,e,j,k,d为区段i的第e类设备的第j类施工活动的第k次维修是否在第d个决策步长进行,mci,e,j,k为区段i的第e类设备的第j类施工活动的第k次维修在当前选定施工模式下的实际维修作业费,yi,e,j,k,m表示区段i的第e类设备的第j类施工活动的第k次维修的第m种施工模式的布尔变量,Mi,e,j表示区段i的第e类设备的第j类施工活动的第k次维修的施工模式的数量,mci,e,j,k,m为区段i的第e类设备的第j类施工活动的第k次维修在当前选定的第m种施工模式下的实际维修作业费;[0035] Ttpc为总的轨道占用成本, zd为第d个决策步长是否有维修作业,zd=maxxi,e,j,k,d,tpc为轨道占用费用;[0036] Tpc表示总的违反期望时间进行维修的成本, Δconi,e,d表示区段i的第e类设备在第d天优化前后的状态差值的绝对值,Δconi,e,d=|p_coni,e,d‑r_coni,e,d|,p_coni,e,d表示优化前区段i的第e类设备在第d天的状态,r_coni,e,d表示优化后区段i的第e类设备在第d天的状态;T表示规划周期;[0037] RL表示总体资源均衡值, N表示资源的种类数,wn表示资源n的资源均衡值的权重,RLn表示资源n的资源均衡值, rsn,t表示整个规划周期第t天第n种资源的实际消耗,H表示规划周期内的天窗数量,[0038] WL表示天窗均衡值, wh和wh‑1分别代表第h‑1个和第h个天窗序列中的元素。[0039] 可选的,所述约束条件包括:[0040] 轨道状态约束:r_coni,e,d≤limi,e,j;其中,limi,e,j表示区段i的第e类设备的第j类施工活动的维修阈值;[0041] 维修资源可得量约束:rsan,t≥rsn,t;其中,rsan,t表示可更新资源n在第t天的可得量;[0042] 天窗维修能力约束: 其中,msi,e,j,k为区段i的第e类设备的第j类施工活动的第k次维修在当前选定施工模式下的实际作业速率;li表示区段i的长度,Dh表示天窗h的时长,Ih表示第h个天窗进行维修作业的区段集合;[0043] 维修费用约束:Tmc+Ttpc≤EC;其中,EC表示维修费用期望值;[0044] 天窗均衡约束:WL≤EWL;其中,EWL表示天窗均衡期望值;[0045] 资源均衡约束:RLn≤ERLn和RL≤ERLT;其中,ERLn表示资源n的资源均衡期望值,ERLT表示各类资源加权资源均衡期望值;[0046] 逻辑约束:sti,e,k‑sti,e,k‑1≥intervali,e和distributemode≤Edistribute;其中,intervali,e表示区段i的第e类设备的最小时间间隔,sti,e,j,k和sti,e,k‑1分别表示区段i的第e类设备的第j类施工活动的第k次维修和第k‑1次维修的作业日期;distributemode为模式分布值,Edistribute为模式分布期望值。[0047] 可选的,所述根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案,具体包括:[0048] 将维修变量作为个体,初始化父代种群,所述维修变量包括维修作业的开始时间和维修作业的施工模式;[0049] 根据个体移动公式,对所述父代种群进行移动操作,产生子代种群;[0050] 根据局部搜索策略及连续多点变异策略,分别对所述当前种群的个体进行邻域搜索与变异,产生更新后的当前种群;所述当前种群包括父代种群和子代种群;[0051] 分别根据约束违反值和拥挤距离的计算公式,计算当前种群中个体的约束违反值和拥挤距离;[0052] 根据当前种群中个体的约束违反值和拥挤距离,选择当前种群中更优的个体组成下一次迭代的父代种群,并更新外部归档集;所述外部归档集中存储有所有非支配解的个体;[0053] 返回步骤“根据个体移动公式,对所述父代种群进行移动操作,产生子代种群”,直到满足算法迭代次数要求为止,随后输出外部归档集中的Pareto最优解。[0054] 可选的,所述个体移动公式为:[0055][0056] ppi=ω·pbesti+(1‑ω)·gbest[0057][0058] 其中,mbest表示每个个体的最优位置向量的平均值,pbesti表示个体i的个体最优位置向量,M为个体群的种群规模,j为个体的维度,pi1、pi2和pij分别表示个体i的个体最优位置向量中第1个、第2个和第j个变量值;[0059] ppi为pbesti与gbest之间的随机点,gbest为种群的全局最优位置向量,ω和u均为[0,1]之间均匀分布的随机数,β为QPSO算法的收缩扩张系数,[0060] xig和xij分别表示第i个个体的第g个维度和第j个维度的取值。[0061] 可选的,所述根据局部搜索策略及连续多点变异策略,分别对所述当前种群的个体进行邻域搜索与变异,产生更新后的当前种群,具体包括:[0062] 在第t代时,从外部归档集中随机选择一个个体X1(t);[0063] 利用公式 和 计算个体X1(t)中相邻的两个区段i和i+1的总维修次数numi和numi+1;[0064] 将区段i的numi个代表维修作业开始时间的基因和numi个代表施工模式的基因,分别与区段i+1相对应的基因互换,得到新的个体X2(t);[0065] 在当前种群中随机选择一个个体X3(t);[0066] 如果X2(t)支配X3(t),利用新的个体X2(t)替换X3(t);支配关系的确定方式为,当且仅当满足以下条件:[0067][0068] 则称解X2(t)支配解X3(t)。即当解X2(t)的每一个目标函数值均小于或等于解X3(t)的目标函数值,且解X2(t)至少有一个目标函数值严格小于解X3(t)的目标函数值时,X2(t)支配X3(t);[0069] 随机选取一个个体X4(t),对个体X4(t)中的维修作业的开始时间序列和工作模式序列进行变异操作,产生新的个体X5(t),当新的个体X5(t)优于个体X4(t)时,将利用新的个体X5(t)替换个体X4(t)。[0070] 可选的,约束违反值的计算公式为:[0071][0072] 其中,δ为小于预设阈值的正数,V(x)为约束违反值函数之和,当V(x)=0时,表示可行解,k'表示不等式约束的数量,gi'(x)表示第k'个不等式约束。不等式约束包括轨道状态约束、维修资源可得量约束、天窗维修能力约束、维修费用约束、天窗均衡约束、资源均衡约束、逻辑约束。[0073] 可选的,拥挤距离的计算公式为:[0074][0075] 其中,CDi表示个体i的拥挤距离,M是目标函数的数量, 和 分别是第p层帕累托前沿上第i+1和第i‑1个解的第k个目标函数值, 和 分别是第p层帕累托前沿上所有解中第k个目标函数的最大值和最小值。[0076] 可选的,所述根据当前种群中个体的约束违反值和拥挤距离,选择当前种群中更优的个体组成下一次迭代的父代种群,并更新外部归档集:[0077] 从当前种群中选择非支配个体用于下一代迭代优化,获得初始优化种群;所述非支配个体为不被任何个体支配的个体;[0078] 判断初始优化种群中个体的数量是否超出种群规模;[0079] 若是,则计算初始优化种群中每个个体的拥挤距离;[0080] 按照拥挤距离从大到小顺序从所述初始优化种群选取种群规模个数的个体组成下一次迭代的父代种群,并更新外部归档集。[0081] 若否,则将初始优化种群作为下一次迭代的父代种群。[0082] 一种铁路轨道维修作业计划编制优化系统,所述优化系统包括:[0083] 目标函数构建模块,用于构建用于铁路轨道维修作业计划编制的包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数;[0084] 约束条件确定模块,用于确定轨道状态的铁路轨道维修作业计划的约束条件;[0085] 优化求解模块,用于根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案。[0086] 根据本发明提供的具体实施例,本发明公开了以下技术效果:[0087] 本发明公开一种铁路轨道维修作业计划编制优化方法,所述优化方法包括如下步骤:构建用于铁路轨道维修作业计划编制的包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数;确定轨道状态的铁路轨道维修作业计划的约束条件;根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案。本发明通过构建包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数,并利用MOQPSO算法进行求解,实现了合理的进行维修计划编制,减少了维修成本。附图说明[0088] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。[0089] 图1为本发明提供的铁路轨道维修作业计划编制优化方法的流程图;[0090] 图2为本发明提供的某一区段内单个设备状态劣化及维修时间示意图;[0091] 图3为本发明提供的TC‑RTMSOP示意图;[0092] 图4为本发明提供的TC‑RTMSOM框架图;[0093] 图5为本发明提供的编码规则示意图;[0094] 图6为本发明提供的邻域搜索策略示意图;[0095] 图7为本发明提供的连续多点变异示意图;[0096] 图8为本发明提供的首次施工时间限制示意图;[0097] 图9为本发明提供的施工间隔时间限制示意图;[0098] 图10为本发明提供的施工时间调换示意图;[0099] 图11为本发明提供的不可行解处理示意图;[0100] 图12为本发明提供的精英保留策略示意图;[0101] 图13为本发明提供的不同算法所得帕累托前沿示意图;[0102] 图14为本发明提供的不同算法所得二维权衡分析图;[0103] 图15为本发明提供的天窗分布直方图;[0104] 图16为本发明提供的资源分布直方图;[0105] 图17为本发明提供的单个设备状态劣化过程分析示意图。具体实施方式[0106] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0107] 本发明的目的是提供一种铁路轨道维修作业计划编制优化方法及系统,以合理的进行维修计划编制,以减少维修成本。[0108] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。[0109] 即,本发明要解决的技术问题是:基于轨道状态的铁路维修作业计划编制优化问题(Tackconditionbasedrailwaytrackmaintenanceschedulingoptimizationproblem,TC‑RTMSOP)。该问题包含两个子问题:(1)基于轨道状态的铁路维修作业计划编制模型的构建;(2)针对TC‑RTMSOP的求解算法的设计。[0110] 子问题1包含两个层面的子问题:第一层面是某一区段内单个设备的具有高时间分辨率的劣化规律建模及维修时刻确定问题,第二个层面是考虑复杂约束及机会维修影响的基于设备状态的轨道路网维修计划编制问题。[0111] 第一个层面某一区段内单个设备的劣化及维修时间曲线可用图2表示。横坐标代表时间,纵坐标代表设备状态,横虚线代表设备维修阈值,实线代表设备劣化曲线,当设备状态劣化到维修阈值,对设备进行维修,维修时刻用竖虚线表示。实际计划编制过程中,在考虑状态预测结果的同时,还需引入机会维修及维修资源等约束,导致最终形成的维修计划,其维修作业时刻与理想中完全按照预测劣化到维修阈值时进行维修所得计划维修时刻不同。受机会维修及资源约束影响后所得实际维修计划开始时刻(图2中的调整后的维修时间),图2中,Δconi,e.t表示设备在第t天预测的状态与优化后所得实际状态之间的差值。[0112] 利用图2所示方法可得到单个设备的理论最佳维修时刻,由此推广到所有区段内所有设备构成的轨道路网,可得到所有设备的理论最佳维修时间及其所对应的维修计划(Sini_condition),如图3所示。图中横坐标代表区段,纵坐标代表时间,横纵坐标所形成的网格表示一个区段的维修时刻。为增加模型的灵活性及实用性,本发明引入基于多种设备、多种维修活动、多种施工模式的集中修策略。以图3中(a)图为例对多模式进行说明,假定本问题有三种施工模式,分别为mode1、mode2、mode3,如图3中的(b)图、(c)图、(d)图所示,不同施工模式所对应的维修作业速率、维修成本、资源使用量不同。[0113] TC‑RTMSOP是多目标优化问题,优化目标分别为:(1)总成本最小。总成本包含三部分,分别为维修作业成本、轨道占用成本、剩余寿命减少成本(用Scond‑oppor‑constr与Sini_condition之间的状态差值来表示)。(2)天窗均衡值最小。天窗均衡的作用是使计划周期内的维修天窗分布尽量均衡,平衡维修作业工作量,降低管理成本。(3)维修资源均衡值最小。资源均衡通常用于建设工程管理,作用是在施工计划执行过程中,减少资源使用量的波动,避免出现短时的高峰或者低谷,使得资源需求曲线尽可能的平滑,以改善资源的使用效率,减少对资源频繁的雇佣和解雇,降低资源成本和管理成本,减少不必要的损失。本发明引入该指标,用于实现各个维修天窗之间作业资源配置的均衡分布。[0114] 针对TC‑RTMSOP的特性,构建基于轨道状态的铁路维修作业计划编制模型(Trackconditionbasedrailwaytrackmaintenanceschedulingoptimizationmodel,TC‑RTMSOM),该模型主要由两部分组成,分别为(1)基于网格的具有高时(以天为时间粒度)空(以特定长度的轨道单元为对象)分辨率的个性化轨道状态预测模块(Track gridbasedpersonalizedconditionpredictionmodulewithhightemporalandspatialresolution,TG‑PCMMHTSR);(2)基于轨道网格状态的,针对多种设备、多种维修活动、多种施工模式,考虑机会维修的轨道修理计划编制模块(Trackgridconditionbasedmaintenanceschedulingmoduleformultipleequipment,multiplemaintenanceactivities,andmultiple construction modes,consideringopportunisticmaintenance,TGC‑MSMMMMO)。[0115] (1)状态预测模块TG‑PCPMHTSR。首先确定状态预测的时间粒度及空间粒度,基于维修计划的最小时间单位,将时间粒度确定为天;基于空间位置,将线性、连续的铁路轨道设备划分为区段,根据区段i内设备e自身的历史检测数据Datai,e,确定该设备的状态初始值inii,e,0、劣化率dri,e,0等参数,构建基于轨道区段的、具有高时空分辨率的个性化轨道状态预测模型。该模型属于统计类模型,在既有统计模型的基础上,将轨道划分为较小的区段,考虑设备劣化的异质性和不确定性,提高预测精度。状态预测模块的输出是,区段i内设备e在整个计划编制周期T内每一天的状态值r_coni,e.t。[0116] (2)维修计划编制模块TGC‑MSMMMMO。首先确定维修计划编制模型的决策变量:1)区段i的第e类设备的第j类施工活动的第k次维修的作业模式mi,e,j,k;2)区段i的第e类设备的第j类施工活动的第k次维修的作业日期sti,e,j,k。基于状态预测模块得到的设备状态r_coni,e.t,以总成本、资源均衡、天窗均衡为优化目标,考虑维修费用约束、轨道状态约束、维修资源可得量约束、天窗维修能力约束、逻辑约束等约束条件,并针对实际应用场景考虑机会主义维修,构建基于轨道区段状态的,针对多种设备、多种维修活动、多种施工模式,考虑机会维修的轨道修理计划编制多目标优化模型,输出维修计划为Scond‑oppor‑constr。[0117] (3)TG‑PCPMHTSR与TGC‑MSMMMMO之间的相互作用。如图4所示,具体过程如下:[0118] 1)TG‑PCPMHTSR输出r_coni,e.t,作为TGC‑MSMMMMO的输入。[0119] 2)TGC‑MSMMMMO在考虑区段i的第e类设备第j类施工活动的维修阈值limi,e.j,引入机会主义维修策略,考虑多种复杂约束后生成维修计划Scond‑oppor‑constr,并将输出的作业开始时间sti,e,j,k反馈给状态预测模块TG‑PCPMHTSR。[0120] 3)TG‑PCPMHTSR根据sti,e,j,k重新估计设备状态初始值inii,e,k、劣化率dri,e,k等参数,更新区段i的第e类设备在sti,e,j,k之后每一天的状态r_coni,e.t(t≥sti,e,k),并将r_coni,e.t(t≥sti,e,k)反馈给TGC‑MSMMMMO。[0121] 4)重复步骤2)至步骤3),直到r_coni,e.t(t=T)全部更新完毕,TG‑PCPMHTSR与TGC‑MSMMMMO的交互结束,输出最终的维修计划Scond‑oppor‑constr。[0122] 具体可以概括为以下两个过程:[0123] (1)基于轨道状态的铁路维修作业计划编制模型[0124] 1)模型中某一区段内单个设备的状态劣化规律需要具有较高的时间分辨率及较高的预测精度,以确定最佳维修时机。[0125] 2)模型需要考虑各种复杂的约束条件,考虑机会维修、集中修等策略,准确刻画复杂的实际铁路应用场景,提高模型的实用性。[0126] 3)模型需要对状态预测及维修计划编制进行同步优化,以支撑作业级维修计划编制优化。[0127] (2)针对TC‑RTMSOP的求解算法[0128] 1)算法需要具备多目标优化能力。[0129] 2)算法需要具备特定的约束处理能力,以缩小解空间,提升求解效率。[0130] 3)对比NSGA‑II等经典的进化多目标优化算法,算法需要具备较强的探索能力,避免陷入局部最优;对比成熟的Gurobi等商业求解器,算法需要具备较高的求解效率,还要能够生成帕累托解集,供管理者决策。[0131] 4)算法需要具备较好的收敛性及多样性。[0132] 本发明涉及到的常量如下:[0133] T计划周期;[0134] d决策步长;[0135] I区段总数;[0136] Ei区段i的设备总数;[0137] li区段i的长度;[0138] Ji,e区段i的第e类设备的施工活动类型总数;[0139] SJi,e区段i的第e类设备的施工活动类型集合;[0140] Mi,e,j区段i的第e类设备的第j类施工活动的作业模式总数;[0141] Ni,e,j,m区段i的第e类设备的第j类施工活动的第m种作业模式的资源类别总数;[0142] inii,e,0区段i的第e类设备的初始状态;[0143] dri,e,0区段i的第e类设备的初始劣化率;[0144] inii,e区段i的第e类设备大修后的状态;[0145] dri,e区段i的第e类设备的大修后的劣化率;[0146] limi,e,j区段i的第e类设备的第j类施工活动的维修阈值;[0147] rsan,t可更新资源n在第t天的可得量;[0148] rstan计划周期内,不可更新资源n的总量;[0149] ERLn资源n的资源均衡期望值;[0150] wn资源n的权重;[0151] ERLT各类资源加权资源均衡期望值;[0152] msi,e,j,k,m区段i的第e类设备的第j类施工活动的第k次维修所选择的第m种模式的作业速率;[0153] mci,e,j,k,m区段i的第e类设备的第j类施工活动的第k次维修所选择的第m种模式的维修作业费;[0154] ri,e,j,k,m,n区段i的第e类设备的第j类施工活动的第k次维修所选择的第m种模式对资源n的需求量;[0155] SRi,e.j,k,m区段i的第e类设备的第j类施工活动的第k次维修所选择的第m种模式的资源需求序列;[0156][0157] SR'i,e,j,k,n区段i的第e类设备的第j类施工活动的第k次维修对资源n的需求序列;[0158][0159] MRi,e,j,k区段i的第e类设备的第j类施工活动的第k次维修的资源需求矩阵;[0160][0161] SMSi,e,j,k区段i的第e类设备的第j类施工活动的第k次维修的作业速率序列;[0162][0163] SMCi,e,j,k区段i的第e类设备的第j类施工活动的第k次维修的维修作业费序列;[0164][0165] mi,e,j,k,m区段i的第e类设备的第j类施工活动的第k次维修的第m种模式,是一个由SRi,e.j,k,m、msi,e,j,k,m、mci,e,j,k,m组成的三元组;[0166] mi,j,k,m=(SRi,e.j,k,m,msi,e,j,k,m,mci,e,j,k,m);[0167] SMi,e,j,k区段i的第e类设备的第j类施工活动的第k次维修的作业模式序列;[0168][0169] tpc轨道占用费用(每日间接费);[0170] pc违反期望时间进行维修的单位时间成本;[0171] EC维修费用期望值;[0172] EWL天窗均衡期望值;[0173] Edistribute模式分布期望值;[0174] Dh天窗h的时长(小时);[0175] mti,e,j区段i的第e类设备的第j类施工活动的维修次数,根据历史数据进行合理估算;[0176] mti,e,j=f(inii,e,0,dri,e,0,limi,e,j);[0177] 本发明的决策变量[0178] mi,e,j,k区段i的第e类设备的第j类施工活动的第k次维修的作业模式;[0179] sti,e,j,k区段i的第e类设备的第j类施工活动的第k次维修的作业日期。[0180] 实施例1[0181] 如图1所示,基于上述问题本发明提供一种铁路轨道维修作业计划编制优化方法,所述优化方法包括如下步骤:[0182] 步骤101,构建用于铁路轨道维修作业计划编制的包含维修作业成本、总体资源均衡值和天窗均衡值的目标函数。[0183] 本发明建立了三个优化目标,首先选择最常用的总成本作为目标函数之一,其次将在本领域尚未使用的天窗均衡和资源均衡作为优化目标进行尝试和探索,以期通过案例分析揭示他们在本问题中的价值和作用。[0184] min:Tmc+Ttpc+Tpc[0185] min:RL[0186] min:WL[0187] 其中,Tpc表示总的违反期望时间进行维修的成本,[0188] Δconi,e,d表示区段i的第e类设备在第d天,优化前后的状态差值的绝对值。[0189] Δconi,e,d=|p_coni,e,d‑r_coni,e,d|[0190] p_coni,e,d表示根据初始预测结果,区段i的第e类设备在第d天的状态。[0191] p_coni,e,d=p_coni,e,j,k,t,ti,e,j,k<d≤ti,e,j,k+1,t=d‑ti,e,j,k[0192] p_coni,e,j,k,t表示区段i的第e类设备的第j类施工活动的第k次维修后劣化到第t天的状态预测值。[0193] p_coni,e,j,k,t=p_inii,e,j,k+p_dri,e,j,k·t[0194] p_inii,e,j,k和p_dri,e,j,k分别表示区段i的第e类设备的第j类(j<J)施工活动的第k次维修后的状态值和劣化率。[0195][0196][0197] p_rei,e,j,k表示区段i的第e类设备的第j类(j<J)施工活动的第k次维修后的改善量。[0198][0199] p_miti,e,j,k表示区段i的第e类设备的第j类施工活动的第k次维修后劣化到维修阈值的时间间隔。[0200] p_miti,e,j,k=(limi,e,j‑p_inii,e,j,k)/p_dri,e,j,k[0201] ti,e,j,k表示区段i的第e类设备的第j类(j<J)施工活动的第k次维修的期望时间。[0202][0203] ti,e,J,K表示区段i的第e类设备的第J类施工活动的第K次维修的期望时间。[0204][0205] 针对第J类施工活动,区段i的第e类设备的第J类施工活动的第K次维修后状态值、劣化率、改善量分别为p_inii,e,J,K、p_dri,e,J,K、p_rei,e,J,K。[0206] p_inii,e,J,K=inii,e[0207] p_dri,e,J,K=dri,e[0208][0209] 步骤102,确定轨道状态的铁路轨道维修作业计划的约束条件。[0210] (1)轨道状态约束[0211] 该约束规定每个区段上的每类设备,在任意时刻不应超过其维修阈值。[0212] r_coni,e,d≤limi,e,j(约束1)[0213] 其中,r_coni,e,d表示优化后,区段i的第e类设备在第d天的状态。[0214] r_coni,e,d=r_coni,e,j,k,t,sti,e,j,k<d≤sti,e,j,k+1,t=d‑sti,e,j,k[0215] r_coni,e,j,k,t表示优化后,区段i的第e类设备的第j类施工活动第k次维修后劣化到第t天的状态预测值。[0216] r_coni,e,j,k,t=r_inii,e,j,k+r_dri,e,j,k·t[0217] r_inii,e,j,k和r_dri,e,j,k分别表示优化后,区段i的第e类设备的第j类(j<J)施工活动第k次维修后的状态值和劣化率。[0218][0219][0220] r_miti,e,j,k为优化后,区段i的第e类设备的第j类(j<J)施工活动第k次维修与第k+1次维修之间的时间间隔。[0221] r_miti,e,j,k=sti,e,j,k+1‑sti,e,j,k[0222] r_rei,e,j,k为优化后,区段i的第e类设备的第j类(j<J)施工活动第k次维修后的改善量。[0223][0224] 针对第第J类施工活动,优化后区段i的第e类设备的第J类施工活动第K次维修后的状态值、劣化率、改善量和维修间隔时间分别为r_inii,e,J,K、r_dri,e,J,K、r_rei,e,J,k和r_miti,e,J,K。[0225] r_inii,e,J,K=inii,e[0226] r_dri,e,J,K=dri,e[0227][0228] r_miti,e,J,k=sti,e,j,q‑sti,e,J,ksti,e,j,q‑1≤sti,e,J,k≤sti,e,j,q[0229] (2)维修资源可得量约束[0230] 该约束规定每一类可更新资源在单位时间内的使用量不得超过该资源在单位时间的可得量。[0231] rsan,t≥rsn,t(约束2‑1)[0232] 其中,rsn,t表示整个规划周期第t天第n种资源的实际消耗。[0233][0234] rsi,e,j,k,n为区段i的第e类设备的第j类施工活动的第k次维修在当前选定施工模式下对资源n的实际需求量。[0235][0236] yi,e,j,k,m代表区段i的第e类设备的第j类施工活动的第k次维修是否选择第m个模式进行施工。[0237][0238] Yi,e,j,k代表区段i的第e类设备的第j类施工活动的第k次维修的施工模式布尔变量序列。[0239][0240] xi,e,j,k,d代表区段i的第e类设备的第j类施工活动的第k次维修是否在第d个决策步长进行。[0241][0242] 该约束规定每一类不可更新资源在规划周期内的资源使用量不得超过该资源的总可得量。[0243] rstan≥rstn(约束2‑2)[0244] 其中,rstn为整个规划周期第n种资源的实际消耗。[0245][0246] (3)天窗维修能力约束[0247] 该约束规定每个天窗实际进行维修作业的时长,不得超过该天窗的维修能力,由天窗时长和维修作业速率决定。[0248][0249] 其中,msi,e,j,k为区段i的第e类设备的第j类施工活动的第k次维修在当前选定施工模式下的实际作业速率。[0250][0251] Ih表示第h个天窗进行维修作业的区段集合。[0252][0253] (4)维修费用约束[0254] 该约束规定规划周期内总的维修作业费用(包括维修成本、轨道占用成本)不得超过维修费用期望值。[0255] Tmc+Ttpc≤EC(约束4)[0256] 其中,Tmc为总的维修作业成本。[0257][0258] mci,e,j,k为区段i的第e类设备的第j类施工活动的第k次维修在当前选定施工模式下的实际维修作业费。[0259][0260] Ttpc为总的轨道占用成本。[0261][0262] zd表示第d个决策步长是否有维修作业。[0263] zd=maxxi,e,j,k,d[0264] (5)天窗均衡约束[0265] 该约束规定规划周期内的天窗应均匀分布,不得超过天窗均衡期望值。[0266] WL≤EWL(约束5)[0267] 其中,WL表示天窗均衡值。[0268][0269] 假定天窗序列为SW,是H维有序数组,H表示规划周期内的天窗数量,wh代表天窗序列中的元素。[0270] SW=nonzeros(ST)=(w1,w2,…,wh,…,wH)[0271][0272] ST表示进行维修作业时所处的天数序列。[0273] ST=(t1,t2,…,td,…,tT)[0274] td表示进行维修作业时所处的天数。[0275][0276] (6)资源均衡约束[0277] 该约束规定各个维修天窗之间,各类作业资源配置应均匀分布,不得超过该资源均衡期望值。[0278] RLn≤ERLn(约束6‑1)[0279] 其中,RLn表示资源n的资源均衡值。[0280][0281] 该约束规定总的资源均衡不得超过总体资源均衡期望值。[0282] RLT≤ERLT(约束6‑2)[0283] 其中,RLT表示总体资源均衡值。[0284][0285] (7)逻辑约束[0286] 该约束规定维修作业之间的时空约束。同一空间位置,不同天窗之间,应满足最小时间间隔约束。[0287] sti,e,k‑sti,e,k‑1≥intervali,e(约束7‑1)[0288] 该约束规定同一天窗内,同一类施工活动,不同空间位置的施工模式应尽量一致,不得超过模式分布期望值。[0289] distributemode≤Edistribute(约束7‑2)[0290] 其中,distributemode是模式分布值,该值越小,表示同一天窗内模式波动越小。[0291][0292] 步骤103,根据所述约束条件,采用MOQPSO算法求解所述目标函数,获得基于轨道状态的铁路轨道维修作业计划的优化方案。[0293] 基于QPSO的混合多目标优化算法用于对TC‑RTMSOP的求解,这应当是MOQPSO算法在轨道维修计划编制领域的首次应用。由于MOQPSO尚未有统一的算法框架,本发明基于TC‑RTMSOP特性,设计了特定的编码规则及约束处理机制,引入了局部搜索策略、连续多点变异策略等策略,以实现MOQPSO算法在此类问题中的应用,并提高算法的求解质量及求解效率。算法核心步骤如下。[0294] 1、编码规则:[0295] 假定区段i的第e类设备的第j类施工活动的维修次数为mti,e,j,第k次维修作业的开始时间为sti,e,j,k,将其作为一个基因,则所有区段内所有设备的所有施工活动的开始时间为一个粒子,粒子的长度为2*num,num表示所有区段内所有设备的所有活动类型的维修作业总次数。[0296][0297] 其编码规则如图5所示。[0298] 图5中粒子包含两部分,第1~num个基因为维修活动开始时间,第num+1~2*num个基因表示维修活动所选施工模式。假定某活动的开始时间信息位于第n个基因,则该活动的施工模式信息在第num+n个基因处。[0299] 2、基于可行性的粒子选择策略[0300] 基于可行性的选择策略用于对算法优化过程中产生的个体进行区分,并筛选出相对更优的个体,该策略通过利用约束违反值、目标函数值与拥挤距离实现上述筛选过程。对于种群中的任意两个粒子i和j,分别计算两个粒子的约束违反值、目标函数值、拥挤距离。[0301] 约束违反值用于区分可行解与不可行解,多目标量子粒子群算法中的各粒子按照下列公式计算粒子的约束违反值:[0302][0303] 式中,δ为一很小的正数,V(x)为约束违反值函数之和,当V(x)=0时,表示可行解。[0304] 拥挤距离(crowdingdistance)原引于NSGA‑II算法,用于比较所得解的多样性,是NSGA‑II算法中保持种群多样性,防止早熟收敛的重要手段。拥挤距离越大,得到的解的质量越好。其定义为每个解与其相邻解之间的距离,计算公式如下。[0305][0306] 其中,M是目标函数数量, 和 分别是第p层帕累托前沿上第i+1和第i‑1个解的第k个目标函数值, 和 分别是第p层帕累托前沿上所有解中第k个目标函数的最大值和最小值。在明确约束违反值与拥挤距离的计算方式后,对于种群中的任意两个粒子,基于可行性的选择策略给予的比较规则如下:[0307] (1)若两个粒子分别为可行解与不可行解,则选择可行解。[0308] (2)若两个粒子均为不可行解,则选择约束违反值较小的解;若两个解约束违反值相同,则根据目标函数值,利用Pareto支配原则,选择非支配解;若两个解不存在Pareto支配关系,则选择拥挤距离更大的解。[0309] (3)若两个粒子均为可行解,则根据目标函数值,利用Pareto支配原则,选择非支配解;若两个解不存在Pareto支配关系,则选择拥挤距离更大的解。[0310] 3、外部归档集更新策略[0311] 为了避免算法优化过程中非支配解的遗漏,算法设计了一个用于保存非支配解的外部归档集,并在每次迭代运行过程中,对归档集中的非支配集进行更新,确保更优的解可以保留。现假设外部归档集为Ω,归档集中粒子的最大数量为NΩ,对于一个新产生的非支配解X,归档集更新策略如下:[0312] (1)若此时归档集为空集,则将非支配解X纳入到归档集中;[0313] (2)若此时X受到归档集中其他解的支配,则舍弃X,若X支配归档集中的解,则将X纳入到归档集中,并舍弃被X所支配的解;[0314] (3)若X与归档集中的所有解均不存在支配关系,则将X纳入带归档集中;此时若归档集中的粒子数量大于NΩ,计算归档集中所有粒子的拥挤距离,根据拥挤距离,从大到小选择出NΩ个粒子纳入到归档集中。[0315] 为了避免由于某个目标函数值过大,从而支配较小目标函数值所引发的数值问题,在计算拥挤距离时,需要对目标函数进行归一化处理,使得目标函数值位于[0,1]之间,具体方法如下:[0316][0317] 式中,|Ω|表示在当前迭代次数时,归档集Ω中的粒子数量;Fim(X)表示在归档集Ω中第i个粒子的第m个目标函数值。[0318] 4、局部搜索策略[0319] 多目标优化问题所具有的非凸性与非线性特征,可能造成在小范围解空间内的粒子存在完全不一样的目标函数值,即存在比当前解更优的可行解[47]。为了提高粒子的局部搜索能力,以获取更优解,本研究将局部搜索方法融入到所设计的MOQPSO算法中。[0320] 根据TC‑RTMSOP问题的特点,本研究设计的局部搜索策略如下:[0321] 在第t代时,从外部归档集中随机选择一个个体X1(t),利用特定规则在其邻域中产生新的个体X2(t)。随后,在当前种群中随机选择一个个体X3(t),如果X2(t)支配X3(t),则将X3(t)替换为X2(t);否则以一定的概率确定是否替换X2(t)。生成X2(t)的规则如图6所示。[0322] 图6中的(a)图表示个体X1(t),随机选择该个体中相邻的两个区段i和i+1,两个区段的总维修次数分别为numi和numi+1。将区段i的numi个代表维修作业开始时间的基因和numi个代表施工模式的基因,分别与区段i+1相对应的基因互换,得到新的个体X2(t),如图6中的(b)图所示。其中numi和numi+1的计算方式如下:[0323][0324][0325] 5、连续多点变异策略[0326] 为了增强粒子的探索能力,避免算法陷入早熟收敛,通常需要变异操作。针对TC‑RTMSOP的特性,本研究在原有的MOQPSO算法的基础上,融入连续多点变异策略,如图7所示。图7中的(a)图表示一个粒子,随机选择某区段i内第e类设备的第j类施工活动,该类维修活动的总维修次数为mti,e,j,作业开始时间序列为施工模式序列为 针对作业开始时间序列STi,e,j及施工模式序列Mi,e,j,分别对mti,e,j个基因进行变异,产生新的基因[0327] 及 如图7中的(b)图所示。其中作业开始时间的变异规则如图7中(c)图,先根据规则产生第一次作业开始时间st'i,e,j,1∈[1,durationi,e],再根据规则产生第二次作业开始时间st'i,e,j,2∈[st'i,e,j,1+durationi,e,T],同理可生成其他基因。[0328] 随机选择某个个体,利用连续多点变异策略在可行域内生成一个新的个体,如果产生的候选个体优于当前个体,则将当前个体替换为候选个体,否则以一定的概率确定是否替换当前个体。[0329] 6、约束处理[0330] TC‑RTMSOP包含多种复杂的约束,为了提高算法的求解效率,作者设计了4种约束处理机制。[0331] (1)初始化:首次施工时间限制[0332] 如图8所示,假定区段i内设备e在计划周期T内最多进行mti,e,j次维修,将设备首次维修时间sti,e,j,1的取值范围限定为[0,durationi,e],即设备首次维修时间不得早于durationi,e,其中,durationi,e的确定方式如下:[0333] durationi,e=f(inii,e,0,dri,e,0,limi,e,j)。[0334] (2)初始化:施工间隔时间限制[0335] 如图9所示,若区段i内设备e在计划周期T内存在第二次维修,则将设备第二次维修时间sti,e,j,2的取值范围设定为[sti,e,j,1+interval,sti,e,j,1+durationi,e],即设备第二次维修时间不得早于第一次维修时间+特定间隔时间durationi,e。[0336] (3)施工时间调换[0337] 经过粒子移动、局部搜索、连续多点变异等操作后,设备维修时间可能出现错乱,违反逻辑。例如设备第二次维修时间小于第一次维修时间等,则根据时间进行排序,对设备维修时间进行赋值,如图10所示。[0338] (4)不可行解处理策略[0339] 经过粒子移动、局部搜索、连续多点变异等操作后,粒子可能存在超出取值范围构成的解空间进行搜索的情况。对此,采用以下方式限制粒子在解空间范围内搜索。[0340] 假设第i个粒子的第d个维度的取值范围为:ld≤xid≤ud,当粒子进行第t次迭代时,若 或 时,则:[0341][0342] 式中,j与j'为两个均匀分布在粒子搜索维度范围[1,N]内的随机整数, 代表第i个粒子的自身最优位置, 表示整个粒子群的全局最优位置,处理过程如图11所示。[0343] 7、改进更新策略[0344] 算法改进更新策略主要体现在以下两个方面:[0345] (1)粒子自身最优位置与全局最优位置的确定[0346] 在算法迭代过程中,需要不断地更新粒子自身最优位置与全局最优位置,即Pbest与Gbest,其中Pbest根据基于可行性的选择策略进行更新,与以往随机选择某一Pareto最优解作为Gbest的方法不同,本算法中,Gbest的更新方式为:依据外部归档集中各Pareto最优解的拥挤距离,采用轮盘赌方法进行筛选,拥有更大拥挤距离的个体有着更高的选择概率。[0347] (2)粒子群的更新[0348] 为了确保优化过程中精英个体不被舍弃,算法采用NSGA‑II中精英保留策略,即在完成粒子位置的更新,生成子代种群后Pt,将子代种群与父代种群Qt合并,从合并的种群中选择非支配个体用于下一代迭代优化。若筛选出的非支配个体数量超出种群规模,计算所有个体的拥挤距离,从大到小选择相应的个体生成下一代种群。选择过程如图12所示。[0349] 8、算法步骤[0350] 基于MOQPSO的TC‑RTMSOP求解算法步骤描述如下:[0351] (1)参数设定:种群规模,外部归档集规模,迭代次数,选择概率;[0352] (2)根据粒子初始化的规则对种群进行初始化,同时初始化外部归档集,根据模型评估初始种群中的个体;[0353] (3)根据粒子移动公式,产生子代种群,粒子在空间中按下列更新方程式进行移动:[0354][0355] ppi=ω·pbesti+(1‑ω)·gbest[0356][0357] 其中,α的取值范围为:[0358][0359] 式中,mbest为pbest的平均值,即粒子的平均最佳位置,M为粒子群的种群规模,j为粒子的维度,ppi为pbesti与gbest之间的随机点,ω,u为[0,1]之间均匀分布的随机数,β为QPSO算法中的唯一参数,称作收缩—扩张系数,当β<1.781时,才可确保量子粒子群算法收敛[49],对此,β一般按照下式取值:[0360][0361] 式中,t为当前迭代次数,MAXITER为最大迭代次数,m,n的取值通常为m=1,n=0.5。[0362] (4)根据局部搜索策略及连续多点变异策略,分别对粒子进行邻域搜索与变异,生成新个体;[0363] (5)分别根据模型中的目标函数公式及约束违反值的公式计算当前种群中个体的目标函数值与约束违反值;[0364] (6)采用可行性选择策略筛选非支配个体,并计算所有个体的拥挤距离;[0365] (7)根据外部归档集更新策略选择Pareto排序较低、且拥挤距离更大的个体更新外部归档集;[0366] (8)根据改进更新策略进行精英保留,将子代与父代种群合并,从中选择更优的个体组成新种群,用于下一次迭代运算;[0367] (9)重复步骤3‑8,直到满足算法迭代次数要求为止,随后输出外部归档集中的Pareto最优解。[0368] 实施例2[0369] 案例分析[0370] 1、工程概况[0371] 兰新线是中国西北地区客货混跑的铁路干线,东起甘肃省兰州市,西至新疆维吾尔自治区阿拉山口市,客运设计速度为160km/h,年通过总重约为67MGT。由于地处中国环境特殊、地质结构复杂的西北地区,兰新线受到冻土、黄土高原、风沙、戈壁、严寒的影响,坡度起伏较大,曲线较多,全线最大坡度为15.2‰,最小曲线半径为300米,很多轨道病害都是由于特殊的地质环境引起的。受运输组织、地理环境等因素的影响,兰新线线路不平顺性变化较快,维修周期较短。[0372] 2、案例分析概述[0373] 本发明共设置两个案例。案例1为小规模案例,案例2为大规模案例。案例分析的目的为:根据实际检测数据,估计不同设备的状态初始值、劣化率等参数,根据管理经验,对设备的部分参数进行合理的假设,对本研究所提出的TC‑RTMSOM模型的有效性进行验证。[0374] 以Gurobi平台、NSGA‑Ⅱ算法,无策略MOQPSO算法为对比对象,对基于MOQPSO的融入多种策略的混合多目标求解算法性能进行评估。两个案例规模和三类求解算法共组合形成6个案例场景,由于大规模精确算法对硬件需求(包括CPU及内存)的需求较高,基于Gurobi平台的大规模案例在高性能计算平台(Highperformancecomputingplatform,HPC)上运行,HPC环境为linux64操作系统,48核处理器;其他五个场景在个人计算机(personalcomputer,PC)上运行,计算机环境为Windows10操作系统,IntelXeonCPUE5‑1620v3@3.50GHz,16GBRAM。[0375] 案例分析中的参数设置如表1所示。[0376] 表1案例分析参数值[0377][0378][0379] 3、目标权衡分析[0380] 3.1三维权衡分析[0381] 本发明针对大小两个案例规模,分别运用MOQPSO算法和NSGA‑Ⅱ算法进行求解。根据求解结果,绘制出总成本、资源均衡、天窗均衡三者之间的权衡关系图,得到如图13所示的三维曲面(图13中的(a)图为案例分析1采用MOQPSO算法获得的三维曲面,图13中的(b)图为案例分析1采用NSGA‑Ⅱ算法获得的三维曲面,图13中的(c)图为案例分析2采用MOQPSO算法获得的三维曲面,图13中的(d)图为案例分析2采用NSGA‑Ⅱ算法获得的三维曲面)。2个案例各算法的参数信息如表2所示。[0382] 表22个算例不同算法的参数信息[0383][0384][0385] 3.2、二维权衡分析[0386] 由于三维图难以分析目标之间的关系,为进一步探索三者之间的关系,对三维图像进行降维分析,并展示降维后对应的三幅二维图像,分别为:成本—天窗均衡权衡分析图、资源均衡—成本权衡分析图、资源均衡—天窗均衡权衡分析图,如图14所示,图14中的(a)图为案例分析1采用MOQPSO算法获得的成本与天窗均衡权衡关系图,图14中的(b)图为案例分析1采用NSGA‑Ⅱ算法获得的成本与天窗均衡权衡关系图,图14中的(c)图为案例分析1采用MOQPSO算法获得的资源均衡与成本权衡关系图,图14中的(d)图为案例分析1采用NSGA‑Ⅱ算法获得的资源均衡与成本权衡关系图,图14中的(e)图为案例分析1采用MOQPSO算法获得的资源均衡与天窗均衡权衡关系图,图14中的(f)图为案例分析1采用NSGA‑Ⅱ算法获得的资源均衡与天窗均衡权衡关系图,图14中的(g)图为案例分析2采用MOQPSO算法获得的成本与天窗均衡权衡关系图,图14中的(h)图为案例分析2采用NSGA‑Ⅱ算法获得的成本与天窗均衡权衡关系图,图14中的(i)图为案例分析2采用MOQPSO算法获得的资源均衡与成本权衡关系图,图14中的(j)图为案例分析2采用NSGA‑Ⅱ算法获得的资源均衡与成本权衡关系图,图中的14(k)图为案例分析2采用MOQPSO算法获得的资源均衡与天窗均衡权衡关系图,图14中的(l)图为案例分析2采用NSGA‑Ⅱ算法获得的资源均衡与天窗均衡权衡关系图。[0387] 基于图13和图14可知:[0388] (1)成本—天窗均衡权衡分析:根据图中走势可得出随着天窗均衡值的降低,维修成本增加的结论。成本—天窗均衡表现为上述结果的原因为:根据天窗均衡的定义,假设在规划周期T内共需要H个维修天窗,天窗均衡的最理想情况为每间隔T/(H+1)天进行一次维修,此时机会维修策略难以发挥作用,导致轨道占用成本增加,维修成本增加。[0389] (2)资源均衡—成本权衡分析:图中信息并未展示出资源均衡与成本之间存在明显的规律性。产生该结果的原因为:总成本的构成为维修成本、轨道占用成本、优化后状态偏差的惩罚成本三部分,其中维修成本仅与所选施工模式及其所对应的资源消耗量有关,本研究在总成本构成中,未考虑资源均衡带来的资源成本和管理成本的降低。[0390] (3)资源均衡—天窗均衡权衡分析:同资源均衡—成本权衡分析结果一样,图中信息并未展示出资源均衡与天窗均衡之间存在明显的规律性。[0391] 虽然后两个权衡分析,均未体现出明显的规律性,但也显示了分析对象之间不存在正相关关系,说明这是潜在的有意义有价值的优化指标,利用多目标优化对二者之间进行权衡仍是有必要的。施工现场的管理者在进行决策时,也有必要对天窗均衡及资源均衡进行权衡考虑,以在组织维度上降低管理成本。[0392] 4、基于MOQPSO算法的单个解分析[0393] 4.1天窗分布分析[0394] 根据维修计划绘制天窗分布直方图,如图15中的(a)图所示。图中横轴代表时间,纵轴代表是否有维修活动,图中[1,78]天及[134,190]天内(图中灰色阴影部分)没有任何维修活动,产生该现象的原因为:为了提高算法求解效率,本研究设计了针对TC‑RTMSOP的约束处理规则,对设备维修时间进行动态处理。由于在计划编制初期,设备状态良好,设备首次维修时间出现在durationi,e=f(inii,e,0,dri,e,0,limi,e,j)附近,集中在[78,134]天,因此前78天没有维修活动。同理,根据设备状态劣化规律,设备在[134,190]也未产生维修。[0395] 图15中的(a)图所示维修计划的天窗均衡值为253.72,天窗分布较为均衡。为了对天窗均衡这一目标函数进行直观对比,选择天窗均衡值较大的另一个解,绘制天窗分布直方图,如图15中的(b)图所示。该维修计划的天窗均衡值为336.43,在给定相同参数设置及初始解的情况下,该维修计划天窗均衡性较差。[0396] 4.2资源分布分析[0397] 根据维修计划绘制资源使用量分布直方图,如图16中的(a)图所示,该维修计划的资源均衡值为530.18,资源1、资源2、资源3的最大资源使用量分别为18/天、27/天、36/天,满足40/天的资源使用峰值约束,资源均衡性较差。为了对资源均衡这一目标函数进行直观对比,选择资源均衡值较小的另一个解,绘制资源分布直方图,如图16中的(b)图所示。该维修计划的资源均衡值为411.36,资源1、资源2、资源3的最大资源使用量分别为15/天、20/天、25/天,满足40/天的资源使用峰值约束,资源分布较为均衡。通过这两个解的对比分析可以看出,资源均衡目标值取得优化的同时,也带来了资源使用峰值的降低。[0398] 4.3机会主义维修策略、多模式及基于状态的动态反馈机制分析[0399] 对区段39及区段40的设备状态劣化过程进行可视化分析,结果如图17所示。图中横轴代表时间,纵轴代表设备状态。黑色竖线代表基于设备状态的理论最佳维修时刻,黑色斜线表示在Sini_condition下所得的设备在任意时刻的状态;图17中的长划线及圆点竖线代表TC‑RTMSOM优化后的最优维修时刻,长划线竖线表示前两次维修活动所采用的模式为模式1,圆点竖线表示第三次维修活动所采用的模式为模式2,黑色斜线表示在Scond‑oppor‑constr下所得的设备在任意时刻的状态值。从图17中可以看出,设备状态均未超过其维修阈值(3.0),且随着维修次数的增加,设备劣化速率增加,维修周期变短,符合设备劣化的实际过程。[0400] 根据约束处理规则,区段39的第二次维修活动应在[169,239]之间进行(图17中的(a)图中方框),区段40的第二次维修活动应在[177,246]之间进行(图17中的(b)图中方框)。由于引入了机会主义维修策略,模型在轨道占用费用和设备寿命损失之间进行权衡之后,决策得到区段40在第237天与区段39同时进行维修。[0401] 根据模型的状态约束及最小维修时间间隔约束,区段39的第二次维修活动应在[287,348]之间进行,区段40的第二次维修活动应在[287,335]之间进行。此时区段39并未与区段40同时维修,这同样是由于模型权衡分析选择的。[0402] 由于引入了多种施工模式,区段39和区段40的三次维修活动选择了不同的施工模式,同时,由于引入了同一天窗内维修模式波动值约束,在第237天,区段39和区段40同时选择第一种施工模式进行维修。[0403] 下面,以图17(a)为例,对状态预测模块TG‑PCPMHTSR与维修计划编制模块TGC‑MSMMMMO之间的双向反馈及动态影响进行分析:根据设备状态初始值、劣化率及维修阈值等信息,TG‑PCPMHTSR预测得到基于设备状态的理论最佳维修时刻(黑色竖线),在TC‑RTMSOM的双向反馈机制的作用下,通过动态反馈及状态约束、资源约束、天窗能力约束、逻辑约束等共同约束下的多轮迭代,得到优化后的维修时刻(图17中的长划线竖线和圆点竖线)。[0404] 由于考虑了双向反馈及动态影响,Scond‑oppor‑constr所得的维修计划是依据基于维修时刻动态调整后的真实设备状态(黑色斜线)进行编制的,克服了既有研究根据初始状态(黑色斜线)编制维修计划,偏离其所依据的真实的设备状态,所得计划不准确,难以实现真正意义上的状态修的缺陷。[0405] 5、算法对比分析[0406] 5.1、MOQPSO算法与Gurobi对比分析[0407] 为验证本发明的MOQPSO对TC‑RTMSOP的求解质量,评估MOQPSO所得解与最优解之间的差距,本发明利用Gurobi对TC‑RTMSOP进行求解。由于TC‑RTMSOP是非凸二次规划,且不同于既有的以月、季度为决策步长的规划模型,本研究构建的维修计划编制模块是以天为时间单位的作业级别模型,问题规模大。因此,精确算法对该问题求解效率较低。[0408] 案例1包含31436个二次约束及22723个generalconstraints,72384个continuousvariables和87100个integervariables,针对总成本、天窗均衡、资源均衡三个目标:(1)Gurobi平台求得的目标函数值分别为1758.94、70、0,将MOQPSO算法求得的可行解作为Gurobi平台的初始解进行输入,以缩短求解时间,此时求解时间分别为6h、1h、1h,总求解时间为8h;(2)MOQPSO算法求得的三个目标函数的最小值分别为1859.78、71.64、2,求解时间为0.073h。MOQPSO算法花费的计算时长约为Gurobi平台的0.91%,而其所得总成本、天窗均衡这两个目标函数值与Gurobi平台所得解之间的Gap分别为5.73%、2.35%。[0409] 案例2包含549525个二次约束及439827个generalconstraints,1321578个continuousvariables和1651115integervariables。随着问题规模的增加,Gurobi的求解时间急剧增加,针对总成本、天窗均衡、资源均衡三个目标:(1)Gurobi平台求得的目标函数值分别为20920、248、397,同样地,将MOQPSO算法求得的可行解作为Gurobi平台的初始解进行输入,此时求解时间分别为240h、18h、18h,总求解时间为276h。值得注意的是,由于超级计算平台运算时间的限制,总成本这一目标函数在求解240小时后,仍未找到最优解,此时的Gap为8.1%。(2)MOQPSO算法求得的三个目标函数的最小值分别为20922.1、250.46、399.53,求解时间为0.70h。MOQPSO算法花费的计算时长约为Gurobi平台的0.25%,而其所得三个目标函数值与Gurobi平台所得解之间的Gap仅为0.01%、3.15%、3.41%。[0410] 上述两个案例中,Gurobi平台第一个优化目标的求解时间较长,是由于总成本这一目标函数的计算过程复杂,为最小化该目标,需要在每次迭代过程中重新计算总成本,并对其最优性进行判断。[0411] MOQPSO算法与Gurobi平台求解结果对比分析如表3所示。分析结果表明,MOQPSO算法能够在较少的花费下(包括求解时间和硬件需求),获得相对较优的求解结果。[0412] 表3MOQPSO算法与Gurobi平台求解结果对比分析[0413][0414] 5.2、MOQPSO算法与NSGA‑Ⅱ算法对比分析[0415] 根据NSGA‑Ⅱ算法和MOQPSO算法的求解结果,利用常用的多目标优化元启发式算法的性能评价指标,对两种算法的求解质量与求解效率进行对比。[0416] (1)质量度量(QualityMetric,QM)[0417] QM是比较多目标元启发式算法的重要指标之一。为了确定质量度量,比较两种算法的Pareto解集,并去除由另一种算法的解支配的Pareto解。然后,通过将剩余Pareto最优解集的基数除以原始Pareto最优解集的基数来确定每个算法的质量度量。质量度量越高,算法的性能越好。[0418] (2)平均理想距离(MeanIdealDistance,MID)[0419] MID表示帕累托最优解与理想解的相对距离。理想解被定义为对问题的所有目标进行单独优化的解,理想解利用Gurobi进行求解获取。MID值越低,求解质量越好。计算公式如下[0420][0421] 其中, 分别代表第i个目标函数的最大值和最小值, 为利用Gurobi求得的第k个目标函数的最优解,fki表示第i层帕累托最优解的第k个目标函数值,n表示帕累托解集的基数。[0422] (3)多样性度量(DiversificationMetric,DM)[0423] DM表示通过元启发式算法获得的解的多样性。DM值越大,说明解的多样性越好,解的质量越高。[0424] 计算公式如下[0425][0426] (4)帕累托最优解数量(NumberofPareto‑optimalSolutions,NPS)[0427] NPS被定义为Paretooptimal解集的基数。NPS值越高越好。[0428] 两种算法对两个案例的求解性能指标如表4所示。从表中可以看出,两个案例中,表征求解质量的四个指标,MOQPSO算法均优于NSGA‑Ⅱ算法;而求解效率方面,NSGA‑Ⅱ算法更优。MOQPSO算法运算时间相对更长的原因为:为了提高解的多样性、收敛性,算法根据问题场景,设计了相对复杂的局部搜索、连续多点变异等策略,且种群规模较大,即,算法适当牺牲求解效率,来提升求解质量。[0429] 针对小规模案例,MOQPSO算法的求解时间是NSGA‑Ⅱ算法求解时间的约2倍,但其解的多样性指标DM增加了超过2倍(从图13(1a)~(2c)中也可看出),且帕累托最优解的数量、解的质量等均优于NSGA‑Ⅱ算法。从解的支配情况来看,NSGA‑Ⅱ算法求得的解的QM为0.2,即NSGA‑Ⅱ算法所求得的30个解中(包含15个不可行解),有24个解(约80%)被MOQPSO所得解支配,MOQPSO算法的质量明显优于NSGA‑Ⅱ算法。[0430] 针对大规模案例,随着问题规模扩大,NSGA‑II探索能力较差的缺陷开始显现,且对初始解的设定较为敏感,具体表现为:在针对20组不同初始解的测试中,MOQOSO有16次能找到可行解,而NSGA‑II算法仅有2次可探索到可行解;在设定与MOQPSO算法相同初始解的情况下,MOQOSO在迭代24代后搜索到可行解,其求解时间为2526s,而NSGA‑Ⅱ算法迭代860代后,方可搜索到可行解,其求解时间为3547s,MOQPSO算法的求解效率优于NSGA‑Ⅱ算法。从解的质量来看,MOQPSO算法所得解的多样性指标DM是NSGA‑Ⅱ算法的15倍(从图14(3a)~(4c)中也可看出),且帕累托最优解的数量、解的质量等均优于NSGA‑Ⅱ算法。此外,NSGA‑Ⅱ算法求得的解的QM为0.4,即NSGA‑Ⅱ算法所求得的30个解中(包含15个不可行解),有18个解(约60%)被MOQPSO所得解支配,MOQPSO算法的求解质量明显优于NSGA‑Ⅱ算法。[0431] 综上所述,对于小规模案例而言,MOQPSO算法在额外消耗相对较少且可接受的运算时间的前提下,带来了解的质量的大幅提升;对于大规模案例而言,随着问题规模扩大,NSGA‑II算法探索能力较差的缺陷开始显现,MOQPSO算法在花费更少时间的情况下,得到了比NSGA‑II算法更优的解。[0432] 表4MOQPSO算法与NSGA‑Ⅱ算法求解性能指标对比[0433][0434] 5.3、MOQPSO与无策略MOQPSO对比[0435] 为了验证局部搜索、连续多点变异等策略对算法求解效率及求解质量的影响,将本研究使用的融入多种策略的混合MOQPSO算法与无策略MOQPSO算法(NostrategyMOQPSOalgorithm,N‑MOQPSO)进行对比,结果如表5所示。[0436] 针对小规模案例,MOQPSO算法的求解时间是N‑MOQPSO算法求解时间的约1.2倍,但其解的多样性指标DM增加了约1.6倍,且帕累托最优解的数量、解的质量等均优于N‑MOQPSO算法。从解的支配情况来看,N‑MOQPSO算法求得的解的QM为0.47,即N‑MOQPSO算法所求得的30个解中,有16个解(约53%)被MOQPSO所得解支配,MOQPSO算法的质量明显优于N‑MOQPSO算法。[0437] 针对大规模案例,MOQPSO算法的求解时间是N‑MOQPSO算法求解时间的约1.2倍,但其解的多样性指标DM增加了约2.1倍,且帕累托最优解的数量、解的质量等均优于N‑MOQPSO算法。从解的支配情况来看,N‑MOQPSO算法求得的解的QM为0.73,即N‑MOQPSO算法所求得的30个解中,有8个解(约27%)被MOQPSO所得解支配,MOQPSO算法的质量明显优于N‑MOQPSO算法。[0438] 以上分析结果表明,本算法设计的局部搜索、连续多点变异等策略在额外消耗相对较少且可接受的运算时间的前提下,能够提升粒子的探索能力,提升解的多样性,缩小与最优解之间的差距,提升求解质量。[0439] 表5混合MOQPSO与无策略MOQPSO性能指标对比[0440][0441] (1)提出了基于轨道区段状态的考虑复杂实际场景的铁路轨道修理计划编制优化模型TC‑RTMSOM。模型的创新性包括:[0442] 1)考虑了状态预测与维修计划编制之间的双向反馈及动态影响。既有基于状态修的研究通常采用一种割裂的模式:假定设备的维修时刻仅仅由一个确定性的设备状态预测结果所决定,即,先进行状态预测,进而基于固定的预测结果进行计划编制。而在考虑机会维修策略、集中修策略及多种复杂约束条件的场景下,设备的维修时刻成为不再由固定的设备状态这一个因素所确定的变量,且不同的维修时刻又会反过来对设备的劣化状态产生影响。本发明将轨道状态预测模型与维修计划编制模型整合在一个框架之内,实现了对二者之间的双向动态反馈的刻画。[0443] 2)引入了基于总成本的自适应机会主义维修策略及融合了多模式的集中修策略。本发明引入了基于多种设备、多种维修活动、多种施工模式的集中修策略,从机会维修的优势及劣势两方面进行权衡,能够更为准确的刻画复杂的实际铁路应用场景,提高了模型的实用性。[0444] 3)首次将天窗均衡和资源均衡引入轨道维修计划编制问题中。本发明设置了三个目标函数,在最常用的总成本目标函数的基础上,对天窗均衡和资源均衡这两个具有潜在应用价值的目标函数在轨道维修计划编制问题中的应用进行探索,通过案例分析揭示了他们在此类问题中的价值与作用。[0445] (2)设计了基于量子粒子群的融合多种策略的混合多目标优化算法。[0446] 基于QPSO的多目标优化算法在全局收敛性以及搜索能力方面具备显著的优势,其求解质量与求解效率均优于常用的进化多目标优化算法。然而MOQPSO尚未有统一的算法框架,本发明基于TC‑RTMSOP特性,针对该问题所具有的NP‑hard、大规模、多目标优化特性,设计了基于问题特性的约束处理规则,以提升模型的求解效率;融入了局部搜索策略与连续多点变异策略,以增强粒子的搜索能力,避免算法陷入局部最优;引入了用于保留精英个体信息的精英保留策略,以提高算法的求解质量。案例分析表明,提出的MOQPSO算法与Gurobi求解器相比在求解效率方面具有明显的优势;与NSGA‑Ⅱ算法相比,在求解质量方面具有明显优势,且随着问题规模的扩大,由于粒子具有较强的探索能力,MOQPSO算法在求解效率与求解质量两个方面的优势均得到展现。这应当是MOQPSO算法在轨道维修计划编制领域的首次应用。[0447] (3)实现了基于设备状态的高时间粒度的维修计划编制。[0448] 由于问题刻画的困难及问题规模导致的求解的困难,既有基于设备状态的维修计划编制模型多是以月、季度为决策步长的规划级模型,时间粒度较粗,难以体现轨道状态每一天的变化情况,确定最佳维修时机;少量精确到天窗的维修计划研究将月度规划模型与天窗计划模型分阶段考虑,难以达到整体最优。本发明实现了单阶段的精确到天窗的作业级维修计划编制,以“天”为预测周期建立高精度的个性化状态预测模型,同时以“天”为决策步长制定基于轨道状态的维修作业计划,以实现整体最优。借助于本发明所构建的具有较高求解效率的MOQPSO算法,支撑了对基于设备状态的高时间粒度的维修计划编制的探索。[0449] 本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。[0450] 本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

专利地区:北京

专利申请日期:2022-01-06

专利公开日期:2024-07-26

专利公告号:CN114330920B


以上信息来自国家知识产权局,如信息有误请联系我方更正!
电话咨询
读内容
搜本页
回顶部