可左右滑动选省市

一种Resnet计算Veil的单幅图像去雾方法

更新时间:2024-07-06
一种Resnet计算Veil的单幅图像去雾方法 专利申请类型:发明专利;
地区:陕西-西安;
源自:西安高价值专利检索信息库;

专利名称:一种Resnet计算Veil的单幅图像去雾方法

专利类型:发明专利

专利申请号:CN202110353315.4

专利申请(专利权)人:西安理工大学
权利人地址:陕西省西安市碑林区金花南路5号

专利发明(设计)人:张杰,王静宜,康孟飞,姚佳浩,向坤兰,罗雄彪,潘志庚

专利摘要:本发明公开了一种Resnet计算Veil的单幅图像去雾方法,包括两个主要步骤:形成雾度图像;架构深度残差神经网络,输出无雾图像。本发明提出的方法的主要贡献是将深度学习方法应用于单图像去雾,从而使其提出的算法效率更高,运行时间更少,从而使其可应用于外科内窥镜等多个领域,并通常用于视觉系统。本发明首先寻找一种有效的方法来分析雾度图像,同时提供一种消除雾度的有效方法。然后训练一个神经网络,用来执行预测大气光幕。根据从深度图和大气光等数据集中的可用地面真相元数据中恢复的大气光幕来训练神经网络,可以减少计算时间,并生成与局部估计和透射图细化无关的输出,同时保留图像属性分散。

主权利要求:
1.一种Resnet计算Veil的单幅图像去雾方法,其特征在于,具体按照以下步骤实施:步骤1、从数据集中直接获取图像的深度矩阵,提取所述图像的地面真实元数据,并从所述地面真实元数据中得到大气光幕A和深度,所述数据集是纽约大学深度数据集;
步骤2、为了最大程度的降低估计传输图函数中光散射常数k对除雾过程的影响,采用暗通道和软消光方法对深度矩阵进行局部估计,以测试验证数据集中图像的地面真实元数据;
步骤3、通过图像的地面真实元数据生成大气光幕,利用所得大气光幕与数据集中图片合成雾度图像;具体按照以下步骤实施:步骤3.1、将大气光幕定义为大气光和投射图的函数,定义式如下:步骤3.2、根据光源的光线向观察者扩散的过程,式(1)简化为下式:式(2)中,β表示光的散射系数,随着观察者与被摄物体之间的距离增加,大气光也会随之增加, 会减小;z表示图像的深度包含投射率信息,用作图像与观察者之间距离的度量;
步骤3.3、距离z增大,直接投射T减小,为除去对投射图的依赖,将场景投射率转化为观察者与场景辐射度之间的距离d的函数:式(3)中,k是光散射中的常数,u和v是像素的坐标;
步骤3.4、将公式(3)带入公式(1)中可重新将大气光幕A(u,v)定义为深度图的函数:步骤3.5、参考Koschmieder’slaw定律用一般模型来表示的物理成像模型:式(1)中,I(u,v)表示有雾图像,J(u,v)表示无雾图像, 表示大气光或天空亮度,T(u,v)表示投射图像;
将公式(5)带入公式(6)后,满足以下改进的表达式:
根据数据集中的图像和计算所得的大气光幕,合成雾度图像;
步骤4、搭建并训练深度残差神经网络;具体包括:
步骤4.1、输入深度残差神经网络的图片重塑为尺寸620*460;
步骤4.2、搭建深度残差神经网络,采用深度残差神经网络结构,下采样直接由一个2步长的卷积层来完成,网络以一个平均池化层和具有softmax的完全连接层终止;加权层总数为19层;
深度残差神经网络结构为,第一层包含3个尺寸为620×460的滤镜;第二层包含3个步幅和207×154尺寸的3个批处理和归一化层;第三层和第4层均包含3个尺寸为52×69的滤镜;批处理的第5层,尺寸规格化为23×18;第6、7和8层通过3个尺寸为69×52的滤镜进行上采样调整大小;
步骤4.3、将8个卷积层用于训练过程,通过具有0.9动量的批量梯度体面方法训练网络,全部数据分批训练,每次200张图片,图像大小为620×460像素,初始学习率为0.001,每
8个周期减少0.1;通过最小化地面真实元数据生成的大气光幕与网络在预测层上预测的光幕之间的损失函数,优化训练程序;
步骤5、随机选择一张真实世界的图片或者合成的图像放入步骤4所得的深度残差神经网络中,用于预测大气光幕,根据雾度和场景恢复,合成无雾图像。
2.根据权利要求1所述的一种Resnet计算Veil的单幅图像去雾方法其特征在于,所述步骤5具体按照以下步骤实施:步骤5.1、向深度残差神经网络输入步骤3所得的雾度图像,预测得到大气光幕,对所述大气光幕进行高斯滤波处理,处理大气光幕在计算过程中产生的噪声;
步骤5.2、将雾度图像减去步骤5.1所得的大气光幕,再适当调整雾度图像的alpha数值,合成后达到最佳视觉效果,得到最终的去雾图像。 说明书 : 一种Resnet计算Veil的单幅图像去雾方法技术领域[0001] 本发明属于数字图像处理技术领域,涉及一种Resnet计算Veil的单幅图像去雾方法。背景技术[0002] 当前图像处理和人工智能的发展迅猛,针对最小化内存管理和基本计算时间方面的计算代价的研究,已经成为一种日益增长的趋势。这是由于当前的很多计算机视觉应用,在执行任务的过程中都需要清晰的视觉,例如:医学成像和计算机辅助干预,以及将目标检测应用于自动系统的实例和语义分割系统。这些系统利用某些视觉结构来执行重要任务,这些任务在执行的过程中很大程度上取决于大气中的能见度质量,这意味着要有清晰的视野以避免故障。因此,雾霾多的环境可能会给物体检测带来很大的问题。显然,在地球上不存在没有烟或雾的地方,这意味着要实现有效的物体检测和清晰的视野,除雾是必不可少的。[0003] 由于在许多任务中对视野清晰度有较高的需求,图像去雾在许多视觉任务取得显著效果。现有的几种图像去雾方法都表现出良好的性能,但是都需要很长的运行时间。这是由于执行去雾任务之前,算法依赖于传输图,空气光照估计和传输图的时间细化等参数的计算所造成的。我们引入与传输图无关的去雾算法,从而不需要为去雾算法来估计更多的参数。除此之外,我们提出了一种深度残差神经网络,该神经网络采用内部跳跃链接和反馈链接的方式,显著地加快训练时间。发明内容[0004] 本发明的目的是提供一种Resnet计算Veil的单幅图像去雾方法,具有算法效率更高,运行时间更少的特点。[0005] 本发明所采用的技术方案是,一种Resnet计算Veil的单幅图像去雾方法,具体按照以下步骤实施:[0006] 步骤1、从数据集中直接获取图像的深度矩阵,提取图像的地面真实元数据,并从地面真实元数据中得到大气光A和深度,数据集是纽约大学深度数据集;[0007] 步骤2、为了最大程度的降低估计传输图函数中光散射常数K对除雾过程的影响,采用暗通道和软消光方法对深度矩阵进行局部估计,以测试验证数据集中图像的地面真实元数据;[0008] 步骤3、通过图像的地面真实元数据生成大气光幕,利用所得大气光幕与数据集中图片合成雾度图像;[0009] 步骤4、搭建并训练深度残差神经网络;[0010] 步骤5、随机选择一张真实世界的图片或者合成的图像放入步骤4所得的深度残差神经网络中,用于预测大气光幕,根据雾度和场景恢复,合成无雾图像。[0011] 本发明的特点还在于:[0012] 步骤3具体按照以下步骤实施:[0013] 步骤3.1、将大气光幕定义为大气光和投射图的函数,定义式如下:[0014] A(u,v)=A∞(1‑T(u,v))(1)[0015] 步骤3.2、根据光源的光线向观察者扩散的过程,如图1所示,式(1)简化为下式:[0016] A=A∞(1‑e‑βz)(2)[0017] 式(2)中,β表示光的散射系数,随着观察者与被摄物体之间的距离增加,大气光也‑βz会随之增加,e 会减小;z表示图像的深度包含信息,z用作图像与观察者之间距离的度量;[0018] 步骤3.3、距离z增大,直接投射T减小,为除去对投射图的依赖,将场景投射率转化为观察者与场景辐射度之间的距离d的函数:[0019] T(u,v)=e‑kd(u,v)(3)[0020] 式(3)中,K是光散射中的常数,u和v是像素的坐标;[0021] 步骤3.4、将公式(3)带入公式(1)中可重新将大气光幕A(u,v)定义为深度图的函数:[0022] A(u,v)=A∞(1‑e‑kd(u,v))(4)[0023][0024] 步骤3.5、参考Koschmieder’slaw定律用一般模型来表示的物理成像模型:[0025] I(u,v)=J(u,v)T(u,v)+A∞(1‑T(u,v))(6)[0026] 式(1)中,I(u,v)表示有雾图像,J(u,v)表示无雾图像,A∞表示大气光或天空亮度,T(u,v)表示投射图像;[0027] 将公式(5)带入公式(6)后,满足以下改进的表达式:[0028][0029] 根据数据集中的图像和计算所得的大气光幕,合成雾度图像。[0030] 步骤4具体按照提下步骤实施:[0031] 步骤4.1、输入深度残差神经网络的图片重塑为尺寸620*460;[0032] 步骤4.2、搭建深度残差神经网络,采用深度残差神经网络结构,下采样直接由一个2步长的卷积层来完成,网络以一个平均池化层和具有softmax的完全连接层终止;加权层总数为19层,训练程序网络构架如图2所示;[0033] 步骤4.3、将8个卷积层用于训练过程,通过具有0.9动量的批量梯度体面方法训练网络,使用了200张图像的批处理大小,图像大小为620X460像素,初始学习率为0.001,每8个周期减少0.1;通过最小化地面真实元数据生成的大气光幕与网络在预测层上预测的光幕之间的损失函数,优化训练程序。[0034] 步骤4.2的深度残差神经网络结构为,第一层包含3个尺寸为620X460的滤镜;第二层包含3个步幅和207X154尺寸的3个批处理和归一化层;第三层和第4层包含3个尺寸为52X69的滤镜;批处理的第5层,尺寸规格化为23X18;第6、7和8层正在调整大小,上采样层也包含3个尺寸为69X52的滤镜;[0035] 步骤5具体按照以下步骤实施:[0036] 步骤5.1向深度残差神经网络输入步骤3所得的雾度图像,预测得到大气光幕,对大气光幕进行高斯滤波处理,处理大气光幕在计算过程中产生的噪声;[0037] 步骤5.2、将雾度图像减去步骤5.1所得的大气光幕,再适当调雾度图像其alpha数值,合成后达到最佳视觉效果,得到最终的去雾图像。[0038] 本发明的有益效果是:[0039] 1.本发明提供一种有效的方法来分析雾度图像,同时提供一种消除雾度的有效方法,以改善可见度并保持深度完整性。[0040] 2.训练一个神经网络,该神经网络可执行预测大气光幕的任务,同时消除对透射图估计的依赖。[0041] 3.确保此网络在质量,计算要求和计算速度方面都可与最先进的算法相提并论,并具有最小的依赖性。附图说明[0042] 图1是本发明一种Resnet计算Veil的单幅图像去雾方法的光线散射图;[0043] 图2是本发明一种Resnet计算Veil的单幅图像去雾方法的深度残差神经网络结构图。具体实施方式[0044] 下面结合附图和具体实施方式对本发明进行详细说明。[0045] 一种Resnet计算Veil的单幅图像去雾方法,具体按照以下步骤实施:[0046] 步骤1、从数据集中直接获取图像的深度矩阵,提取图像的地面真实元数据,并从地面真实元数据中得到大气光A和深度,数据集是纽约大学深度数据集;[0047] 步骤2、为了最大程度的降低估计传输图函数中光散射常数K对除雾过程的影响,采用暗通道和软消光方法对深度矩阵进行局部估计,以测试验证数据集中图像的地面真实元数据;[0048] 步骤3、通过图像的地面真实元数据生成大气光幕,利用所得大气光幕与数据集中图片合成雾度图像;[0049] 步骤4、搭建并训练深度残差神经网络;[0050] 步骤5、随机选择一张真实世界的图片或者合成的图像放入步骤4所得的深度残差神经网络中,用于预测大气光幕,根据雾度和场景恢复,合成无雾图像。[0051] 步骤3具体按照以下步骤实施:[0052] 步骤3.1、根据X.Luo等提出的一种基于视觉的手术视野除雾技术,其中,将大气光幕定义为大气光和投射图的函数,定义式如下:[0053] A(u,v)=A∞(1‑T(u,v))(1)[0054] 步骤3.2、根据Y.Y.Schechner提出的一种基于偏振的多图像雾化方法,该方法称雾霾形成的主要原因是空气偏振,指的是根据光源的光线向观察者扩散的过程,如图1所示,式(1)简化为下式:[0055] A=A∞(1‑e‑βz)(2)[0056] 式(2)中,β表示光的散射系数,随着观察者与被摄物体之间的距离增加,大气光也‑βz会随之增加,e 会减小;z表示图像的深度包含诸如投射率之类的信息,可以用作图像与观察者之间距离的度量;[0057] 步骤3.3、如图1所示,直线光线代表来自光源(太阳)的光线,被大气中朝向观察者的粒子隔开。虚线表示从对象R辐射的光,该光受沿直达直接投射T的视线的色散影响。距离z增大,直接投射T减小,为除去对投射图的依赖,将场景投射率转化为观察者与场景辐射度之间的距离d的函数:[0058] A(u,v)=e‑kd(u,v)(3)[0059] 式(3)中,K是光散射中的常数,u和v是像素的坐标;[0060] 步骤3.4、将公式(3)带入公式(1)中可重新将大气光幕A(u,v)定义为深度图的函数:[0061] A(u,v)=A∞(1‑e‑kd(u,v))(4)[0062][0063] 步骤3.5、参考Koschmieder’slaw定律用一般模型来表示的物理成像模型:[0064] I(u,v)=J(u,v)T(u,v)+A∞(1‑T(u,v))(6)[0065] 式(1)中,I(u,v)表示有雾图像,J(u,v)表示无雾图像,A∞表示大气光或天空亮度,T(u,v)表示投射图像;[0066] 将公式(5)带入公式(6)后,满足以下改进的表达式:[0067][0068] 根据数据集中的图像和计算所得的大气光幕,合成雾度图像。[0069] 步骤4具体按照提下步骤实施:[0070] 步骤4.1、输入深度残差神经网络的图片重塑为尺寸620*460;[0071] 步骤4.2、搭建深度残差神经网络,采用深度残差神经网络结构,下采样直接由一个2步长的卷积层来完成,网络以一个平均池化层和具有softmax的完全连接层终止;加权层总数为19层;训练程序网络架构如图2所示。[0072] 步骤4.3、将8个卷积层用于训练过程,通过具有0.9动量的批量梯度体面方法训练网络,使用了200张图像的批处理大小,图像大小为620X460像素,批处理大小可根据实际情况进行调整,初始学习率为0.001,每8个周期减少0.1;通过最小化地面真实元数据生成的大气光幕与网络在预测层上预测的光幕之间的损失函数,优化训练程序。[0073] 步骤4.2的深度残差神经网络结构为,第一层包含3个尺寸为620X460的滤镜;第二层包含3个步幅和207X154尺寸的3个批处理和归一化层;第三层和第4层包含3个尺寸为52X69的滤镜;批处理的第5层,尺寸规格化为23X18;第6、7和8层正在调整大小,上采样层也包含3个尺寸为69X52的滤镜;[0074] 步骤5具体按照以下步骤实施:[0075] 步骤5.1向深度残差神经网络输入步骤3所得的雾度图像,预测得到大气光幕,对大气光幕进行高斯滤波处理,处理大气光幕在计算过程中产生的噪声;[0076] 步骤5.2、将雾度图像减去步骤5.1所得的大气光幕,再适当调雾度图像其alpha数值,合成后达到最佳视觉效果,得到最终的去雾图像。

专利地区:陕西

专利申请日期:2021-03-31

专利公开日期:2024-06-18

专利公告号:CN113689343B

电话咨询
读内容
搜本页
回顶部