专利名称:一种文字图像的阴影消除方法、装置及电子设备
专利类型:发明专利
专利申请号:CN202110171517.7
专利申请(专利权)人:瞬联软件科技(北京)有限公司
权利人地址:北京市朝阳区望京利泽中园101号启明国际大厦12层
专利发明(设计)人:邓元策
专利摘要:本发明公开了一种文字图像的阴影消除方法、装置及电子设备。该阴影消除方法包括如下步骤:将待处理的文字图像转化为第一灰度图像;对第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;对背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;对第一灰度图像进行背景增强,得到第二灰度图像;根据阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。本发明可以避免现有技术中阴影遮挡的部分的内容完全丢失的情况,提升了浏览和打印的阅读效果。
主权利要求:
1.一种文字图像的阴影消除方法,其特征在于包括如下步骤:将待处理的文字图像转化为第一灰度图像;
对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;
对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;
对第一灰度图像进行背景增强,得到第二灰度图像;
根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像,其中,对所述第一灰度图像进行直方图统计,包括如下子步骤:将所述第一灰度图像中的所有元素通过直方图统计的方式进行分布估计,形成分布估计序列 确定分布估计序列 中各元素对应的分布概率密度λk;其中, 其中λk为分布估计序列 的第k个元素对应的分布概率密度;θk为落入区间[(k‑1)*ρ,k*ρ]的取值数;Θ为所述第一灰度图像的元素个数;ρ为统计间隔,ρ=255/Z,Z为预先设置的统计区间总数;
根据各元素对应的分布概率密度λk,使用一阶差分和符号判断方法,得到一阶差分符号序列 其中 为 的第i个元素;其中,根据 中的元素 计算二阶差分极值标记序列 其中 为 第j个元素;
其中,
2.如权利要求1所述的阴影消除方法,其特征在于,在将待处理的文字图像转化为第一灰度图像之前,包括如下步骤:获得至少一幅文字图像,确定各幅文字图像的阴影区域信息;
根据各幅文字图像的阴影区域信息,从至少一幅文字图像中筛选得到待处理的文字图像。
3.如权利要求2所述的阴影消除方法,其特征在于,所述根据各幅文字图像的阴影区域信息,从至少一幅文字图像中筛选得到待处理的文字图像,包括如下子步骤:根据各幅文字图像的阴影区域面积,从至少一幅文字图像中筛选阴影区域面积大于预先设置的面积阈值的文字图像作为待处理的文字图像。
4.如权利要求2所述的阴影消除方法,其特征在于,所述根据各幅文字图像的阴影区域信息,从至少一幅文字图像中筛选得到待处理的文字图像,包括如下子步骤:根据各幅文字图像的阴影区域占整幅图像的面积比例,从至少一幅文字图像中筛选面积比例大于预先设置的比例阈值的文字图像作为待处理的文字图像。
5.如权利要求1所述的阴影消除方法,其特征在于,对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值,包括如下子步骤:对所述第一灰度图像进行直方图统计;
计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序;
提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;其中,n为预先设置的正整数。
6.如权利要求5所述的阴影消除方法,其特征在于,计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序,包括如下子步骤:确定分布估计序列 对应的凸高度序列H;其中,凸高度序列H的长度和分布估计序列的二阶差分极值标记序列 相同,且在序列 为零的位置上,凸高度序列H对应的值也为零;
对分布估计序列 中二阶差分极值标记序列非零位置上的元素 计算其对应的凸区间以及凸高度;其中,凸区间的计算包括左凸区间和右凸区间的计算;其中,左凸区间为极值位置到上一个更高极值所在位置或信号起始位置;右凸区间为极值位置到下一个更高极值所在位置或信号结束位置;
对于满足其对应位置上二阶差分极值序列的值非零的元素λt,0≤t≤Z‑2,其左凸区间的起始位置αL和右凸区间的结束位置αR的计算方式如下:确定满足其对应位置上二阶差分极值序列的值非零的元素λt的左凸区间和右凸区间分别为[αL,t]和[t,αR];
计算左凸区间和右凸区间内的最小值的较大值作为凸高度的参考点λref:其中, 算符为求序列ψ在区间[a,b]中的最小值;
确定元素λt对应的凸高度为:
Ηt=λt‑λref
对凸高度序列H进行排序。
7.如权利要求6所述的阴影消除方法,其特征在于,所述提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值,包括如下子步骤:从凸高度序列H中从大到小取出n个元素,对应的索引依次为{τ0,τ1,τ2,…,τn‑1},分别取出分布估计序列 对应位置上的值,确定第一灰度图像的背景灰度分割阈值μb和第一灰度图像的阴影区域内的文字灰度分割阈值μst;其中,其中,Δ为分割阈值的预设偏移量。
8.如权利要求7所述的阴影消除方法,其特征在于,所述对第一灰度图像进行背景增强,得到第二灰度图像,包括如下子步骤:确定背景增强并保留阴影区域内的文字的第二灰度图像 其中,g
其中 和 分别是第二灰度图像 和第一灰度图像D第i行第j列的元素。
9.如权利要求8所述的阴影消除方法,其特征在于还包括如下子步骤:对第一灰度图像进行阴影边界增强,得到第三灰度图像 其中,是第三灰度图像 第i行第j列的元素。
10.如权利要求9所述的阴影消除方法,其特征在于,对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示,包括如下子步骤:对第三灰度图像进行空间域的平滑滤波处理,之后进行二值化处理得到非阴影区域的掩膜表示;
对非阴影区域的掩膜表示的灰度值进行翻转,获得阴影区域的掩膜表示。
11.如权利要求10所述的阴影消除方法,其特征在于,所述根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像,包括如下子步骤:将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
12.一种文字图像的阴影消除装置,其特征在于包括:
灰度图像转化单元,用于将待处理的文字图像转化为第一灰度图像;
灰度分割阈值确定单元,用于对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;
掩膜表示确定单元,用于对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;
背景增强单元,用于对第一灰度图像进行背景增强,得到第二灰度图像;
区域融合单元,用于根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像,其中,对所述第一灰度图像进行直方图统计,包括如下子步骤:将所述第一灰度图像中的所有元素通过直方图统计的方式进行分布估计,形成分布估计序列 确定分布估计序列 中各元素对应的分布概率密度λk;其中, 其中λk为分布估计序列 的第k个元素对应的分布概率密度;θk为落入区间[(k‑1)*ρ,k*ρ]的取值数;
Θ为所述第一灰度图像的元素个数;ρ为统计间隔,ρ=255/Z,Z为预先设置的统计区间总数;
根据各元素对应的分布概率密度λk,使用一阶差分和符号判断方法,得到一阶差分符号序列 其中 为 的第i个元素;其中,根据 中的元素 计算二阶差分极值标记序列 其中 为 第j个元素;其中,
13.一种电子设备,其特征在于包括处理器和存储器,所述处理器与存储器耦合,用于执行所述存储器中的程序或指令,以使所述电子设备实现如权利要求1~11中任意一项所述的阴影消除方法。 说明书 : 一种文字图像的阴影消除方法、装置及电子设备技术领域[0001] 本发明涉及一种文字图像的阴影消除方法,同时涉及相应的阴影消除装置及电子设备,属于图像处理技术领域。背景技术[0002] 随着信息技术和数码相机、手机等拍摄设备的普及,在工作或者生活中,人们经常使用拍摄设备,如手机、平板电脑、数码相机等拍摄文字图像(如书本、报纸、文本打印件等),然后直接存储,或者打印出来、发邮件、通过即时通信软件等分享给他人让信息共享变的更加便利。[0003] 但是目前在使用拍摄设备进行拍摄的过程中,在某些场景下,可能因为拍摄设备自身或者其他物体遮挡的缘故,导致拍摄出来的文字图像明暗不一,甚至有大片的阴影。特别是夜间,在室内单一光源照明的情况下,拍摄设备在没有打开闪光灯的情况下,拍摄文字图像会出现图像的明暗不一,阴影遮挡等情况。典型情况,如图1所示,图示为晚上,在室内单一光源的情况下,用拍摄设备拍摄文本打印件所得文字图像,将该文字图像直接打印出的效果可能会如图2所示,被阴影遮挡的部分的内容完全丢失,这种文字图像较为影响浏览和打印出来的阅读效果,甚至因为无法识别,导致部分信息丢失。发明内容[0004] 本发明所要解决的技术问题在于提供一种文字图像的阴影消除方法。[0005] 本发明所要解决的另一技术问题在于提供一种文字图像的阴影消除装置及电子设备。[0006] 为了实现上述目的,本发明采用下述技术方案:[0007] 根据本发明实施例的第一方面,提供一种文字图像的阴影消除方法,包括:[0008] 将待处理的文字图像转化为第一灰度图像;[0009] 对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;[0010] 对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;[0011] 对第一灰度图像进行背景增强,得到第二灰度图像;[0012] 根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。[0013] 其中较优地,在将待处理的文字图像转化为第一灰度图像之前,包括:[0014] 获得至少一幅文字图像,确定各幅文字图像的阴影区域信息;[0015] 根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像。[0016] 其中较优地,所述根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像,包括:[0017] 根据各幅文字图像的阴影区域面积,从所述至少一幅文字图像中筛选阴影区域面积大于预先设置的面积阈值的文字图像作为待处理的文字图像。[0018] 其中较优地,所述根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像,包括:[0019] 根据各幅文字图像的阴影区域占整幅图像的面积比例,从所述至少一幅文字图像中筛选面积比例大于预先设置的比例阈值的文字图像作为待处理的文字图像。[0020] 其中较优地,对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值,包括:[0021] 对所述第一灰度图像进行直方图统计;[0022] 计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序;[0023] 提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;其中,n为预先设置的个数值。[0024] 其中较优地,对所述第一灰度图像进行直方图统计,包括:[0025] 将所述第一灰度图像中的所有元素通过直方图统计的方式进行分布估计,形成分布估计序列 确定分布估计序列 中各元素对应的分布概率密度λk;其中, 其中λk为分布估计序列 的第k个元素对应的分布概率密度;θk为落入区间[(k‑1)*ρ,k*ρ]的取值数;Θ为所述第一灰度图像的元素个数;ρ为统计间隔,ρ=255/Z,Z为预先设置的统计区间总数;[0026] 根据各元素对应的分布概率密度λk,使用一阶差分和符号判断方法,得到一阶差分符号序列 其中 为 的第i个元素,1D表示一阶差分;其中,[0027][0028] 根据 中的元素 计算二阶差分极值标记序列 其中 为 第j个元素,2D表示二阶差分;其中,[0029][0030] 其中较优地,计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序,包括:[0031] 确定分布估计序列 对应的凸高度序列H;其中,凸高度序列H的长度和分布估计序列 的二阶差分极值标记序列 相同,且在序列 为零的位置上,凸高度序列H对应的值也为零;[0032] 对分布估计序列 中二阶差分极值标记序列非零位置上的元素 计算其对应的凸区间以及凸高度;其中,凸区间的计算包括:左凸区间和右凸区间的计算;其中,左凸区间为极值位置到上一个更高极值所在位置或信号起始位置;右凸区间为极值位置到下一个更高极值所在位置或信号结束位置;[0033] 对于满足其对应位置上二阶差分极值标记序列的值非零的元素λt,0≤t≤Z‑2,其左凸区间的起始位置αL和右凸区间的结束位置αR的计算方式如下:[0034][0035] 确定元素λt的左凸区间和右凸区间分别为[αL,t]和[t,αR];[0036] 计算左凸区间和右凸区间内的最小值的较大值作为凸高度的参考点λref:[0037][0038] 其中, 算符为求序列ψ在区间[a,b]中的最小值;[0039] 确定元素λt对应的凸高度为:[0040] Ht=λt‑λref[0041] 对凸高度序列H进行排序。[0042] 其中较优地,所述提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值,包括:[0043] 从凸高度序列H中从大到小取出n个元素,对应的索引依次为{τ0,τ1,τ2,…,τn‑1},分别取出分布估计序列 对应位置上的值,确定第一灰度图像的背景灰度分割阈值μb和第一灰度图像的阴影区域内的文字灰度分割阈值μst;其中,[0044][0045] 其中,Δ为分割阈值的预设偏移量。[0046] 其中较优地,所述对第一灰度图像进行背景增强,得到第二灰度图像,包括:[0047] 确定背景增强并保留阴影区域内的文字的第二灰度图像 其中,[0048]g[0049] 其中 和 分别是第二灰度图像 和第一灰度图像D 第i行第j列的元素。[0050] 其中较优地,所述方法还包括:[0051] 对第一灰度图像进行阴影边界增强,得到第三灰度图像 其中,[0052][0053] 其中 是第三灰度图像 第i行第j列的元素。[0054] 其中较优地,对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示,包括:[0055] 对第三灰度图像进行空间域的平滑滤波处理,之后进行二值化处理得到非阴影区域的掩膜表示;[0056] 对非阴影区域的掩膜表示的灰度值进行翻转,获得阴影区域的掩膜表示。[0057] 其中较优地,所述根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像,包括:[0058] 将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。[0059] 根据本发明实施例的第二方面,提供一种文字图像的阴影消除装置,包括:[0060] 灰度图像转化单元,用于将待处理的文字图像转化为第一灰度图像;[0061] 灰度分割阈值确定单元,用于对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;[0062] 掩膜表示确定单元,用于对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;[0063] 背景增强单元,用于对第一灰度图像进行背景增强,得到第二灰度图像;[0064] 区域融合单元,用于根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。[0065] 根据本发明实施例的第三方面,提供一种电子设备,包括处理器,所述处理器与存储器耦合,用于执行所述存储器中的程序或指令,以使所述电子设备实现如上述第一方面所述的方法。[0066] 根据本发明实施例的第四方面,提供一种计算机可读存储介质,所述可读存储介质上存储有指令,当其在计算机上运行时,使得所述计算机执行如上述第一方面所述的方法。[0067] 根据本发明实施例的第五方面,提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行如上述第一方面所述的方法。[0068] 本发明所提供的文字图像的阴影消除方法、装置及电子设备,能够将待处理的文字图像转化为第一灰度图像;对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;对第一灰度图像进行背景增强,得到第二灰度图像;根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。通过本发明实施例,可以获得阴影消除后的文字图像,避免现有技术中阴影遮挡的部分的内容完全丢失的情况,提升了浏览或打印的阅读效果。附图说明[0069] 图1为用拍摄设备拍摄文件所得图像的示意图;[0070] 图2为将拍摄设备拍摄文件所得图像进行打印所得效果图像示意图;[0071] 图3为本发明实施例提供的一种文字图像的阴影消除方法的流程图一;[0072] 图4为本发明实施例的应用环境示意图;[0073] 图5为本发明实施例提供的一种文字图像的阴影消除方法的流程图二;[0074] 图6为本发明实施例中的直方图统计曲线的凸高度计算示例示意图;[0075] 图7为采用本发明实施例进行阴影区域消除的结果示意图;[0076] 图8为本发明实施例提供的一种文字图像的阴影消除装置的结构示意图。具体实施方式[0077] 下面结合附图和具体实施例对本发明的技术内容做进一步的详细说明。[0078] 为了避免当前通过拍摄设备拍摄图像时,在存在阴影遮挡情况下,所得到的图像存在一大块阴影,影像最终图像的质量,特别是将图像在电子设备上进行浏览以及将图像打印时,图像清晰度较差,甚至造成图形、文字等的丢失。为了克服上述问题,如图3所示,本发明实施例提供一种文字图像的阴影消除方法,包括:[0079] 步骤S101:将待处理的文字图像转化为第一灰度图像。[0080] 步骤S102:对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值。[0081] 步骤S103:对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示。[0082] 步骤S104:对第一灰度图像进行背景增强,得到第二灰度图像。[0083] 步骤S105:根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。[0084] 为了使本领域的技术人员更好的了解本发明,下面结合具体的应用环境,列举一个更为详细的实施例。如图4所示,用户手持手机201想要拍摄一个文件202,但是其背对光源203,因此用户的手机201挡住了光源203,在文件202上出现了一个手机201留下的阴影204。以下本发明实施例将提供一种文字图像的阴影消除方法,来针对如图4所示的场景。[0085] 此处,如图5所示,本发明实施例提供一种文字图像的阴影消除方法,包括:[0086] 步骤S301:获得至少一幅文字图像,确定各幅文字图像的阴影区域信息。[0087] 此处,需要说明的是,执行本文字图像的阴影消除方法的电子设备可以是图像采集装置,例如手机、照相机等,还可以是后端处理装置,例如用于图像处理的计算机,服务器等,但不仅局限于此。而确定各幅文字图像的阴影区域信息可以是通过文字图像的灰度信息实现的,一般情况下,若文字图像不存在阴影区域,则整幅图像的灰度分布主要集中在两个部分,且两者灰度值差异较大,灰度值较大区域为背景区域,灰度值较小区域为文字区域。当灰度分布明显集中在多个部分时,可以确定该文字图像存在阴影区域。[0088] 步骤S302:根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像。[0089] 此处,该步骤S302可以采用如下任一方式实现,例如:[0090] 根据各幅文字图像的阴影区域面积,从所述至少一幅文字图像中筛选阴影区域面积大于预先设置的面积阈值的文字图像作为待处理的文字图像。即在某些文字图像的阴影区域面积较小时(例如小于面积阈值),该较小的阴影区域可能并不影响文字信息的浏览和打印,则无需进行处理。而在某些文字图像的阴影区域面积较大时(例如大于面积阈值),该较大的阴影区域可能影响文字信息的浏览和打印,则将其作为待处理的文字图像。这样可以避免全量的文字图像都进行处理,而造成的浪费计算资源的问题。[0091] 或者,根据各幅文字图像的阴影区域占整幅图像的面积比例,从所述至少一幅文字图像中筛选面积比例大于预先设置的比例阈值的文字图像作为待处理的文字图像。即在某些文字图像的阴影区域面积较小时(例如阴影区域占整幅图像的面积比例小于比例阈值),该较小的阴影区域可能并不影响文字信息的浏览和打印,则无需进行处理。而在某些文字图像的阴影区域面积较大时(例如阴影区域占整幅图像的面积比例大于比例阈值),该较大的阴影区域可能影响文字信息的浏览和打印,则将其作为待处理的文字图像。这样可以避免全量的文字图像都进行处理,而造成的浪费计算资源的问题。[0092] 步骤S303:将待处理的文字图像转化为第一灰度图像。[0093] 此处,该步骤S303可以采用如下方式实现,例如:[0094] 首先该待处理的文字图像为Do,一般情况下,设定待处理的文字图像对应数据矩o阵D 的维度为m×n×3,其中m和n分别为图像的高度和宽度对应的像素点的个数。一般而o言,待处理的文字图像D 由r/g/b三个颜色通道的数据表示,其维度都为m×n。按下式将彩色图像转化为第一灰度图像:[0095] Dg=0.2989*R+0.5870*G+0.1140*B[0096] 其中,R、G、B为原彩色图像Do中的红色、绿色以及蓝色分量,其矩阵各个元素取值和原彩色图像关系如下[0097][0098] 其中r(i,j),g(i,j)和b(i,j)分别表示R/G/B矩阵中的第i行第j列的元素。[0099] 步骤S304:对第一灰度图像进行直方图统计。[0100] 此处,该步骤S304可以采用如下方式实现:[0101] 将第一灰度图像中的所有元素通过直方图统计的方式进行分布估计,形成分布估计序列 确定分布估计序列 中各元素对应的分布概率密度λk;其中, 其中λk为分布估计序列 的第k个元素对应的分布概率密度;θk为落入区间[(k‑1)*ρ,k*ρ]的取值数;gΘ为所述第一灰度图像D 的元素个数,满足Θ=m×n;ρ为统计间隔,ρ=255/Z,Z为预先设置的统计区间总数,例如可以为125;[0102] 根据各元素对应的分布概率密度λk,使用一阶差分和符号判断方法,得到一阶差分符号序列 其中 为 的第i个元素;其中,[0103][0104] 根据 中的元素 计算二阶差分极值标记序列 其中 为 第j个元素;其中,[0105][0106] 步骤S305:计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序。[0107] 此处,该步骤S305可以采用如下方式实现:[0108] 确定分布估计序列 对应的凸高度序列H;其中,凸高度序列H的长度和分布估计序列 的二阶差分极值标记序列 相同,且在序列 为零的位置上,凸高度序列H对应的值也为零。[0109] 对分布估计序列 中二阶差分极值标记序列非零位置上的元素 计算其对应的凸区间以及凸高度;其中,凸区间的计算包括:左凸区间和右凸区间的计算;其中,左凸区间为极值位置到上一个更高极值所在位置或信号起始位置;右凸区间为极值位置到下一个更高极值所在位置或信号结束位置;[0110] 对于满足其对应位置上二阶差分极值序列的值非零的元素λt,0≤t≤Z‑2,其左凸区间的起始位置αL和右凸区间的结束位置αR的计算方式如下:[0111][0112] 确定满足其对应位置上二阶差分极值序列的值非零的元素λt的左凸区间和右凸区间分别为[αL,t]和[t,αR];[0113] 计算左凸区间和右凸区间内的最小值的较大值作为凸高度的参考点λref:[0114][0115] 其中, 算符为求序列ψ在区间[a,b]中的最小值;[0116] 确定元素λt对应的凸高度为:[0117] Ht=λt‑λref[0118] 对凸高度序列H进行排序。[0119] 步骤S306:提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值。[0120] 其中,n为预先设置的个数值,推荐n取值为4。[0121] 此处,该步骤S306可以采用如下方式实现:[0122] 从凸高度序列H中从大到小取出n个元素,对应的索引依次为{τ0,τ1,τ2,…,τn‑1},例如当n=4时,对应的索引依次为{τ0,τ1,τ2,τ3},分别取出分布估计序列 对应位置上的值,确定第一灰度图像的背景灰度分割阈值μb和第一灰度图像的阴影区域内的文字灰度分割阈值μst;其中,[0123][0124] 其中,Δ为分割阈值的预设偏移量,属于可调参数,例如可以取值50。[0125] 步骤S307:对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示。[0126] 此处,该步骤S307可以采用如下方式实现:[0127] 为了提出出更平滑的阴影区域,对第三灰度图像 进行空间域的平滑滤波处理,之后进行二值化处理得到非阴影区域的掩膜表示 其中,[0128][0129] 其中, 为二维卷积运算符;P为预先设置的空间滤波的滤波器系数,维度σ×ω,本实施例中主要用来平滑边缘和消除区域内的“孤岛”灰度尖峰,所以一般可以使用归一化的幺矩阵,即幺矩阵需要乘以1/(σ×ω)。滤波器系数矩阵的维度为可调参数,本实施例中一般使用σ=ω=10, 为图像二值化算子;[0130] 对非阴影区域的掩膜表示 的灰度值进行翻转,获得阴影区域的掩膜表示其中,[0131][0132] 其中1表示和 同维度的幺矩阵。[0133] 步骤S308:对第一灰度图像进行背景增强,得到第二灰度图像。[0134] 此处,该步骤S308可以采用如下方式实现:[0135] 确定背景增强并保留阴影区域内的文字的第二灰度图像 其中,[0136]g[0137] 其中 和 分别是第二灰度图像 和第一灰度图像D 第i行第j列的元素。[0138] 步骤S309:对第一灰度图像进行阴影边界增强,得到第三灰度图像[0139] 其中,[0140][0141] 其中 是第三灰度图像 第i行第j列的元素。[0142] 步骤S310:根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。[0143] 此处,该步骤S310可以采用如下方式实现:[0144] 将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像 其中,[0145][0146] 通过上述步骤S301至步骤S310,本方案实施例进行了仿真处理,过程如下:[0147] 如图1和图4所示,在晚上,室内单一光源且手机没有打开闪光灯的情况下,图像上存在大量阴影区域。阴影区域内的文字已经难以辨认。如果直接对原图进行二值化,如图2所示,阴影区域内的文字信息完全丢失。根据本实施例,首先对灰度化的图像进行直方图统计。然后计算每个灰度区间的凸高度,如图6所示,提取凸高度最大的4个灰度区间作为后续阴影区域文字和背景的灰度参考值。然后通过灰度值的阈值分割,空间平滑滤波和二值化,分别获得阴影区域和非阴影区域的掩膜表示。最后基于掩膜表示将背景增强的阴影区域和原灰度图像的非阴影区域进行融合,并通过二值化均衡整体的灰度平衡,最终得到祛除阴影后的文字图像。通过本方法实施例处理后,如图7所示,阴影区域基本被消除,并且文字没有被明显破坏,文字比图2更加清晰可见。[0148] 另外,如图8所示,本发明实施例还提供一种文字图像的阴影消除装置,包括:[0149] 灰度图像转化单元41,用于将待处理的文字图像转化为第一灰度图像。[0150] 灰度分割阈值确定单元42,用于对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值。[0151] 掩膜表示确定单元43,用于对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示。[0152] 背景增强单元44,用于对第一灰度图像进行背景增强,得到第二灰度图像。[0153] 区域融合单元45,用于根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。[0154] 需要强调的是,本发明中,文字图像不是狭义的字面表达意思,其包括但不限于具有文字、符号、数字等各种各样信息的图像,只要出现明暗不一,阴影遮挡等情况的图像均适用于本发明的阴影消除方法。[0155] 另外,本发明实施例还提供一种电子设备,包括处理器,所述处理器与存储器耦合,用于执行所述存储器中的程序或指令,以使所述电子设备实现如上述图3或图5所述的方法。[0156] 另外,本发明实施例还提供一种计算机可读存储介质,所述可读存储介质上存储有指令,当其在计算机上运行时,使得所述计算机执行如上述图3或图5所述的方法。[0157] 另外,本发明实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行如上述图3或图5所述的方法。[0158] 本发明所提供的文字图像的阴影消除方法、装置及电子设备,能够将待处理的文字图像转化为第一灰度图像;对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;对第一灰度图像进行背景增强,得到第二灰度图像;根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。通过本发明实施例,可以获得阴影消除后的文字图像,避免现有技术中阴影遮挡的部分的内容完全丢失的情况,提升了浏览和打印的阅读效果。[0159] 以上对本发明所提供的文字图像的阴影消除方法、装置及电子设备进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将属于本发明专利权的保护范围。
专利地区:北京
专利申请日期:2021-02-08
专利公开日期:2024-07-26
专利公告号:CN113012059B