可左右滑动选省市

一种数据对称性的处理方法及系统发明专利

更新时间:2024-10-01
一种数据对称性的处理方法及系统发明专利 专利申请类型:发明专利;
地区:广东-深圳;
源自:深圳高价值专利检索信息库;

专利名称:一种数据对称性的处理方法及系统

专利类型:发明专利

专利申请号:CN202210433155.9

专利申请(专利权)人:深圳市东晟数据有限公司
权利人地址:广东省深圳市南山区粤海街道麻岭社区高新中二道2号深圳软件园1栋503

专利发明(设计)人:涂明,杨晶亮,张杰,周嘉宜

专利摘要:本发明公开了一种数据对称性的处理方法及系统,方法包括如下步骤:S1:提取报文中的一组数据对(s,d);S2:对步骤S1输入的数据s,通过第一次计算得到计算值rs,对于S1中的数据d,通过第一次计算得到计算值rd;S3:对步骤S2得到的rs和rd进行第二次计算,得到新的数据对;S4:将步骤S3得到的新的数据对进行第三次计算,得到结果rh。本发明技术方案支持使用CRC16、CRC32等任一种非对称性的hash算法,提高计算结果的离散性,实现对IPV6地址数据的对称输出。

主权利要求:
1.一种数据对称性的处理方法,其特征在于,包括如下步骤:
S1:提取报文中的一组数据对(s,d);
S2:对步骤S1输入的数据s,通过第一次计算得到计算值rs,作为第一输入值,对于步骤S1输入的数据d,通过第一次计算得到计算值rd,作为第二输入值;
S3:对步骤S2得到的第一输入值rs和第二输入值rd进行第二次计算,得到新的数据对;
具体地,所述第二次计算的公式为“第一输入值/(第二输入值+1)‑1”,若第二次计算结果为正数,则得到的新的数据对为(rs,rd),若第二次计算结果为负数,则得到的新的数据对为(rd,rs);
S4:将步骤S3得到的新的数据对进行第三次计算,得到结果rh;
所述第一次计算和第三次计算均采用以下算法中的任意一种:CRC16计算、CRC32计算、MD5SUM计算、SHA计算。
2.如权利要求1所述的数据对称性的处理方法,其特征在于,所述报文包括上行报文和下行报文,所述上行报文中提取的数据对为(s1,d1),所述下行报文中提取的数据对为(s2,d2),其中,s1等于d2,d1等于s2。
3.如权利要求1所述的数据对称性的处理方法,其特征在于,所述数据对来源于报文的一对元数据,包括smac/dmac、SIPV6/DIPV6。
4.一种数据对称性的处理系统,其特征在于,包括:
Mapping映射模块,用于报文中的一组数据对(s,d)分别进行计算,得到第一输入值rs和第二输入值rd;
结果校验模块,用于接收数据对(s,d)、第一输入值rs和第二输入值rd,并对第一输入值rs和第二输入值rd进行计算,得到新的数据对;具体地,计算公式为“第一输入值/(第二输入值+1)‑1”,若第二次计算结果为正数,则得到的新的数据对为(rs,rd),若第二次计算结果为负数,则得到的新的数据对为(rd,rs);
数据处理模块,对结果校验模块计算输出的数据进行再次计算,输出最终结果rh;
Mapping映射模块和数据处理模块的计算均采用以下算法中的任意一种:CRC16计算、CRC32计算、MD5SUM计算、SHA计算。
5.如权利要求4所述的数据对称性的处理系统,其特征在于,所述报文包括上行报文和下行报文,所述上行报文中提取的数据对为(s1,d1),所述下行报文中提取的数据对为(s2,d2),其中,s1等于d2,d1等于s2。
6.如权利要求4所述的数据对称性的处理系统,其特征在于,所述数据对来源于报文的一对元数据,包括smac/dmac、SIPV6/DIPV6。 说明书 : 一种数据对称性的处理方法及系统技术领域[0001] 本发明涉及数据通信技术领域,特别涉及一种数据对称性的处理方法及系统。背景技术[0002] 在云计算、互联网、人工智能等产业蓬勃发展的带动下,网络流量如雨后春笋般迅速增加。伴随着5G时代的到来,与4G相比,其数据传输速度更高、可连接终端数量更多,数据产生量增速将进一步加快,进一步加剧了网络运营商、网络安全行业、智能服务推荐等行业处理天量数据的难度;同时由于连接终端呈现出指数级的成倍的增长,大量的IPV6地址取代了之前接近枯竭的IPV4的地址;从而导致如何确保IPV6地址的数据的同源同宿成为系统处理能力的一个关键因素。在此背景下,如何在数据通信领域,保证数据的一致性和完整性,进一步提升系统的整体性能至关重要;[0003] 在数据通信行业中,进行大容量流量过滤分析时,希望同属于一条流的上行报文和下行报文能从同一个接口输出,即同一条流的上行报文和下行报文能取得相同的hash值;目前常见的计算方式是采用XOR16的对称式的计算表达式进行计算,其原理是采用了XOR计算的交换律,即s^d=d^s;这种计算方式在计算的数据呈现某种规律(如s以一定的间隔递增,而d以同样的间隔递减)变化时,计算的值变化范围很小,离散性很差,特别是对于局域网内的128bit的IPV6地址而言,IPV6地址的全局前缀和子网都一样时,IPV6地址的接口ID呈现规律变化时,计算的值会局限在一个很小的范围内,离散性很差,加剧了数据冲突。[0004] 如图1所示,常见的IPV6报文的计算hash的处理方式如下:[0005] 对于一组数据对(s,d),通过XOR计算后,得到计算值rh;[0006] 对于交换后的数据对(s,d),通过XOR计算后,由于XOR算法本身具备对称性,因此得到的值肯定是rh;但XOR计算的结果的离散性较差。[0007] 综上,在对IPV6地址采用XOR16这种对称式的hash算法,当计算因子呈现规律变化时,计算的hash结果离散性很差,hash冲突特别严重。[0008] 因此,现有技术存在缺陷,需要改进。发明内容[0009] 本发明的主要目的是提出一种数据对称性的处理方法及系统,旨在支持使用CRC16、CRC32等任一种非对称性的hash算法,提高计算结果的离散性,实现对IPV6地址数据的对称输出。[0010] 为实现上述目的,本发明提出的一种数据对称性的处理方法,包括如下步骤:[0011] S1:提取报文中的一组数据对(s,d);[0012] S2:对步骤S1输入的数据s,通过第一次计算得到计算值rs,作为第一输入值,对于步骤S1输入的数据d,通过第一次计算得到计算值rd,作为第二输入值;[0013] S3:对步骤S2得到的第一输入值rs和第二输入值rd进行第二次计算,得到新的数据对;具体地,所述第二次计算的公式为“第一输入值/(第二输入值+1)‑1”,若第二次计算结果为正数,则得到的新的数据对为(rs,rd),若第二次计算结果为负数,则得到的新的数据对为(rd,rs);[0014] S4:将步骤S3得到的新的数据对进行第三次计算,得到结果rh。[0015] 优选地,所述报文包括上行报文和下行报文,所述上行报文中提取的数据对为(s1,d1),所述下行报文中提取的数据对为(s2,d2),其中,s1等于d2,d1等于s2。[0016] 优选地,所述数据对来源于报文的一对元数据,包括smac/dmac、SIPV6/DIPV6、一段具备对称意义的任意长度的字段。[0017] 优选地,所述第一次计算和第三次计算均采用包括CRC16计算、CRC32计算、MD5SUM计算、SHA计算。[0018] 为实现上述目的,本发明还提出一种一种数据对称性的处理系统,包括:[0019] Mapping映射模块,用于报文中的一组数据对(s,d)分别进行计算,得到第一输入值rs和第二输入值rd;[0020] 结果校验模块,用于接收数据对(s,d)、第一输入值rs和第二输入值rd,并对第一输入值rs和第二输入值rd进行计算,得到新的数据对;具体地,计算公式为“第一输入值/(第二输入值+1)‑1”,若第二次计算结果为正数,则得到的新的数据对为(rs,rd),若第二次计算结果为负数,则得到的新的数据对为(rd,rs);[0021] 数据处理模块,对结果校验模块计算输出的数据进行再次计算,输出最终结果rh。[0022] 优选地,所述报文包括上行报文和下行报文,所述上行报文中提取的数据对为(s1,d1),所述下行报文中提取的数据对为(s2,d2),其中,s1等于d2,d1等于s2。[0023] 优选地,所述数据对来源于报文的一对元数据,包括smac/dmac、SIPV6/DIPV6、一段具备对称意义的任意长度的字段。[0024] 优选地,Mapping映射模块和数据处理模块的计算均采用包括CRC16计算、CRC32计算、MD5SUM计算、SHA计算。[0025] 与现有技术相比,本发明的有益效果是:通过采用非对称性的算法和装置,不仅实现了一组数据对得到相同的计算结果,同时保证了不同的数据对得到不同的结果,而且也保证了计算结果的离散性。附图说明[0026] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。[0027] 图1为常见的IPV6报文的计算hash的处理方式示意图;[0028] 图2为本发明处理系统示意图;[0029] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式[0030] 本实施例提出的一种数据对称性的处理方法,包括如下步骤:[0031] S1:提取报文中的一组数据对(s,d);[0032] S2:对步骤S1输入的数据s,通过第一次计算得到计算值rs,作为第一输入值,对于步骤S1输入的数据d,通过第一次计算得到计算值rd,作为第二输入值;[0033] S3:对步骤S2得到的第一输入值rs和第二输入值rd进行第二次计算,得到新的数据对;具体地,所述第二次计算的公式为“第一输入值/(第二输入值+1)‑1”,若第二次计算结果为正数,则得到的新的数据对为(rs,rd),若第二次计算结果为负数,则得到的新的数据对为(rd,rs);[0034] S4:将步骤S3得到的新的数据对进行第三次计算,得到结果rh。[0035] 进一步地,所述报文包括上行报文和下行报文,所述上行报文中提取的数据对为(s1,d1),所述下行报文中提取的数据对为(s2,d2),其中,s1等于d2,d1等于s2。[0036] 进一步地,所述数据对来源于报文的一对元数据,包括smac/dmac、SIPV6/DIPV6、一段具备对称意义的任意长度的字段。[0037] 进一步地,所述第一次计算和第三次计算均采用包括CRC16计算、CRC32计算、MD5SUM计算、SHA计算。[0038] 本实施例提出的一种数据对称性的处理系统,包括:[0039] Mapping映射模块,用于报文中的一组数据对(s,d)分别进行计算,得到第一输入值rs和第二输入值rd;[0040] 结果校验模块,用于接收数据对(s,d)、第一输入值rs和第二输入值rd,并对第一输入值rs和第二输入值rd进行计算,得到新的数据对;具体地,计算公式为“第一输入值/(第二输入值+1)‑1”,若第二次计算结果为正数,则得到的新的数据对为(rs,rd),若第二次计算结果为负数,则得到的新的数据对为(rd,rs);[0041] 数据处理模块,对结果校验模块计算输出的数据进行再次计算,输出最终结果rh。[0042] 进一步地,所述报文包括上行报文和下行报文,所述上行报文中提取的数据对为(s1,d1),所述下行报文中提取的数据对为(s2,d2),其中,s1等于d2,d1等于s2。[0043] 进一步地,所述数据对来源于报文的一对元数据,包括smac/dmac、SIPV6/DIPV6、一段具备对称意义的任意长度的字段。[0044] 进一步地,所述数据对来源于报文的一对元数据,包括smac/dmac、SIPV6/DIPV6、一段具备对称意义的任意长度的字段。[0045] 以下,通过具体实施例进行说明:[0046] 对于上行报文,取一组数据对(s1,d1),如报文的smac和dmac;[0047] 对于输入数据s1,通过Mapping映射模块后,得到计算值rs1,作为第一输入值;[0048] 对于输入数据d1,通过Mapping映射模块后,得到计算数据rd1,作为第二输入值;[0049] 原始输入值s1和d1以及通过Mapping映射模块后的计算值rs1和rd1,输入到结果校验模块,结果校验模块对第一输入值rs1和第二输入值rd1进行计算,即进行“第一输入值/(第二输入值+1)-1”的计算,若计算结果为正数,则得到一组数据对(rs1,rd1),如计算结果为负数,则得到另一组数据对(rd1,rs1);[0050] 将结果校验模块得到的结果输入到数据处理模块,经过数据处理模块进行MD5SUM计算后输出对应的结果rh1;[0051] 对于下行报文取一组数据对(s2,d2),则必存在如下关系,s2等于d1,d2等于s1;[0052] 对于输入数据s2,通过Mapping映射模块后,得到计算数据rs2,作为第一输入值;[0053] 对于输入数据d2,通过Mapping映射模块后,得到计算数据rd2,作为第二输入值;[0054] 原始输入值s2和d2以及通过Mapping映射模块后的计算值rs2和rd2,输入到结果校验模块,结果校验模块对第一输入值rs2和第二输入值rd2进行计算,即进行“第一输入值/(第二输入值+1)-1”的计算,若计算结果为正数,则得到一组数据对(rs2,rd2),如计算结果为负数,则得到另一组数据对(rd2,rs2);[0055] 结合上述数据的关系,(d2,s2)和(s1,d1)是等效的。[0056] 将结果校验模块得到的结果输入到数据处理模块,经过数据处理模块进行MD5SUM计算后输出对应的结果rh1;[0057] 对于非(a,b)或(b,a)对的数据,经过MD5SUM运算后,将得到非rh1的值,实现了计算值分布的离散性。[0058] 以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

专利地区:广东

专利申请日期:2022-04-22

专利公开日期:2024-07-26

专利公告号:CN114826559B


以上信息来自国家知识产权局,如信息有误请联系我方更正!
电话咨询
读内容
搜本页
回顶部