专利名称:一种数据处理方法及系统
专利类型:发明专利
专利申请号:CN202011384200.3
专利申请(专利权)人:深圳市鹰硕技术有限公司
权利人地址:广东省深圳市宝安区新安三路建达工业区1栋二楼202室
专利发明(设计)人:卢启伟,张淮清
专利摘要:本发明提供一种数据处理方法及系统,其中,方法包括:获取第一用户的数据处理请求;解析数据处理请求,获取第一用户输入的第一笔顺信息和/或经过OCR识别的第一识别信息;将第一笔顺信息和/或第一识别信息输入预先建立的第一验证模型中对数据处理请求进行验证;当验证通过时,再次解析数据处理请求,获取源数据库和目标数据库;基于目标数据库,确定第二用户;向第二用户发送数据处理问询,并接收第二用户对于数据处理问询的反馈信息;当反馈信息为同意时,基于目标数据库中数据对源数据库中数据进行处理。本发明的数据处理方法,实现各个大数据教育平台之间的数据互通。
主权利要求:
1.一种数据处理方法,其特征在于,包括:
获取第一用户的数据处理请求;
解析所述数据处理请求,获取所述第一用户输入的第一笔顺信息和/或经过OCR识别的第一识别信息;
将所述第一笔顺信息和/或所述第一识别信息输入预先建立的第一验证模型中对所述数据处理请求进行验证;
当验证通过时,再次解析所述数据处理请求,获取源数据库和目标数据库;
基于所述目标数据库,确定第二用户;
向所述第二用户发送数据处理问询,并接收所述第二用户对于所述数据处理问询的反馈信息;
当所述反馈信息为同意时,基于所述目标数据库中数据对所述源数据库中数据进行处理;
其中,所述第一用户具有所述源数据库的一级权限,所述第二用户具有所述目标数据库的一级权限;
所述将所述第一笔顺信息和/或所述第一识别信息输入预先建立的第一验证模型中对所述数据处理请求进行验证,包括:提取所述第一笔顺信息和/或所述第一识别信息的特征值,将所述特征值代入预先建立的神经网络模型中,获得验证因子,查询预设的验证表,当所述验证因子存在与所述验证表中时,所述数据处理请求验证通过;
或,
基于所述第一笔顺信息和/或所述第一识别信息构建验证向量,将所述验证向量与预先建立的验证库中的标准向量进行匹配,当所述验证向量与所述标准向量的匹配度大于预设匹配值时,所述数据处理请求验证通过;
其中,所述验证向量与所述标准向量的匹配度计算公式如下:其中,Pq为所述验证向量与所述验证库中第q个所述标准向量的匹配度;n为所述验证向量和所述标准向量的维度;ai,q为第q个所述标准向量的第i维数据值;bi为所述验证向量的第i维数据值;
所述第一笔顺信息包括:笔画的类型、各个笔画类型之间的顺序、各个笔画的参数信息其中一种或多种结合;
所述各个笔画的参数信息包括:起点、终点、各个笔画的所述起点与所述终点中间的预设数量的采样点之间的位置关系参数,和/或,起点、终点、各个笔画的所述起点与所述终点中间的预设数量的采样点的笔迹力度参数;
所述第一识别信息包括:文字、图形、符号其中一种或多种结合;
所述基于所述目标数据库中数据对所述源数据库中数据进行处理,包括:建立镜像数据库,将所述源数据库中数据复制到所述镜像数据库中;
依次获取所述镜像数据库中源数据,计算获取的所述源数据与所述目标数据库中的目标数据的相似度,将相似度大于预设的第一阈值的所述目标数据与所述源数据关联;
和,
当所述镜像数据库中的所述源数据都被获取过一次后,提取与所述源数据的相似度都小于等于预设的第二阈值的所述目标数据,采用预设的评定步骤对所述目标数据进行评定,当评定通过时,复制所述目标数据至所述镜像数据库;
其中,采用预设的评定步骤对所述目标数据进行评定,包括:当所述目标数据为试题数据时,获取当前接入所述源数据库的用户信息;
基于所述用户信息对所述用户进行分组,在各个分组中按预设的第一挑选规则挑选至少一个评价用户;
将所述目标数据发送至所述评价用户;
接收所述评价用户对所述目标数据的评价及做题的结果;
基于所述做题结果,确定各组评价用户的错误率;
基于所述评价及所述错误率,计算所述目标数据的评价值,计算公式如下:其中,Z为所述评价值,cj为第j个分组的错误率;αj为第j个分组的预设权重;m为分组的组数;M为所述评价用户的数量;dl为第l个所述评价用户的所述评价经过评价模型确定的评价值;βl是给第l个所述评价用户配置的权重值;δ1为关于所述错误率的相关系数;δ2为关于所述评价的相关系数;
当所述评价值大于预设的评价阈值时,所述目标数据通过评定;
在数据处理完成后,对参与评定的用户的配置的权重值进行调整,调整公式如下:其中,D'为调整后的权重值;D为调整前的权重值;d为根据评价用户的评价与评定结果的影响确定,当为正影响时,取值为1,当为负影响时,取值为‑1;γ表示预设调整值,γ0表示预设的正调整与调整的差异值; Th为第h个评价用户从接收到目标数据到做出评价的时间,即当前调整权重的用户的从接收到目标数据到做出评价的时间。
2.如权利要求1所述的数据处理方法,其特征在于,还包括:在接收所述反馈信息之前,还接收所述第二用户输入的第二笔顺信息和/或经过OCR识别的第二识别信息;
将所述第二笔顺信息和/或所述第二识别信息输入预先建立的第二验证模型中对所述反馈信息进行验证;
当验证通过时,接收所述反馈信息,否则,拒绝接收所述反馈信息并返回异常信息至所述第一用户。
3.如权利要求2所述的数据处理方法,其特征在于,还包括:在获取所述第一用户的所述数据处理请求之前,获取所述第一用户的第一定位信息,判断所述第一定位信息对应的第一位置是否位于第一预设区域;
当位于所述第一预设区域时,接收所述第一用户的所述数据处理请求,否则,拒绝所述第一用户的所述数据处理请求;
和/或,
在接收所述第二用户的所述反馈信息之前,获取所述第二用户的第二定位信息;
判断所述第二定位信息对应的第二位置是否位于第二预设区域;
当位于所述第二预设区域时,接收所述第二用户的所述反馈信息;否则,拒绝接收所述第二用户的所述反馈信息;
和/或,
确定所述第一位置和所述第二位置的相对位置关系,当所述相对位置关系符合预设的第一规则时,接收所述第二用户的所述反馈信息;否则,拒绝接收所述第二用户的所述反馈信息。
4.一种数据处理系统,其特征在于,包括:
第一获取模块,用于获取第一用户的数据处理请求;
第一解析模块,用于解析所述数据处理请求,获取所述第一用户输入的第一笔顺信息和/或经过OCR识别的第一识别信息;
第一验证模块,用于将所述第一笔顺信息和/或所述第一识别信息输入预先建立的第一验证模型中对所述数据处理请求进行验证;当验证通过时,再次解析所述数据处理请求,获取源数据库和目标数据库;
第一确定模块,用于基于所述目标数据库,确定第二用户;
第一问询模块,用于向所述第二用户发送数据处理问询,并接收所述第二用户对于所述数据处理问询的反馈信息;
数据处理模块,用于当所述反馈信息为同意时,基于所述目标数据库中数据对所述源数据库中数据进行处理;
其中,所述第一用户具有所述源数据库的一级权限,所述第二用户具有所述目标数据库的一级权限;
所述第一验证模块执行如下操作:
提取所述第一笔顺信息和/或所述第一识别信息的特征值,将所述特征值代入预先建立的神经网络模型中,获得验证因子,查询预设的验证表,当所述验证因子存在与所述验证表中时,所述数据处理请求验证通过;
或,
基于所述第一笔顺信息和/或所述第一识别信息构建验证向量,将所述验证向量与预先建立的验证库中的标准向量进行匹配,当所述验证向量与所述标准向量的匹配度大于预设匹配值时,所述数据处理请求验证通过;
其中,所述验证向量与所述标准向量的匹配度计算公式如下:其中,Pq为所述验证向量与所述验证库中第q个所述标准向量的匹配度;n为所述验证向量和所述标准向量的维度;ai,q为第q个所述标准向量的第i维数据值;bi为所述验证向量的第i维数据值;
所述第一笔顺信息包括:笔画的类型、各个笔画类型之间的顺序、各个笔画的参数信息其中一种或多种结合;
所述各个笔画的参数信息包括:起点、终点、各个笔画的所述起点与所述终点中间的预设数量的采样点之间的位置关系参数,和/或,起点、终点、各个笔画的所述起点与所述终点中间的预设数量的采样点的笔迹力度参数;
所述第一识别信息包括:文字、图形、符号其中一种或多种结合;
所述数据处理模块执行如下操作:
建立镜像数据库,将所述源数据库中数据复制到所述镜像数据库中;
依次获取所述镜像数据库中源数据,计算获取的所述源数据与所述目标数据库中的目标数据的相似度,将相似度大于预设的第一阈值的所述目标数据与所述源数据关联;
和,
当所述镜像数据库中的所述源数据都被获取过一次后,提取与所述源数据的相似度都小于等于预设的第二阈值的所述目标数据,采用预设的评定步骤对所述目标数据进行评定,当评定通过时,复制所述目标数据至所述镜像数据库;
其中,采用预设的评定步骤对所述目标数据进行评定,包括:当所述目标数据为试题数据时,获取当前接入所述源数据库的用户信息;
基于所述用户信息对所述用户进行分组,在各个分组中按预设的第一挑选规则挑选至少一个评价用户;
将所述目标数据发送至所述评价用户;
接收所述评价用户对所述目标数据的评价及做题的结果;
基于所述做题结果,确定各组评价用户的错误率;
基于所述评价及所述错误率,计算所述目标数据的评价值,计算公式如下:其中,Z为所述评价值,cj为第j个分组的错误率;αj为第j个分组的预设权重;m为分组的组数;M为所述评价用户的数量;dl为第l个所述评价用户的所述评价经过评价模型确定的评价值;βl是给第l个所述评价用户配置的权重值;δ1为关于所述错误率的相关系数;δ2为关于所述评价的相关系数;
当所述评价值大于预设的评价阈值时,所述目标数据通过评定;
在数据处理完成后,对参与评定的用户的配置的权重值进行调整,调整公式如下:其中,D'为调整后的权重值;D为调整前的权重值;d为根据评价用户的评价与评定结果的影响确定,当为正影响时,取值为1,当为负影响时,取值为‑1;γ表示预设调整值,γ0表示预设的正调整与调整的差异值; Th为第h个评价用户从接收到目标数据到做出评价的时间,即当前调整权重的用户的从接收到目标数据到做出评价的时间。
5.如权利要求4所述的数据处理系统,其特征在于,还包括:第二获取模块,用于在接收所述反馈信息之前,还接收所述第二用户输入的第二笔顺信息和/或经过OCR识别的第二识别信息;
第二验证模块,用于将所述第二笔顺信息和/或所述第二识别信息输入预先建立的第二验证模型中对所述反馈信息进行验证;当验证通过时,接收所述反馈信息,否则,拒绝接收所述反馈信息并返回异常信息至所述第一用户。
6.如权利要求5所述的数据处理系统,其特征在于,还包括:第一定位模块,用于在获取所述第一用户的所述数据处理请求之前,获取所述第一用户的第一定位信息,第一判断模块,用于判断所述第一定位信息对应的第一位置是否位于第一预设区域;
当位于所述第一预设区域时,接收所述第一用户的所述数据处理请求,否则,拒绝所述第一用户的所述数据处理请求;
和/或,
第二定位模块,用于在接收所述第二用户的所述反馈信息之前,获取所述第二用户的第二定位信息;
第二判断模块,用于判断所述第二定位信息对应的第二位置是否位于第二预设区域;
当位于所述第二预设区域时,接收所述第二用户的所述反馈信息;否则,拒绝接收所述第二用户的所述反馈信息;
和/或,
第三判断模块,用于确定所述第一位置和所述第二位置的相对位置关系,当所述相对位置关系符合预设的第一规则时,接收所述第二用户的所述反馈信息;否则,拒绝接收所述第二用户的所述反馈信息。 说明书 : 一种数据处理方法及系统技术领域[0001] 本发明涉及数据库管理技术领域,特别涉及一种数据处理方法及系统。背景技术[0002] 目前,大数据是继云计算、物联网和移动互联网之后,新一代信息技术的产物,正在成为信息技术的新热点、新方向,将对人类的生产与生活产生巨大影响。把握大数据发展方向,开发大数据教育平台,有利于提高教育质量,基于上述目的,各个教育机构及部门相应地建立了多个大数据教育平台,但是,因为建立大数据教育平台的负责单位不同,各个大数据教育平台之间的数据并不互通,形成信息孤岛。发明内容[0003] 本发明目的之一在于提供了一种数据处理方法,实现各个大数据教育平台之间的数据互通。[0004] 本发明实施例提供的一种数据处理方法,包括:[0005] 获取第一用户的数据处理请求;[0006] 解析数据处理请求,获取第一用户输入的第一笔顺信息和/或经过OCR识别的第一识别信息;[0007] 将第一笔顺信息和/或第一识别信息输入预先建立的第一验证模型中对数据处理请求进行验证;[0008] 当验证通过时,再次解析数据处理请求,获取源数据库和目标数据库;[0009] 基于目标数据库,确定第二用户;[0010] 向第二用户发送数据处理问询,并接收第二用户对于数据处理问询的反馈信息;[0011] 当反馈信息为同意时,基于目标数据库中数据对源数据库中数据进行处理;[0012] 其中,第一用户具有源数据库的一级权限,第二用户具有目标数据库的一级权限。[0013] 优选的,数据处理方法,还包括:[0014] 在接收反馈信息之前,还接收第二用户输入的第二笔顺信息和/或经过OCR识别的第二识别信息;[0015] 将第二笔顺信息和/或第二识别信息输入预先建立的第二验证模型中对反馈信息进行验证;[0016] 当验证通过时,接收反馈信息,否则,拒绝接收反馈信息并返回异常信息至第一用户。[0017] 优选的,数据处理方法,还包括:[0018] 在获取第一用户的数据处理请求之前,获取第一用户的第一定位信息,[0019] 判断第一定位信息对应的第一位置是否位于第一预设区域;[0020] 当位于第一预设区域时,接收第一用户的数据处理请求,否则,拒绝第一用户的数据处理请求;[0021] 和/或,[0022] 在接收第二用户的反馈信息之前,获取第二用户的第二定位信息;[0023] 判断第二定位信息对应的第二位置是否位于第二预设区域;[0024] 当位于第二预设区域时,接收第二用户的反馈信息;否则,拒绝接收第二用户的反馈信息;[0025] 和/或,[0026] 确定第一位置和第二位置的相对位置关系,当相对位置关系符合预设的第一规则时,接收第二用户的反馈信息;否则,拒绝接收第二用户的反馈信息。[0027] 优选的,将第一笔顺信息和/或第一识别信息输入预先建立的第一验证模型中对数据处理请求进行验证,包括:[0028] 提取第一笔顺信息和/或第一识别信息的特征值,将特征值代入预先建立的神经网络模型中,获得验证因子,查询预设的验证表,当验证因子存在与验证表中时,数据处理请求验证通过;[0029] 或,[0030] 基于第一笔顺信息和/或第一识别信息构建验证向量,将验证向量与预先建立的验证库中的标准向量进行匹配,当验证向量与标准向量的匹配度大于预设匹配值时,数据处理请求验证通过;[0031] 其中,验证向量与标准向量的匹配度计算公式如下:[0032][0033] 其中,Pq为验证向量与验证库中第q个标准向量的匹配度;n为验证向量和标准向量的维度;ai,q为第q个标准向量的第i维数据值;bi为验证向量的第i维数据值;[0034] 第一笔顺信息包括:笔画的类型、各个笔画类型之间的顺序、各个笔画的参数信息其中一种或多种结合;[0035] 各个笔画的参数信息包括:起点、终点、各个笔画的起点与终点中间的预设数量的采样点之间的位置关系参数,和/或,起点、终点、各个笔画的起点与终点中间的预设数量的采样点的笔迹力度参数;[0036] 第一识别信息包括:文字、图形、符号其中一种或多种结合。[0037] 优选的,基于目标数据库中数据对源数据库中数据进行处理,包括:[0038] 建立镜像数据库,将源数据库中数据复制到镜像数据库中;[0039] 依次获取镜像数据库中源数据,计算获取的源数据与目标数据库中的目标数据的相似度,将相似度大于预设的第一阈值的目标数据与源数据关联;[0040] 和/或,[0041] 当镜像数据库中的源数据都被获取过一次后,提取与源数据的相似度都小于等于预设的第二阈值的目标数据,采用预设的评定步骤对目标数据进行评定,当评定通过时,复制目标数据至镜像数据库;[0042] 其中,采用预设的评定步骤对目标数据进行评定,包括:[0043] 当目标数据为试题数据时,获取当前接入源数据库的用户的用户信息;[0044] 基于用户信息对用户进行分组,在各个分组中按预设的第一挑选规则挑选至少一个评价用户;[0045] 将目标数据发送至评价用户;[0046] 接收评价用户对目标数据的评价及做题的结果;[0047] 基于做题结果,确定各组评价用户的错误率;[0048] 基于评价及错误率,计算目标数据的评价值,计算公式如下:[0049][0050] 其中,Z为评价值,cj为第j个分组的错误率;αj为第j个分组的预设权重;m为分组的组数;M为评价用户的数量;dl为第l个评价用户的评价经过评价模型确定的评价值;βl是给第l个评价用户配置的权重值;δ1为关于错误率的相关系数;δ2为关于评价的相关系数;[0051] 当评价值大于预设的评价阈值时,目标数据通过评定。[0052] 本发明还提供一种数据处理系统,包括:[0053] 第一获取模块,用于获取第一用户的数据处理请求;[0054] 第一解析模块,用于解析数据处理请求,获取第一用户输入的第一笔顺信息和/或经过OCR识别的第一识别信息;[0055] 第一验证模块,用于将第一笔顺信息和/或第一识别信息输入预先建立的第一验证模型中对数据处理请求进行验证;当验证通过时,再次解析数据处理请求,获取源数据库和目标数据库;[0056] 第一确定模块,用于基于目标数据库,确定第二用户;[0057] 第一问询模块,用于向第二用户发送数据处理问询,并接收第二用户对于数据处理问询的反馈信息;[0058] 数据处理模块,用于当反馈信息为同意时,基于目标数据库中数据对源数据库中数据进行处理;[0059] 其中,第一用户具有源数据库的一级权限,第二用户具有目标数据库的一级权限。[0060] 优选的,数据处理系统,还包括:[0061] 第二获取模块,用于在接收反馈信息之前,还接收第二用户输入的第二笔顺信息和/或经过OCR识别的第二识别信息;[0062] 第二验证模块,用于将第二笔顺信息和/或第二识别信息输入预先建立的第二验证模型中对反馈信息进行验证;当验证通过时,接收反馈信息,否则,拒绝接收反馈信息并返回异常信息至第一用户。[0063] 优选的,数据处理系统,还包括:[0064] 第一定位模块,用于在获取第一用户的数据处理请求之前,获取第一用户的第一定位信息,[0065] 第一判断模块,用于判断第一定位信息对应的第一位置是否位于第一预设区域;当位于第一预设区域时,接收第一用户的数据处理请求,否则,拒绝第一用户的数据处理请求;[0066] 和/或,[0067] 第二定位模块,用于在接收第二用户的反馈信息之前,获取第二用户的第二定位信息;[0068] 第二判断模块,用于判断第二定位信息对应的第二位置是否位于第二预设区域;当位于第二预设区域时,接收第二用户的反馈信息;否则,拒绝接收第二用户的反馈信息;[0069] 和/或,[0070] 第三判断模块,用于确定第一位置和第二位置的相对位置关系,当相对位置关系符合预设的第一规则时,接收第二用户的反馈信息;否则,拒绝接收第二用户的反馈信息。[0071] 优选的,第一验证模块执行如下操作:[0072] 提取第一笔顺信息和/或第一识别信息的特征值,将特征值代入预先建立的神经网络模型中,获得验证因子,查询预设的验证表,当验证因子存在与验证表中时,数据处理请求验证通过;[0073] 或,[0074] 基于第一笔顺信息和/或第一识别信息构建验证向量,将验证向量与预先建立的验证库中的标准向量进行匹配,当验证向量与标准向量的匹配度大于预设匹配值时,数据处理请求验证通过;[0075] 其中,验证向量与标准向量的匹配度计算公式如下:[0076][0077] 其中,Pq为验证向量与验证库中第q个标准向量的匹配度;n为验证向量和标准向量的维度;ai,q为第q个标准向量的第i维数据值;bi为验证向量的第i维数据值;[0078] 第一笔顺信息包括:笔画的类型、各个笔画类型之间的顺序、各个笔画的参数信息其中一种或多种结合;[0079] 各个笔画的参数信息包括:起点、终点、各个笔画的起点与终点中间的预设数量的采样点之间的位置关系参数,和/或,起点、终点、各个笔画的起点与终点中间的预设数量的采样点的笔迹力度参数;[0080] 第一识别信息包括:文字、图形、符号其中一种或多种结合。[0081] 优选的,数据处理模块执行如下操作:[0082] 建立镜像数据库,将源数据库中数据复制到镜像数据库中;[0083] 依次获取镜像数据库中源数据,计算获取的源数据与目标数据库中的目标数据的相似度,将相似度大于预设的第一阈值的目标数据与源数据关联;[0084] 和/或,[0085] 当镜像数据库中的源数据都被获取过一次后,提取与源数据的相似度都小于等于预设的第二阈值的目标数据,采用预设的评定步骤对目标数据进行评定,当评定通过时,复制目标数据至镜像数据库;[0086] 其中,采用预设的评定步骤对目标数据进行评定,包括:[0087] 当目标数据为试题数据时,获取当前接入源数据库的用户的用户信息;[0088] 基于用户信息对用户进行分组,在各个分组中按预设的第一挑选规则挑选至少一个评价用户;[0089] 将目标数据发送至评价用户;[0090] 接收评价用户对目标数据的评价及做题的结果;[0091] 基于做题结果,确定各组评价用户的错误率;[0092] 基于评价及错误率,计算目标数据的评价值,计算公式如下:[0093][0094] 其中,Z为评价值,cj为第j个分组的错误率;αj为第j个分组的预设权重;m为分组的组数;M为评价用户的数量;dl为第l个评价用户的评价经过评价模型确定的评价值;βl是给第l个评价用户配置的权重值;δ1为关于错误率的相关系数;δ2为关于评价的相关系数;[0095] 当评价值大于预设的评价阈值时,目标数据通过评定。[0096] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。[0097] 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。附图说明[0098] 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:[0099] 图1为本发明实施例中一种数据处理方法的示意图;[0100] 图2为本发明实施例中又一种数据处理方法的示意图;[0101] 图3为本发明实施例中一种数据处理系统的示意图。具体实施方式[0102] 以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。[0103] 本发明实施例提供了一种数据处理方法,如图1所示,包括:[0104] 步骤S1:获取第一用户的数据处理请求;[0105] 步骤S2:解析数据处理请求,获取第一用户输入的第一笔顺信息和/或经过OCR识别的第一识别信息;[0106] 步骤S3:将第一笔顺信息和/或第一识别信息输入预先建立的第一验证模型中对数据处理请求进行验证;[0107] 当验证通过时,再次解析数据处理请求,获取源数据库和目标数据库;[0108] 步骤S4:基于目标数据库,确定第二用户;[0109] 步骤S5:向第二用户发送数据处理问询,并接收第二用户对于数据处理问询的反馈信息;[0110] 步骤S6:当反馈信息为同意时,基于目标数据库中数据对源数据库中数据进行处理;[0111] 其中,第一用户具有源数据库的一级权限,第二用户具有目标数据库的一级权限。[0112] 上述技术方案的工作原理及有益效果为:[0113] 为了解决数据孤岛问题,可以采用数据互通的方式,为了保证数据互通的安全及有效性,可以采用如下方案:具有源数据库(第一个数据平台)的一级权限的第一用户发出数据互通的数据处理请求,首先基于第一用户的第一笔顺信息和/或第一识别信息对第一用户的身份进行验证,确定是第一用户本人发起的数据处理请求,其中第一识别信息是基于OCR(OpticalCharacterRecognition,光学字符识别)识别技术识别出的文字、图形、字符等;当验证通过时,说明数据处理请求为有效,再次解析数据处理请求,确定需要数据互通的源数据库和目标数据库(第二个数据平台);根据目标数据库的信息确定具有该数据库一级权限的第二用户,可以根据预存的权限信息表,查询获取;向第二用户发送数据处理问询,在第二用户同意后,将源数据库与目标数据库进行数据互通,通过授权互通的方式,即解决了数据孤岛问题,并且保证数据平台的数据的安全性。其中,一级权限为数据库的最高权限,可以实现删除、修改等数据库操作。[0114] 本发明的数据处理方法,实现各个大数据教育平台之间的数据互通。[0115] 在一个实施例中,数据处理方法,如图2所示,还包括:[0116] 步骤S11:在接收反馈信息之前,还接收第二用户输入的第二笔顺信息和/或经过OCR识别的第二识别信息;[0117] 步骤S12:将第二笔顺信息和/或第二识别信息输入预先建立的第二验证模型中对反馈信息进行验证;[0118] 当验证通过时,接收反馈信息,否则,拒绝接收反馈信息并返回异常信息至第一用户。[0119] 上述技术方案的工作原理及有益效果为:[0120] 为了进一步保证,数据互通的安全性,还需对第二用户进行验证,通过第二用户的第二笔顺信息和/或第二识别信息经过第二验证模型进行验证。[0121] 在一个实施例中,数据处理方法,还包括:[0122] 在获取第一用户的数据处理请求之前,获取第一用户的第一定位信息,[0123] 判断第一定位信息对应的第一位置是否位于第一预设区域;[0124] 当位于第一预设区域时,接收第一用户的数据处理请求,否则,拒绝第一用户的数据处理请求;[0125] 和/或,[0126] 在接收第二用户的反馈信息之前,获取第二用户的第二定位信息;[0127] 判断第二定位信息对应的第二位置是否位于第二预设区域;[0128] 当位于第二预设区域时,接收第二用户的反馈信息;否则,拒绝接收第二用户的反馈信息;[0129] 和/或,[0130] 确定第一位置和第二位置的相对位置关系,当相对位置关系符合预设的第一规则时,接收第二用户的反馈信息;否则,拒绝接收第二用户的反馈信息。[0131] 上述技术方案的工作原理及有益效果为:[0132] 通过确认第一用户的定位信息是否在第一预设区域,实现对第一用户发起数据处理请求的时机的限制,可以进一步保证数据互通的安全性;例如大数据平台是以省/市/县这种模式建立的,第一预设区域可以对应为大数据平台对应的省/市/县的具体地理位置;即当大数据平台的数据对应某县时,第一用户只有在该县境内才能发起数据处理请求;同理,第二用户在同意第一用户的数据处理请求时,也必须采用定位信息是否在第二预设区域的限制;此外,还可以设置一个限制规则,第一预设区域和第二预设区域为源数据库和目标数据库共同认可的同一位置,即预先设置的,在该同一位置,第一用户和第二用户采用面签的方式,通过第一位置和第二位置的相对位置关系确定第一用户和第二用户是否面签,即相对位置关系符合第一规则,第一规则可以为在同一位置,且距离小于预设的距离。[0133] 在一个实施例中,将第一笔顺信息和/或第一识别信息输入预先建立的第一验证模型中对数据处理请求进行验证,包括:[0134] 提取第一笔顺信息和/或第一识别信息的特征值,将特征值代入预先建立的神经网络模型中,获得验证因子,查询预设的验证表,当验证因子存在与验证表中时,数据处理请求验证通过;[0135] 或,[0136] 基于第一笔顺信息和/或第一识别信息构建验证向量,将验证向量与预先建立的验证库中的标准向量进行匹配,当验证向量与标准向量的匹配度大于预设匹配值时,数据处理请求验证通过;[0137] 其中,验证向量与标准向量的匹配度计算公式如下:[0138][0139] 其中,Pq为验证向量与验证库中第q个标准向量的匹配度;n为验证向量和标准向量的维度;ai,q为第q个标准向量的第i维数据值;bi为验证向量的第i维数据值;[0140] 第一笔顺信息包括:笔画的类型、各个笔画类型之间的顺序、各个笔画的参数信息其中一种或多种结合;[0141] 各个笔画的参数信息包括:起点、终点、各个笔画的起点与终点中间的预设数量的采样点之间的位置关系参数,和/或,起点、终点、各个笔画的起点与终点中间的预设数量的采样点的笔迹力度参数;[0142] 第一识别信息包括:文字、图形、符号其中一种或多种结合。[0143] 上述技术方案的工作原理及有益效果为:[0144] 本实施例提供两种方案用于验证。方案一、采用预先训练好的神经网络模型,提取笔顺信息和/或识别信息的特征值输入其中,得到验证因子,基于验证因子确定最后的验证结果。方案二、采用预先建立的验证库,基于笔顺信息和/或识别信息构建验证向量,将验证向量与验证库中的标准向量进行匹配,通过匹配结果进行验证。更进一步,综合笔顺信息和识别信息,提高了验证精度,即文字书写时,也可不按照规范标准,实现根据用户自定义,将笔画顺序作为验证点,提高了验证的粒度,实现用户自定义的可操作性。此外,考虑到笔画之间的笔迹力度参数,实现不同人在写同一个字的同一笔的识别,提高基于笔顺信息和识别信息方案上的人员的识别度。此外,本实施例也可用户对第二用户的第二笔顺和/或第二识别信息的验证。[0145] 在一个实施例中,基于目标数据库中数据对源数据库中数据进行处理,包括:[0146] 建立镜像数据库,将源数据库中数据复制到镜像数据库中;[0147] 依次获取镜像数据库中源数据,计算获取的源数据与目标数据库中的目标数据的相似度,将相似度大于预设的第一阈值的目标数据与源数据关联;[0148] 和/或,[0149] 当镜像数据库中的源数据都被获取过一次后,提取与源数据的相似度都小于等于预设的第二阈值的目标数据,采用预设的评定步骤对目标数据进行评定,当评定通过时,复制目标数据至镜像数据库;[0150] 其中,采用预设的评定步骤对目标数据进行评定,包括:[0151] 当目标数据为试题数据时,获取当前接入源数据库的用户的用户信息;[0152] 基于用户信息对用户进行分组,在各个分组中按预设的第一挑选规则挑选至少一个评价用户;[0153] 将目标数据发送至评价用户;[0154] 接收评价用户对目标数据的评价及做题的结果;[0155] 基于做题结果,确定各组评价用户的错误率;[0156] 基于评价及错误率,计算目标数据的评价值,计算公式如下:[0157][0158] 其中,Z为评价值,cj为第j个分组的错误率;αj为第j个分组的预设权重;m为分组的组数;M为评价用户的数量;dl为第l个评价用户的评价经过评价模型确定的评价值;βl是给第l个评价用户配置的权重值;δ1为关于错误率的相关系数;δ2为关于评价的相关系数;[0159] 当评价值大于预设的评价阈值时,目标数据通过评定。[0160] 上述技术方案的工作原理及有益效果为:[0161] 在数据处理时,首先建立镜像数据库,将源数据库的内容镜像至镜像数据库;不影响登录源数据库的用户的使用;通过计算源数据库中的数据与目标数据库中的数据的相似度,将两个数据库中的数据进行关联;关联后,登录源数据库的用户可以直接点击关联链接,实现数据库之间的跳转,提高用户对相似数据或相关数据的掌握;对于目标数据库中存在但是镜像数据库并无类似数据时,需要对镜像数据库进行扩容,但是并不是所有的数据都需要扩展,在扩展前需要进行评价,评价通过后才需要添加进镜像数据库;通过抽取源数据库在线的用户,基于用户信息进行分组,例如:教育平台,可以根据用户的答题准确率和/或录入系统的平时成绩和/或班级名次,对用户进行分组,从各个分组中抽取一定数量的用户作为评价用户,根据评价的用户的对于目标数据的使用(做题结果)和评价,进行评价,当超过评价阈值时,可以添加进镜像数据库;以做题结果为评定中的一项,可以有效避免,当该试题数据,所有挑选的用户都做正确时,说明该数据太过简单,无需添加进镜像数据库;以评价作为一项,可以将评价用户认为较难或具有代表性的试题添加进镜像数据库。[0162] 在一个实施例中,在数据处理完成后,对参与评定的用户的配置的权重值进行调整,调整公式如下:[0163][0164] 其中,D'为调整后的权重值;D为调整前的权重值;d为根据评价用户的评价与评定结果的影响确定,当为正影响时,取值为1,当为负影响时,取值为‑1;γ表示预设调整值,γ0表示预设的正调整与调整的差异值; Th为第h个评价用户从接收到目标数据到做出评价的时间,即当前调整权重的用户的从接收到目标数据到做出评价的时间。[0165] 上述技术方案的工作原理及有益效果为:[0166] 通过调整评价用户的权重,保证下次进行目标数据的评定时,提高或减落该评价用户对最后评价结果的影响,保证评定结果的准确。[0167] 在一个实施例中,数据处理方法,还包括:[0168] 获取目标数据库的关联信息;[0169] 基于关联信息,建立于第三方数据库中数据的关联。[0170] 上述技术方案的工作原理及有益效果为:[0171] 通过目标数据库与第三方数据库的关联信息,直接与第三方数据库中的数据进行关联,省去可依次计算源数据库与第三方数据库之间数据的相似度的步骤,提高了数据关联的效率。通过关联信息,直接进行关联,是基于目标数据库的关联信息和经过数据处理后源数据库与目标数据库的关联信息实现的。[0172] 在一个实施例中,数据处理方法,还包括:在源数据与目标数据关联后,从源数据库获取源数据的第一历史使用情况,从目标数据库中获取目标数据的第二历史使用情况;[0173] 根据使用用户的多层次的分类,从第一历史使用情况中挑选出多个代表各个层次用户的第一使用情况,组成第一使用情况代表集;[0174] 根据使用用户的多层次的分类,从第二历史使用情况中挑选出多个代表各个层次用户的第二使用情况,组成第二使用情况代表集;[0175] 根据第一使用情况代表集和第二使用情况代表集,计算使用情况差异;当使用情况差异大于预设差异时,进行差异标注。[0176] 上述技术方案的工作原理及有益效果为:[0177] 使用情况可以是做题结果,使用情况差异可以是做题准确率,通过差异比较,对源数据库中的该数据进行标注,提醒登录到源数据库的用户重点注意该数据。[0178] 本发明还提供一种数据处理系统,如图3所示,包括:[0179] 第一获取模块,用于获取第一用户的数据处理请求;[0180] 第一解析模块,用于解析数据处理请求,获取第一用户输入的第一笔顺信息和/或经过OCR识别的第一识别信息;[0181] 第一验证模块,用于将第一笔顺信息和/或第一识别信息输入预先建立的第一验证模型中对数据处理请求进行验证;当验证通过时,再次解析数据处理请求,获取源数据库和目标数据库;[0182] 第一确定模块,用于基于目标数据库,确定第二用户;[0183] 第一问询模块,用于向第二用户发送数据处理问询,并接收第二用户对于数据处理问询的反馈信息;[0184] 数据处理模块,用于当反馈信息为同意时,基于目标数据库中数据对源数据库中数据进行处理;[0185] 其中,第一用户具有源数据库的一级权限,第二用户具有目标数据库的一级权限。[0186] 上述技术方案的工作原理及有益效果为:[0187] 为了解决数据孤岛问题,可以采用数据互通的方式,为了保证数据互通的安全及有效性,可以采用如下方案:具有源数据库(第一个数据平台)的一级权限的第一用户发出数据互通的数据处理请求,首先基于第一用户的第一笔顺信息和/或第一识别信息对第一用户的身份进行验证,确定是第一用户本人发起的数据处理请求,其中第一识别信息是基于OCR(OpticalCharacterRecognition,光学字符识别)识别技术识别出的文字、图形、字符等;当验证通过时,说明数据处理请求为有效,再次解析数据处理请求,确定需要数据互通的源数据库和目标数据库(第二个数据平台);根据目标数据库的信息确定具有该数据库一级权限的第二用户,可以根据预存的权限信息表,查询获取;向第二用户发送数据处理问询,在第二用户同意后,将源数据库与目标数据库进行数据互通,通过授权互通的方式,即解决了数据孤岛问题,并且保证数据平台的数据的安全性。其中,一级权限为数据库的最高权限,可以实现删除、修改等数据库操作。[0188] 本发明的数据处理系统,实现各个大数据教育平台之间的数据互通。[0189] 在一个实施例中,数据处理系统,还包括:[0190] 第二获取模块,用于在接收反馈信息之前,还接收第二用户输入的第二笔顺信息和/或经过OCR识别的第二识别信息;[0191] 第二验证模块,用于将第二笔顺信息和/或第二识别信息输入预先建立的第二验证模型中对反馈信息进行验证;当验证通过时,接收反馈信息,否则,拒绝接收反馈信息并返回异常信息至第一用户。[0192] 上述技术方案的工作原理及有益效果为:[0193] 为了进一步保证,数据互通的安全性,还需对第二用户进行验证,通过第二用户的第二笔顺信息和/或第二识别信息经过第二验证模型进行验证。[0194] 在一个实施例中,数据处理系统,还包括:[0195] 第一定位模块,用于在获取第一用户的数据处理请求之前,获取第一用户的第一定位信息,[0196] 第一判断模块,用于判断第一定位信息对应的第一位置是否位于第一预设区域;当位于第一预设区域时,接收第一用户的数据处理请求,否则,拒绝第一用户的数据处理请求;[0197] 和/或,[0198] 第二定位模块,用于在接收第二用户的反馈信息之前,获取第二用户的第二定位信息;[0199] 第二判断模块,用于判断第二定位信息对应的第二位置是否位于第二预设区域;当位于第二预设区域时,接收第二用户的反馈信息;否则,拒绝接收第二用户的反馈信息;[0200] 和/或,[0201] 第三判断模块,用于确定第一位置和第二位置的相对位置关系,当相对位置关系符合预设的第一规则时,接收第二用户的反馈信息;否则,拒绝接收第二用户的反馈信息。[0202] 上述技术方案的工作原理及有益效果为:[0203] 通过确认第一用户的定位信息是否在第一预设区域,实现对第一用户发起数据处理请求的时机的限制,可以进一步保证数据互通的安全性;例如大数据平台是以省/市/县这种模式建立的,第一预设区域可以对应为大数据平台对应的省/市/县的具体地理位置;即当大数据平台的数据对应某县时,第一用户只有在该县境内才能发起数据处理请求;同理,第二用户在同意第一用户的数据处理请求时,也必须采用定位信息是否在第二预设区域的限制;此外,还可以设置一个限制规则,第一预设区域和第二预设区域为源数据库和目标数据库共同认可的同一位置,即预先设置的,在该同一位置,第一用户和第二用户采用面签的方式,通过第一位置和第二位置的相对位置关系确定第一用户和第二用户是否面签,即相对位置关系符合第一规则,第一规则可以为在同一位置,且距离小于预设的距离。[0204] 在一个实施例中,第一验证模块执行如下操作:[0205] 提取第一笔顺信息和/或第一识别信息的特征值,将特征值代入预先建立的神经网络模型中,获得验证因子,查询预设的验证表,当验证因子存在与验证表中时,数据处理请求验证通过;[0206] 或,[0207] 基于第一笔顺信息和/或第一识别信息构建验证向量,将验证向量与预先建立的验证库中的标准向量进行匹配,当验证向量与标准向量的匹配度大于预设匹配值时,数据处理请求验证通过;[0208] 其中,验证向量与标准向量的匹配度计算公式如下:[0209][0210] 其中,Pq为验证向量与验证库中第q个标准向量的匹配度;n为验证向量和标准向量的维度;ai,q为第q个标准向量的第i维数据值;bi为验证向量的第i维数据值;[0211] 第一笔顺信息包括:笔画的类型、各个笔画类型之间的顺序、各个笔画的参数信息其中一种或多种结合;[0212] 各个笔画的参数信息包括:起点、终点、各个笔画的起点与终点中间的预设数量的采样点之间的位置关系参数,和/或,起点、终点、各个笔画的起点与终点中间的预设数量的采样点的笔迹力度参数;[0213] 第一识别信息包括:文字、图形、符号其中一种或多种结合。[0214] 上述技术方案的工作原理及有益效果为:[0215] 本实施例提供两种方案用于验证。方案一、采用预先训练好的神经网络模型,提取笔顺信息和/或识别信息的特征值输入其中,得到验证因子,基于验证因子确定最后的验证结果。方案二、采用预先建立的验证库,基于笔顺信息和/或识别信息构建验证向量,将验证向量与验证库中的标准向量进行匹配,通过匹配结果进行验证。更进一步,综合笔顺信息和识别信息,提高了验证精度,即文字书写时,也可不按照规范标准,实现根据用户自定义,将笔画顺序作为验证点,提高了验证的粒度,实现用户自定义的可操作性。此外,考虑到笔画之间的笔迹力度参数,实现不同人在写同一个字的同一笔的识别,提高基于笔顺信息和识别信息方案上的人员的识别度。此外,本实施例也可用户对第二用户的第二笔顺和/或第二识别信息的验证。[0216] 在一个实施例中,数据处理模块执行如下操作:[0217] 建立镜像数据库,将源数据库中数据复制到镜像数据库中;[0218] 依次获取镜像数据库中源数据,计算获取的源数据与目标数据库中的目标数据的相似度,将相似度大于预设的第一阈值的目标数据与源数据关联;[0219] 和/或,[0220] 当镜像数据库中的源数据都被获取过一次后,提取与源数据的相似度都小于等于预设的第二阈值的目标数据,采用预设的评定步骤对目标数据进行评定,当评定通过时,复制目标数据至镜像数据库;[0221] 其中,采用预设的评定步骤对目标数据进行评定,包括:[0222] 当目标数据为试题数据时,获取当前接入源数据库的用户的用户信息;[0223] 基于用户信息对用户进行分组,在各个分组中按预设的第一挑选规则挑选至少一个评价用户;[0224] 将目标数据发送至评价用户;[0225] 接收评价用户对目标数据的评价及做题的结果;[0226] 基于做题结果,确定各组评价用户的错误率;[0227] 基于评价及错误率,计算目标数据的评价值,计算公式如下:[0228][0229] 其中,Z为评价值,cj为第j个分组的错误率;αj为第j个分组的预设权重;m为分组的组数;M为评价用户的数量;dl为第l个评价用户的评价经过评价模型确定的评价值;βl是给第l个评价用户配置的权重值;δ1为关于错误率的相关系数;δ2为关于评价的相关系数;[0230] 当评价值大于预设的评价阈值时,目标数据通过评定。[0231] 上述技术方案的工作原理及有益效果为:[0232] 在数据处理时,首先建立镜像数据库,将源数据库的内容镜像至镜像数据库;不影响登录源数据库的用户的使用;通过计算源数据库中的数据与目标数据库中的数据的相似度,将两个数据库中的数据进行关联;关联后,登录源数据库的用户可以直接点击关联链接,实现数据库之间的跳转,提高用户对相似数据或相关数据的掌握;对于目标数据库中存在但是镜像数据库并无类似数据时,需要对镜像数据库进行扩容,但是并不是所有的数据都需要扩展,在扩展前需要进行评价,评价通过后才需要添加进镜像数据库;通过抽取源数据库在线的用户,基于用户信息进行分组,例如:教育平台,可以根据用户的答题准确率和/或录入系统的平时成绩和/或班级名次,对用户进行分组,从各个分组中抽取一定数量的用户作为评价用户,根据评价的用户的对于目标数据的使用(做题结果)和评价,进行评价,当超过评价阈值时,可以添加进镜像数据库;以做题结果为评定中的一项,可以有效避免,当该试题数据,所有挑选的用户都做正确时,说明该数据太过简单,无需添加进镜像数据库;以评价作为一项,可以将评价用户认为较难或具有代表性的试题添加进镜像数据库。[0233] 在一个实施例中,数据处理系统还包括:调整模块,用于在数据处理完成后,对参与评定的用户的配置的权重值进行调整,调整公式如下:[0234][0235] 其中,D'为调整后的权重值;D为调整前的权重值;d为根据评价用户的评价与评定结果的影响确定,当为正影响时,取值为1,当为负影响时,取值为‑1;γ表示预设调整值,γ0表示预设的正调整与调整的差异值; Th为第h个评价用户从接收到目标数据到做出评价的时间,即当前调整权重的用户的从接收到目标数据到做出评价的时间。[0236] 上述技术方案的工作原理及有益效果为:[0237] 通过调整评价用户的权重,保证下次进行目标数据的评定时,提高或减落该评价用户对最后评价结果的影响,保证评定结果的准确。[0238] 在一个实施例中,数据处理系统,还包括:[0239] 关联模块,用于获取目标数据库的关联信息;基于关联信息,建立于第三方数据库中数据的关联。[0240] 上述技术方案的工作原理及有益效果为:[0241] 通过目标数据库与第三方数据库的关联信息,直接与第三方数据库中的数据进行关联,省去可依次计算源数据库与第三方数据库之间数据的相似度的步骤,提高了数据关联的效率。通过关联信息,直接进行关联,是基于目标数据库的关联信息和经过数据处理后源数据库与目标数据库的关联信息实现的。[0242] 在一个实施例中,数据处理系统,还包括:差异标注模块,用于在源数据与目标数据关联后,从源数据库获取源数据的第一历史使用情况,从目标数据库中获取目标数据的第二历史使用情况;[0243] 根据使用用户的多层次的分类,从第一历史使用情况中挑选出多个代表各个层次用户的第一使用情况,组成第一使用情况代表集;[0244] 根据使用用户的多层次的分类,从第二历史使用情况中挑选出多个代表各个层次用户的第二使用情况,组成第二使用情况代表集;[0245] 根据第一使用情况代表集和第二使用情况代表集,计算使用情况差异;当使用情况差异大于预设差异时,进行差异标注。[0246] 上述技术方案的工作原理及有益效果为:[0247] 使用情况可以是做题结果,使用情况差异可以是做题准确率,通过差异比较,对源数据库中的该数据进行标注,提醒登录到源数据库的用户重点注意该数据。[0248] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
专利地区:广东
专利申请日期:2020-12-01
专利公开日期:2024-08-30
专利公告号:CN112527897B