专利名称:基于均衡感知注意力网络的纺织品电商推荐方法及装置
专利类型:发明专利
专利申请号:CN202211410412.3
专利申请(专利权)人:广州科拓科技有限公司
权利人地址:广东省广州市天河区冼村路5号1508房
专利发明(设计)人:陈金孝
专利摘要:本发明公开了一种基于均衡感知注意力网络的纺织品电商推荐方法,包括:从电商顾客浏览平台中获取商品、店铺和顾客浏览日志的数据信息;构建知识图谱,知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱;将知识图谱导入Neo4j数据库中,并将知识图谱导出为RDF格式的三元组;采用均衡感知注意力网络算法对推荐算法模型进行训练;将数据信息和知识图谱传输至推荐算法模型,确定相应顾客的商品推荐结果。本发明通过构建知识图谱,开发出均衡感知注意力网络算法,实现顾客与商品交互关系特征的深度学习,预测出顾客对商品的浏览偏好特征,提高商品的推荐性能。
主权利要求:
1.一种基于均衡感知注意力网络的纺织品电商推荐方法,其特征在于,包括:
从纺织品电商顾客浏览平台中获取商品、店铺和顾客浏览日志的数据信息;其中,所述数据信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;所述从纺织品电商顾客浏览平台中获取商品、店铺和顾客浏览日志的数据信息,包括:将所述数据信息进行数据清洗,过滤出无效数据;所述无效数据包括设定时间内对应顾客IP只浏览过一次的数据和下架商品的数据;
将顾客浏览的商品按照时间顺序进行排序,进行时间差计算,获取浏览商品的有效时长;
将所述有效时长超过预设值的商品定义为有效商品,否则定义为无效商品;
构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱;
将所述知识图谱导入Neo4j数据库中,并将所述知识图谱导出为RDF格式的三元组;
构建推荐算法模型,其表达式为:
其中, 为u与v的交互关系预测值,Θ为函数f的参数集;U为顾客集,V为商品集;
根据顾客‑商品交互矩阵Y和商品知识图谱G,以及u∈U,v∈V,对yuv进行预测;
采用均衡感知注意力网络算法对推荐算法模型进行训练;所述均衡感知注意力网络算法包括关联传播层、知识注意力嵌入层和预测层;且所述关联传感层包括均衡浏览传播和知识图谱传播;所述采用均衡感知注意力网络算法对推荐算法模型进行训练,包括:对顾客的相似度进行计算,其中相似度计算公式为:
其中,对于任意的两个顾客up∈U,uq∈U,假定其浏览过的商品集合分别为Vp和Vq,基于顾客‑商品交互矩阵Y,根据余弦相似度来计算up和uq的相似度sim(up,uq);
根据相似度计算结果进行均衡展开以得到顾客和商品的关联实体集;并基于设定策略从所述顾客和商品的关联实体集中选择设定元素数量的实体子集;其中,所述设定策略为缩放策略;本算法挑选策略为:顾客相似度优先,同顾客浏览商品随机,即优先挑选与u自身浏览过的商品,然后按照与u相似度高低顺序挑选其他顾客浏览过的商品,挑选过程中,当商品数已超出kv时,从最后顾客浏览商品集中随机删除部分商品以满足根据知识图谱传播对所述实体子集进行L阶展开以得到关系三元组集合,采用softmax函数对三元组集进行规范化处理,均衡浏览传播基于顾客商品交互矩阵对顾客和商品信息进行初次展开,获得了表示顾客和商品的初阶关联实体集;知识图谱传播则基于商品知识图谱G进一步进行信息展开,获得表示顾客和商品的L阶关联实体集;
根据所述关系三元组集合以及TransE算法对商品知识图谱G中的实体和关系进行嵌入表示;其中,所述知识注意力嵌入层基于关系三元组的注意力计算机制,用于学习头实体对尾实体的注意力权重,并获得顾客或商品的嵌入表示;对顾客和商品的传播向量进行聚合运算,对顾客‑商品交互关系进行预测;其中,采用交叉熵损失来定义损失函数,其表达式为:其中,Loss表示损失值,第一项为(u,v)的交叉熵损失和,S表示(u,v)对样本集,ln为常数对数函数,第二项为正则项,用于平抑模型参数的复杂性,λ为超参数, 为二次正则项;
将所述数据信息和所述知识图谱传输至所述推荐算法模型,确定相应顾客的商品推荐结果。
2.如权利要求1所述的基于均衡感知注意力网络的纺织品电商推荐方法,其特征在于,所述构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱,包括:构建顾客商品交互矩阵;
构建所述顾客商品交互矩阵包括:
构建包含m个顾客的矩阵U={u1,u2,…,um},以及包含n个商品的矩阵V={v1,v2,…,vn};
m×n
根据顾客的历史浏览日志,获得顾客‑商品交互矩阵Y∈R ,其中对于
当u与v之间存在有效浏览记录,则yuv=1,否则yuv=0。
3.如权利要求1所述的基于均衡感知注意力网络的纺织品电商推荐方法,其特征在于,所述构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱,包括:构建商品知识图谱;
构建所述商品知识图谱包括:
将商品和商品属性值定义为实体集E,将商品的属性类型定义为关系集R;
将所述实体集E和所述关系集R结合,组成商品知识图谱G={(h,r,t)|h,t∈E,r∈R},其中(h,r,t)为关系三元组。
4.如权利要求1所述的基于均衡感知注意力网络的纺织品电商推荐方法,其特征在于,还包括:采用离线计算的方式进行推荐,通过后台计算,一次性生成所有顾客的离线推荐商品列表,接收到应用请求时,根据离线推荐商品列表向顾客推荐商品。
5.一种基于均衡感知注意力网络的纺织品电商推荐系统,其特征在于,包括:
接收模块:用于接收应用接口端传输的浏览信息,所述浏览信息为相应顾客电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;从电商顾客浏览平台中获取商品、店铺和顾客浏览日志的数据信息,包括:将所述数据信息进行数据清洗,过滤出无效数据;所述无效数据包括设定时间内对应顾客IP只浏览过一次的数据和下架商品的数据;
将顾客浏览的商品按照时间顺序进行排序,进行时间差计算,获取浏览商品的有效时长;
将所述有效时长超过预设值的商品定义为有效商品,否则定义为无效商品;
实体抽取模块:用于将所述浏览信息发送至预先构建完成的知识图谱来进行实体关系抽取以得到顾客商品交互矩阵;在所述知识图谱采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;构建推荐算法模型,其表达式为:其中, 为u与v的交互关系预测值,Θ为函数f的参数集;U为顾客集,V为商品集;
根据顾客‑商品交互矩阵Y和商品知识图谱G,以及u∈U,v∈V,对yuv进行预测;
推荐模块:用于将所述浏览信息和顾客商品交互矩阵传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果,其中,采用均衡感知注意力网络算法对推荐算法模型进行训练;所述均衡感知注意力网络算法包括关联传播层、知识注意力嵌入层和预测层;
且所述关联传感层包括均衡浏览传播和知识图谱传播;所述采用均衡感知注意力网络算法对推荐算法模型进行训练,包括:对顾客的相似度进行计算,其中相似度计算公式为:
其中,对于任意的两个顾客up∈U,uq∈U,假定其浏览过的商品集合分别为Vp和Vq,基于顾客‑商品交互矩阵Y,根据余弦相似度来计算up和uq的相似度sim(up,uq);
根据相似度计算结果进行均衡展开以得到顾客和商品的关联实体集;并基于设定策略从所述顾客和商品的关联实体集中选择设定元素数量的实体子集;其中,所述设定策略为缩放策略;本算法挑选策略为:顾客相似度优先,同顾客浏览商品随机,即优先挑选与u自身浏览过的商品,然后按照与u相似度高低顺序挑选其他顾客浏览过的商品,挑选过程中,当商品数已超出kv时,从最后顾客浏览商品集中随机删除部分商品以满足根据知识图谱传播对所述实体子集进行L阶展开以得到关系三元组集合;采用softmax函数对三元组集进行规范化处理,均衡浏览传播基于顾客商品交互矩阵对顾客和商品信息进行初次展开,获得了表示顾客和商品的初阶关联实体集;知识图谱传播则基于商品知识图谱G进一步进行信息展开,获得表示顾客和商品的L阶关联实体集;
根据所述关系三元组集合以及TransE算法对商品知识图谱G中的实体和关系进行嵌入表示;其中,所述知识注意力嵌入层基于关系三元组的注意力计算机制,用于学习头实体对尾实体的注意力权重,并获得顾客或商品的嵌入表示;对顾客和商品的传播向量进行聚合运算,对顾客‑商品交互关系进行预测;其中,采用交叉熵损失来定义损失函数,其表达式为:其中,Loss表示损失值,第一项为(u,v)的交叉熵损失和,S表示(u,v)对样本集,ln为常数对数函数,第二项为正则项,用于平抑模型参数的复杂性,λ为超参数, 为二次正则项。
6.一种电子设备,其特征在于,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1至4任一项所述的基于均衡感知注意力网络的纺织品电商推荐方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1至4任一项所述的基于均衡感知注意力网络的纺织品电商推荐方法。 说明书 : 基于均衡感知注意力网络的纺织品电商推荐方法及装置技术领域[0001] 本发明涉及互联网技术领域,具体涉及一种基于均衡感知注意力网络的纺织品电商推荐方法及装置。背景技术[0002] 当前各大电商网站如亚马逊、京东和淘宝的个性化推荐,是提升电商品牌价值、商品销量以及客户体验的重要办法。主流的个性化推荐算法有:基于内容的推荐、基于协同过滤进行推荐,以及基于深度学习进行推荐等方法。但是,基于协同过滤(CollaborativeFiltering)的方法仅考虑到顾客对商品的反馈数据,而基于内容(ContentBase)的方法仅考虑商品的特性数据,这样单纯的依赖部分数据进行推荐难以满足顾客更深层次的推荐需求,同时也存在稀疏性等问题;基于深度学习的推荐,推荐效果较前两方法有很大的提高,但却以损失性能为代价,推荐的结果解释性也较低。以纺织品面辅料批发为主的纺织品电商平台为例,其商品种类多,顾客群体庞大,但因为平台“线上展示,线下交易”的运营模式,推荐系统构建时面临顾客注册稀少,交易和评价缺乏,与商品交互稀疏且不平衡等挑战。因此,亟需一种电商推荐方法来提升顾客体验和商品的推荐性能。发明内容[0003] 针对所述缺陷,本发明实施例公开了一种基于均衡感知注意力网络的纺织品电商推荐方法,其通过商品、店铺和顾客的浏览日志构建知识图谱,开发出均衡感知注意力网络算法,实现顾客与商品交互关系特征的深度学习,预测出顾客对商品的浏览偏好特征,提高商品的推荐性能。[0004] 本发明实施例第一方面公开了基于均衡感知注意力网络的纺织品电商推荐方法,包括:[0005] 从电商顾客浏览平台中获取商品、店铺和顾客浏览日志的数据信息;[0006] 构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱;[0007] 将所述知识图谱导入Neo4j数据库中,并将所述知识图谱导出为RDF格式的三元组;[0008] 采用均衡感知注意力网络算法对推荐算法模型进行训练;[0009] 将所述数据信息和所述知识图谱传输至所述推荐算法模型,确定相应顾客的商品推荐结果。[0010] 作为一种可选的实施方式,在本发明实施例第一方面中,所述从电商顾客浏览平台中获取商品、店铺和顾客浏览日志的数据信息,包括:[0011] 将所述数据信息进行数据清洗,过滤出无效数据;所述无效数据包括设定时间内对应顾客IP只浏览过一次的数据和下架商品的数据;[0012] 将顾客浏览的商品按照时间顺序进行排序,进行时间差计算,获取浏览商品的有效时长;[0013] 将所述有效时长超过预设值的商品定义为有效商品,否则定义为无效商品。[0014] 作为一种可选的实施方式,在本发明实施例第一方面中,所述构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱,包括:构建顾客商品交互矩阵;[0015] 构建所述顾客商品交互矩阵包括:[0016] 构建包含m个顾客的矩阵U={u1,u2,…,um},以及包含n个商品的矩阵V={v1,v2,…,vn};[0017] 根据顾客的历史浏览日志,获得顾客‑商品交互矩阵Y∈Rm×n,其中对于当u与v之间存在有效浏览记录,则yuv=1,否则yuv=0。[0018] 作为一种可选的实施方式,在本发明实施例第一方面中,所述构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱,包括:构建商品知识图谱;[0019] 构建所述商品知识图谱包括:[0020] 将商品和商品属性值定义为实体集E,将商品的属性类型定义为关系集R;[0021] 将所述实体集E和所述关系集R结合,组成商品知识图谱G={(h,r,t)|h,t∈E,r∈R},其中(h,r,t)为关系三元组。[0022] 作为一种可选的实施方式,在本发明实施例第一方面中,所述采用均衡感知注意力网络算法对推荐算法模型进行训练之前,还包括:[0023] 构建推荐算法模型,其表达式为:[0024][0025] 其中, 为u与v的交互关系预测值,Θ为函数f的参数集;[0026] 根据顾客‑商品交互矩阵Y和商品知识图谱G,以及u∈U,v∈V,对yuv进行预测。[0027] 作为一种可选的实施方式,在本发明实施例第一方面中,所述采用均衡感知注意力网络算法对推荐算法模型进行训练,包括:[0028] 基于CKAN算法,构建均衡感知注意力网络算法框架;[0029] 对顾客的相似度进行计算,其中相似度计算公式为:[0030][0031] 其中,对于任意的两个顾客up∈U,uq∈U,假定其浏览过的商品集合分别为Vp和Vq,基于顾客‑商品交互矩阵Y,根据余弦相似度来计算up和uq的相似度sim(up,uq);[0032] 根据TransE算法对商品知识图谱G中的实体和关系进行嵌入表示;[0033] 构建均衡浏览传播和知识图谱传播;[0034] 基于CKAN算法的知识注意力嵌入方法产生头实体和尾实体的注意力权重;[0035] 对顾客和商品的传播向量进行聚合运算,对顾客‑商品交互关系进行预测;[0036] 采用交叉熵损失来定义损失函数,其表达式为:[0037][0038] 其中,Loss表示损失值,第一项为(u,v)的交叉熵损失和,S表示(u,v)对样本集,ln为常数对数函数,第二项为正则项,用于平抑模型参数的复杂性,λ为超参数, 为二次正则项。[0039] 作为一种可选的实施方式,在本发明实施例第一方面中,所述基于均衡感知注意力网络的纺织品电商推荐方法,还包括:采用离线计算的方式进行推荐,通过后台计算,一次性生成所有顾客的离线推荐商品列表,接收到应用请求时,根据离线推荐商品列表向顾客推荐商品。[0040] 本发明实施例第二方面公开一种基于均衡感知注意力网络的纺织品电商推荐系统,包括:[0041] 接收模块:用于接收应用接口端传输的浏览信息,所述浏览信息为相应顾客电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;[0042] 实体抽取模块:用于将所述浏览信息发送至预先构建完成的知识图谱来进行实体关系抽取以得到顾客商品交互矩阵;在所述知识图谱采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;[0043] 推荐模块:用于将所述浏览信息和顾客商品交互矩阵传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。[0044] 本发明实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本发明实施例第一方面公开的基于均衡感知注意力网络的纺织品电商推荐方法。[0045] 本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的基于均衡感知注意力网络的纺织品电商推荐方法。[0046] 与现有技术相比,本发明实施例具有以下有益效果:[0047] 本发明中基于均衡感知注意力网络的纺织品电商推荐方法通过商品、店铺和顾客的浏览日志构建知识图谱,开发出均衡感知注意力网络算法,实现顾客与商品交互关系特征的深度学习,预测出顾客对商品的浏览偏好特征,提高商品的推荐性能。附图说明[0048] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。[0049] 图1是本发明实施例公开的基于均衡感知注意力网络的纺织品电商推荐方法的流程示意图;[0050] 图2是本发明实施例公开的基于均衡感知注意力网络的纺织品电商推荐方法的推荐系统的算法框架图;[0051] 图3是本发明实施例公开的基于均衡感知注意力网络的纺织品电商推荐方法的技术架构图;[0052] 图4是本发明实施例一顾客浏览商品集1的数据图;[0053] 图5是本发明实施例一顾客浏览商品集2的数据图;[0054] 图6是本发明实施例一顾客推荐商品集的数据图;[0055] 图7是本发明实施例提供的一种基于均衡感知注意力网络的纺织品电商推荐装置的结构示意图;[0056] 图8是本发明实施例提供的一种电子设备的结构示意图。具体实施方式[0057] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0058] 需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。[0059] 实施例一[0060] 请参阅图1,图1是本发明实施例公开的基于均衡感知注意力网络的纺织品电商推荐方法的流程示意图。其中,本发明实施例所描述的方法的执行主体为由软件或/和硬件组成的执行主体,该执行主体可以通过有线或/和无线方式接收相关信息,并可以发送一定的指令。当然,其还可以具有一定的处理功能和存储功能。该执行主体可以控制多个设备,例如远程的物理服务器或云服务器以及相关软件,也可以是对某处安置的设备进行相关操作的本地主机或服务器以及相关软件等。在一些场景中,还可以控制多个存储设备,存储设备可以与设备放置于同一地方或不同地方。[0061] 如图1所示,该基于基于均衡感知注意力网络的纺织品电商推荐方法包括以下步骤:[0062] S101:从电商顾客浏览平台中获取商品、店铺和顾客浏览日志的数据信息。[0063] 在本步骤主要是为了获取到基础的浏览数据。具体的,应用接口主要为应用程序提供推荐功能调用,以http服务的形式提供,服务程序根据应用请求检索深度学习获得的离线推荐文档,并将检索结果以Json格式响应推荐结果。接口详情设计如下:接口协议为httpget;请求参数为UserId(顾客标识)、Model(模型名称)、code(返回码)、Msg(返回消息)和data(返回数据),其中,模型在{RippleNet,KGCN,KGAT,CKAN,…}中枚举;返回码:同http定义,如200表示成功;返回消息:查询成功,或失败原因,如顾客不存在;返回数据:(商品Id,顾客浏览概率)列表,以Json对象输出。[0064] S102:构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱。[0065] 本步骤首先进行数据清洗,过滤出无效的或价值较小的数据;然后基于商品和店铺的关系及属性(产品分类、成分、织法、用途、颜色、弹力、适用范围、制造工艺等)构建商品图谱;再基于浏览日志构建浏览图谱。[0066] S103:将所述知识图谱导入Neo4j数据库中,并将所述知识图谱导出为RDF格式的三元组。[0067] 构建所述知识图谱包括:[0068] 1.建立顾客商品交互矩阵Y:假定纺织品面辅料推荐场景中包含m个顾客U={u1,u2,…,um}和n个商品V={v1,v2,…,vn},根据系统的历史浏览日志,可获得顾客‑商品交互m×n矩阵Y∈R ,对于 当u与v之间存在有效浏览记录,则yuv=1,否则yuv=0。需要注意的是,yuv=0,并不意味着顾客u对商品v不感兴趣,也许是因为u未能发现v。[0069] 2.商品知识图谱G:把商品及其属性值(如具体的商家、产品成分、用途等)定义为实体集E,把商品的属性类型(包含商家、产品分类、成分、织法、主要用途、制作工艺、适用范围等)定义为关系集R,则实体和关系组成了知识图谱形式的商品知识图谱G={(h,r,t)|h,t∈E,r∈R}。(h,r,t)即关系三元组,如{针织提花千鸟格,商家,特丽龙}表示商品“针织提花千鸟格”的商家为“特丽龙”,因为商品和商家名称并不唯一,在实际的三元组表达中,实体均用id标识。通过商品知识图谱,商品之间形成路径可达,如“特丽龙”的另一类商品“彩云纱”,通过{彩云纱,商家,特丽龙},与“针织提花千鸟格”形成路径可达。注意在图遍历过程中,关系组成的边视为双向边。[0070] 3.推荐问题定义:可抽象为顾客‑商品交互关系的预测问题,即给定Y和G,以及u∈U,v∈V,预测yuv。而推荐算法的任务即要构建一个如式(3)所示的预测函数模型。[0071][0072] 式中, 即u与v的交互关系预测值,Θ即函数f的参数集。[0073] S104:采用均衡感知注意力网络算法对推荐算法模型进行训练。[0074] 本步骤中提出的均衡感知注意力网络算法构建包括:[0075] 基于CKAN算法,构建均衡感知注意力网络算法框架。如图2所示,在推荐算法分析中发现,CKAN算法在适用范围、性能、学习效率上相比于其它算法具有优势,本申请将在CKAN算法的基础上进行扩展,主要针对B2B电商的交互稀疏性和顾客偏好稳定性两大特点进行算法构建,提出均衡感知注意力网络算法(BanlancedKnowledge‑awareAttentiveNetwork,BKAN)。BKAN由关联传播层、知识注意力嵌入层和预测层组成。关联传播层包括均衡浏览传播和知识图谱传播两部分,首先从顾客‑商品交互矩阵Y出发,沿着商品知识图谱G对顾客和商品的关联实体信息进行逐层传播;知识注意力嵌入层是一个基于关系三元组的注意力计算机制,用于学习头实体对尾实体的注意力权重,并获得顾客或商品的嵌入表示;预测层则以顾客和商品的嵌入表示为输入,以两者的交互关系为输出相对于CKAN算法而言,BKAN扩展部分主要在于均衡浏览传播,其余部分沿用CKAN算法。[0076] 对顾客的相似度进行计算,其中相似度计算公式为:[0077][0078] 其中,对于任意的两个顾客up∈U,uq∈U,假定其浏览过的商品集合分别为Vp和Vq,基于顾客‑商品交互矩阵Y,根据余弦相似度来计算up和uq的相似度sim(up,uq);[0079] 根据TransE算法对商品知识图谱G中的实体和关系进行嵌入表示。基于商品知识图谱G,考虑到G中的实体之间只存在单一关系,采用TransE算法对G中的实体和关系进行图d嵌入表示。TransE算法的目标是,对于任意的(h,r,t)∈G,使eh+er≈et,eh,er,et∈R 分别为h,t的嵌入向量,d为嵌入的维度。因此经历TransE处理后,G中的实体和关系(含商品及其属性)均表示为d维的实值向量。[0080] 构建均衡浏览传播和知识图谱传播。均衡浏览传播主要基于两个思想进行顾客和商品的信息表示:信息关联和均衡表示。[0081] 信息关联思想同时体现在顾客和商品上。顾客在历史记录中浏览过的商品反映了顾客的兴趣偏好,对于该顾客所经营的纺织品加工制造企业而言,则反映了企业制造的产品系列。因此,本算法并不将顾客表示为一个独立的实体,而是将其表示为一个商品关联实体。共同被同一顾客浏览过的商品集体现了商品之间的关联特征,如可能共同为某一型号纺织品的面料、里料和辅料。因此,本算法认为,商品虽然可以表示为一个独立的实体,但其表示的信息中应包含商品之间的关联特征。[0082] 均衡传播思想则体现在顾客和商品相互关联的数量上。对于稀疏浏览记录的顾客而言,过少的浏览商品无法完整表示其兴趣偏好,会导致顾客信息欠表示。对于稠密浏览记录的顾客而言,过多的浏览商品会导致顾客信息过表示。过表示和欠表示都将影响推荐效果。同理,对于被浏览量稀疏的商品而言,过少的浏览顾客无法完整表示其使用特征,会导致商品关联信息欠表示。对于被浏览量稠密的商品而言,过多的浏览顾客会导致商品关联信息过表示。为了避免欠表示和过表示问题,本算法将采取缩放策略,将顾客和商品的关联商品限定为一个固定的数量。[0083] 均衡浏览传播的相关概念定义如下:[0084] 顾客u的相似顾客集Uu:按照顾客相似度sim(up,uq)从高到低对用顾客集U进行排序,取相似度最高的前ku个顾客,即形成顾客u的相似顾客集Uu,注意U中不排除u自身,因为u与自身的相似度为1,所以u是Uu的第一个元素,表示如下式所示:[0085][0086] 商品v的浏览顾客集Uv:即顾客‑商品交互值yuv=1的顾客集合,表示如下式所示:[0087] Uv={u|u∈Uandyuv=1}[0088] 商品v的扩展浏览顾客集U'v:除了Uv以外,还包括Uv的相似顾客集,表示如下式所示:[0089] Uv′=Uv∪{u′|u∈Uvandu′∈Uu}[0090] 顾客u的相似浏览商品集Vu:即u相似顾客集Uu浏览过的商品集,可表示如下式所示:[0091] Vu={v|u′∈Uuandyu′v=1}[0092] 顾客u的初始关联实体集 从Vu中按照一定策略挑选出的元素数量kv的子集,即[0093] 本算法挑选策略为:顾客相似度优先,同顾客浏览商品随机,即优先挑选与u自身浏览过的商品,然后按照与u相似度高低顺序挑选其他顾客浏览过的商品,挑选过程中,当商品数已超出kv时,从最后顾客浏览商品集中随机删除部分商品以满足[0094] 商品v的相似浏览商品集Vv:扩展浏览顾客集U'v浏览过的商品集,可表示如下式所示:[0095] Vv={v|u′∈Uv′andyu′v=1}[0096] 商品v的初始关联实体集 从Vv中按照一定策略挑选出的元素数量kv的子集,即元素挑选策略同样采用顾客相似度优先,同顾客浏览商品随机。[0097] 均衡浏览传播基于顾客商品交互矩阵Y对顾客和商品信息进行初次展开,获得了表示顾客和商品的初阶关联实体集 和 知识图谱传播则基于商品知识图谱G进一步进行信息展开,获得表示顾客和商品的l(l=1,2,3,…,L,L为最大传播阶数)阶关联实体集和 在知识图谱传播中,将待表示的顾客和商品统称为待表示对象o,其l阶关联实体集 和 统称为 即 和 到 传播的递归表示如下式)所示:[0098][0099] 到 传播的关系三元组集合 表示如下式所示:[0100][0101] 将为知识注意力嵌入和交互关系预测学习的输入信息。[0102] 构建评价指标,把推荐评价问题转换为二分类问题,即顾客对商品是否浏览,是为正样本,否为负样本。[0103] 二分类问题的四类判定结果如下:[0104] TP:TurePositive把正的判断为正的数目TruePositive,判断正确,且判为了正,即正的预测为正的。[0105] FN:FalseNegative把正的错判为负的数目FalseNegative,判断错误,且判为了负,即把正的判为了负的。[0106] FP:FalsePositive把负的错判为正的数目FalsePositive,判断错误,且判为了正,即把负的判为了正的。[0107] TN:TrueNegative把负的判为负的数目TrueNegative,判断正确,且判为了负,即把负的判为了负的。[0108] 基于判定结果导出的如下推荐评价指标:[0109] (1)精确率(Precision):Prec=TP/(TP+FP),也称为真阳率,即预测为正的样本中正样本的比率。[0110] (2)准确率(Accuracy):Acc=(TP+TN)/(TP+TN+FN+FP),即分类正确的样本占总样本的比例。[0111] (3)召回率(Recall):Recall=TP/(TP+FN),即样本中有多少正样本被预测正确了。[0112] (4)F1:F1‑score就是一个综合考虑precision和recall的指标,如下式所示:[0113][0114] (5)HitRatio(HR):HitRatio关心顾客想要的,系统有没有推荐到,强调预测的“准确性”。[0115] 计算公式如下式所示:[0116][0117] 分子GT:每个顾客TopK列表中属于测试集的个数的总和。[0118] 分母NumberOfHits@K:顾客在测试集中的物品总个数。[0119] 例如:三个顾客在测试集中的商品个数分别是10,12,8,模型得到的top‑10推荐列表中,分别有6个,5个,4个在测试集中,那么此时HR的值是(6+5+4)/(10+12+8)=0.5。[0120] (6)AreaUnderCurve(AUC):被定义为ROC曲线下的面积,ROC曲线:接受者操作特性曲线(receiveroperatingcharacteristiccurve,简称ROC曲线),横坐标为FP,纵坐标为TP。AUC反映分类模型的分类能力,其含义是正样本被分对的概率,且与正负样本的比列无关,可以有效解决样本不平衡问题。[0121] 从AUC判断分类器(预测模型)优劣的标准:[0122] AUC=1,是完美分类器;[0123] AUC=[0.85,0.95],效果很好;[0124] AUC=[0.7,0.85],效果一般;[0125] AUC=[0.5,0.7],效果较低;[0126] AUC=0.5,跟随机猜测一样(例:丢铜板),模型没有预测价值。[0127] 对于协同过滤算法和SVD算法而言,因为其推荐问题转换的评分预测问题而非分类问题,AUC、精确率、准确率、F1等指标定义与分类问题不一样,两类算法不具备可比性,但是HR指标具备可比性。[0128] 基于CKAN算法的知识注意力嵌入方法产生头实体和尾实体的注意力权重。[0129] 经历均衡浏览传播和知识图谱传播后,每个顾客和商品均可获得L个传播的关系三元组集合 在知识图谱中,同一个实体可能是多个三元组的尾实体,如,一个商家有多款商品,则这多款商品是这一个商家的头实体,但其中有两款商品可能有完全不同的用途。因此,推荐算法中,应关注不同属性在推荐传播中的价值信息传送。这里将沿用CKAN算法的知识注意力嵌入方法来产生头实体对尾实体的注意力权重,以发掘头实体和关系对于尾实体推荐的内在含义。[0130] 设 为第l阶三元组集合的第i个三元组, 分别为h,r,t的嵌入表示,则尾实体的注意力嵌入ai如下式)所示:[0131][0132] 式中,π(.)是头实体到尾实体的注意力权重控制函数,这个函数通过构建一个三层的神经网络学习模型来实现,如图8中的自注意力嵌入层部分。模型输入为 输出为ai,前向计算公式如下式所示:[0133][0134] 式中,ReLU是前两层的非线性激活函数,σ是第三层的激活函数sigmoid,W和b是需要学习的网络权重参数和偏置参数。因为学习模型还需要与预测层连接,这层先不用定义损失函数。[0135] 随后,采用softmax函数对三元组集 进行规范化处理即获得π 如下式所示:[0136][0137] 最后,顾客u或商品v的第l(l≥1)阶嵌入向量采用用ai的均值向量表示,如下式所示:[0138][0139] 式中,o即顾客u或商品v, 即 的元素个数。[0140] 此外,顾客u或商品v的初始关联实体集是信息传播的第一步,其本身的信息对于两者的浏览关系起着非常重要的影响,因此,顾客u或商品v的第0阶嵌入向量采用初始关联实体集的均值嵌入向量表示,如下式所示:[0141][0142] 对于商品v,其自身带有一个初始的嵌入表示,用符号 表示,也将其作为v嵌入表示向量的一部分。但顾客u没有作为商品知识图谱的节点,因此没有初始嵌入表示。[0143] 将origin和0到L阶嵌入向量进行连接,即形成顾客u或商品v的传播向量,如下式所示:[0144][0145][0146] 式中,||表示向量拼接符号,如向量(1,2,3)||(4,5,6)=(1,2,3,4,5,6)。[0147] 对顾客和商品的传播向量进行聚合运算,对顾客‑商品交互关系进行预测。[0148] 对顾客u或商品v的传播向量进行聚合运算,将两者转化为一个维度相同的聚合向量,聚合运算如下式所示:[0149][0150] 式中, 为o(u或v)的聚合向量,Wa和ba分别为待学习权重和偏置,u的聚合向量表达了顾客对商品的偏好特征,v的聚合向量表达了商品在知识图谱G中的综合特征。[0151] 对u和v的聚合向量进行内积预算,内积值越高表示u的偏好与v的特征越吻合,u越有可能浏览v,再通过sigmoid函数对内积值激活,即可获得u对v的点击概率,如下式所示:[0152][0153] 采用交叉熵损失来定义损失函数,其表达式为:[0154][0155] 其中,Loss表示损失值,第一项为(u,v)的交叉熵损失和,S表示(u,v)对样本集,ln为常数对数函数,第二项为正则项,用于平抑模型参数的复杂性,λ为超参数, 为二次正则项。需要注意的是,训练集S构建时,(u,v)元素即要包括正样本元素(即yuv=1),也要包括负样本元素(即yuv=0),正负样本数应保持平衡,以降低训练偏差。[0156] S105:将所述数据信息和所述知识图谱传输至所述推荐算法模型,确定相应顾客的商品推荐结果。[0157] 更为优选的,所述从电商顾客浏览平台中获取商品、店铺和顾客浏览日志的数据信息,包括:[0158] 将所述数据信息进行数据清洗,过滤出无效数据;所述无效数据包括设定时间内对应顾客IP只浏览过一次的数据和下架商品的数据;[0159] 将顾客浏览的商品按照时间顺序进行排序,进行时间差计算,获取浏览商品的有效时长;[0160] 将所述有效时长超过预设值的商品定义为有效商品,否则定义为无效商品。如:对最后一次浏览商品的有效时常默认取为30秒,顾客对浏览时长大于30秒小于1小时的商品记为有效浏览,评分为1,其他则评分为0。[0161] 更为优选的,所述构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱,包括:构建顾客商品交互矩阵;[0162] 构建所述顾客商品交互矩阵包括:[0163] 构建包含m个顾客的矩阵U={u1,u2,…,um},以及包含n个商品的矩阵V={v1,v2,…,vn};[0164] 根据顾客的历史浏览日志,获得顾客‑商品交互矩阵Y∈Rm×n,其中对于当u与v之间存在有效浏览记录,则yuv=1,否则yuv=0。[0165] 更为优选的,所述构建知识图谱,所述知识图谱包括根据商品、店铺的关系和属性构建的商品图谱和根据顾客浏览日志构建的浏览图谱,包括:构建商品知识图谱;[0166] 构建所述商品知识图谱包括:[0167] 将商品和商品属性值定义为实体集E,将商品的属性类型定义为关系集R;[0168] 将所述实体集E和所述关系集R结合,组成商品知识图谱G={(h,r,t)|h,t∈E,r∈R},其中(h,r,t)为关系三元组。[0169] 更为优选的,所述采用均衡感知注意力网络算法对推荐算法模型进行训练之前,还包括:[0170] 构建推荐算法模型,其表达式为:[0171][0172] 其中, 为u与v的交互关系预测值,Θ为函数f的参数集;[0173] 根据顾客‑商品交互矩阵Y和商品知识图谱G,以及u∈U,v∈V,对yuv进行预测。[0174] 更为优选的,所述基于均衡感知注意力网络的纺织品电商推荐方法,还包括:采用离线计算的方式进行推荐,通过后台计算,一次性生成所有顾客的离线推荐商品列表,接收到应用请求时,根据离线推荐商品列表向顾客推荐商品。[0175] 本实施例基于浏览日志转换所得的顾客‑商品交互矩阵中,包含约200万个yuv=1的(u,v)对正样本,从中随机选取64万条构成测试样本集的正样本集,正样本集的统计情况如下:[0176] 总顾客数:18393位;[0177] 顾客最大浏览商品数:19448;[0178] 顾客最小浏览商品数:2;[0179] 顾客平均浏览商品数:35;[0180] 浏览商品数少于5的稀疏顾客数:15789;[0181] 稀疏顾客占比:15789/18393*100%=85%;[0182] 从上统计可以看出,该测试集中的顾客主要是稀疏顾客,顾客浏览商品数的分布极不均匀。负样本集的选择,则从正样本集所含顾客中,随机选择yuv=0的(u,v)对负样本,负样本集的规模与正样本集等同,以保证正负样本均衡。[0183] 选择超参数:知识图谱传播阶数L沿用CKAN算法的选择,即L=4;[0184] 顾客u和商品v的初始关联实体集规模kv,通过二分法实验筛选,最终筛得kv=20。[0185] 训练迭代次数,即epoch=50。[0186] 基线算法即用于做性能对比的推荐算法,选择如下:[0187] CKAN:即本文BKAN算法的基本算法,没有均衡浏览传播策略;[0188] KGCN:知识图卷积网络算法。[0189] Ripplenet:波纹传播算法。[0190] KGNN‑LS:KGCN的改进算法,在KGCN的基础上加入了一个正则项。[0191] 基线选法的训练迭代次数同本项目的BKAN算法。[0192] BKAN即本申请提出的改进算法,CKAN是基础算法,两者的AUC、F1、ACC指标如下表所示:[0193] 指标 AUC F1 ACCCKAN 0.7924 0.7568 0.7385BKAN 0.8304 0.7884 0.7667BKAN‑CKAN 0.0380 0.0316 0.0282[0194] 从上表可以看出,BKAN相比于CKAN在三个指标上均有明显提升,AUC提升0.038,F1提升0.0316,ACC提升0.0282。这表明,BKAN的均衡浏览传播策略充分利用了纺织品B2B电商业务的顾客兴趣稳定性,弥补了交互稀疏性引发的性能下降。[0195] HR@K是最能反映推荐算法顾客体验的性能指标,这里用于BKAN与基线算法的性能对比,TopK分别取2,5,10,20,50,100,计算所得的HR@K指标下表所示:[0196][0197] 从上表可以看出,随着TopK的增加,BKAN算法逐步体现出命中率优势,从TopK=20后,BKAN成为性能最优算法。虽然在TopK<20时,KGCN性能最优,但是因为本数据集顾客‑商品交互稀疏性,所有算法的命中率均接近于0,对比的意义并不大,因此,可以认为BKAN算法相对于KGCN、RippleNet等基线算法而言,能实现顾客体验更优的商品推荐。[0198] 根据BKAN模型对id为3的一个顾客进行分析,在其共1331个浏览商品中提取其感兴趣的关键信息,如图4和图5为在其浏览产品中随机抽取的两组商品详细数据。[0199] 从图4和图5可以大致推断该顾客的一些感兴趣的特征,如他对产品分类为“面料”的系列产品有针对性的搜索浏览,尤其是一些男女装面料。其次,对于其他的服装比如刺绣类的服装还有鞋饰也有浏览兴趣。[0200] 如图6所示,根据BKAN最终推荐的效果,将模型预测该顾客最感兴趣的前十个产品详细信息列出,可以看出,对于前十个推荐的商品中,部分商品包含该顾客的关键浏览特征,如男女装面料方面的产品。此外,也包括了该顾客浏览商品用途相似的商品,如鞋饰等。[0201] 实施例二[0202] 请参阅图7,图7是本发明实施例公开的基于均衡感知注意力网络的纺织品电商推荐装置的结构示意图。[0203] 如图7所示,该基于均衡感知注意力网络的纺织品电商推荐装置可以包括:[0204] 接收模块21:用于接收应用接口端传输的浏览信息,所述浏览信息为相应顾客电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;[0205] 实体抽取模块22:用于将所述浏览信息发送至预先构建完成的知识图谱来进行实体关系抽取以得到顾客商品交互矩阵;在所述知识图谱采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;[0206] 推荐模块23:用于将所述浏览信息和顾客商品交互矩阵传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。[0207] 实施例三[0208] 请参阅图8,图8是本发明实施例公开的一种电子设备的结构示意图。电子设备可以是计算机以及服务器等,当然,在一定情况下,还可以是手机、平板电脑以及监控终端等智能设备,以及具有处理功能的图像采集装置。[0209] 如图8所示,该电子设备可以包括:[0210] 存储有可执行程序代码的存储器510;[0211] 与存储器510耦合的处理器520;[0212] 其中,处理器520调用存储器510中存储的可执行程序代码,执行实施例一中的基于均衡感知注意力网络的纺织品电商推荐方法中的部分或全部步骤。[0213] 本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行实施例一中的基于均衡感知注意力网络的纺织品电商推荐方法中的部分或全部步骤。[0214] 本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于均衡感知注意力网络的纺织品电商推荐方法中的部分或全部步骤。[0215] 本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于均衡感知注意力网络的纺织品电商推荐方法中的部分或全部步骤。[0216] 在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。[0217] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。[0218] 另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。[0219] 所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。[0220] 在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。[0221] 本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read‑OnlyMemory,ROM)、随机存储器(RandomAccessMemory,RAM)、可编程只读存储器(ProgrammableRead‑onlyMemory,PROM)、可擦除可编程只读存储器(ErasableProgrammableRead‑OnlyMemory,EPROM)、一次可编程只读存储器(One‑timeProgrammableRead‑OnlyMemory,OTPROM)、电子抹除式可复写只读存储器(Electrically‑ErasableProgrammableRead‑OnlyMemory,EEPROM)、只读光盘(CompactDiscRead‑OnlyMemory,CD‑ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。[0222] 以上对本发明实施例公开的基于均衡感知注意力网络的纺织品电商推荐方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
专利地区:广东
专利申请日期:2022-11-10
专利公开日期:2024-06-18
专利公告号:CN115587875B