可左右滑动选省市

问卷调查、模型训练方法、装置、设备、介质及产品

更新时间:2023-12-09
问卷调查、模型训练方法、装置、设备、介质及产品 专利申请类型:实用新型专利;
源自:北京高价值专利检索信息库;

专利名称:问卷调查、模型训练方法、装置、设备、介质及产品

专利类型:实用新型专利

专利申请号:CN202311501940.4

专利申请(专利权)人:北京百度网讯科技有限公司
权利人地址:北京市海淀区上地十街10号百度大厦2层

专利发明(设计)人:杨涛

专利摘要:本公开提供了问卷调查、模型训练方法、装置、设备、介质及产品,涉及人工智能领域,尤其涉及云计算、NLP、语音技术、深度学习等技术领域。具体实现方案为:确定目标调查问卷中处于激活状态的目标问题和所述目标问题对应的目标答案,并将所述目标问题和所述目标答案确定为目标问答对;根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得对话分析结果;若所述对话分析结果指示所述目标问题问答结束,则通过训练获得的对话流程控制模型,从所述目标调查问卷的剩余问题中选择下一个问题,所述剩余问题是指所述目标调查问卷中未完成问答的问题;输出所述下一个问题。

主权利要求:
1.一种问卷调查方法,包括:
确定目标调查问卷中处于激活状态的目标问题和所述目标问题对应的目标答案,并将所述目标问题和所述目标答案确定为目标问答对;
根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得对话分析结果;
若所述对话分析结果指示所述目标问题问答结束,则通过训练获得的对话流程控制模型,从所述目标调查问卷的剩余问题中选择下一个问题,所述剩余问题是指所述目标调查问卷中未完成问答的问题;
输出所述下一个问题;
若所述对话分析结果指示所述目标问题问答未结束,则生成所述目标问题对应的追问问题;
输出所述追问问题并采集所述追问问题的追问答案;
基于所述追问问题的追问答案,更新所述目标问题的目标答案;
其中,所述根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得对话分析结果,包括:根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得所述对话分析模型按照预设的对话输出结构输出的对话分析结果,所述对话输出结构包括标识结束参数;
若所述标识结束参数的参数值为预设目标参数值,则确定所述对话分析结果指示所述目标问题问答结束;若所述标识结束参数的参数值不为所述目标参数值,则确定所述对话分析结果指示所述目标问题问答未结束。
2.根据权利要求1所述的方法,其中,所述根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得对话分析结果,包括:获取所述目标调查问卷的历史问答对,所述历史问答对包括历史问题和所述历史问题对应的历史答案,所述历史问题为所述目标调查问卷中已完成问答的问题;
将所述目标问答对和所述历史问答对输入所述对话分析模型,获得所述对话分析模型输出的所述对话分析结果。
3.根据权利要求1或2所述的方法,其中,所述通过训练获得的对话流程控制模型,从所述目标调查问卷的剩余问题中选择下一个问题,包括:获取所述目标调查问卷的历史问答对;
将所述目标问答对和所述历史问答对输入所述训练获得的对话流程控制模型,获得所述对话流程控制模型输出的所述下一个问题,所述下一个问题是指所述对话流程控制模型从所述目标调查问卷的剩余问题中选择获得的。
4.根据权利要求1或2所述的方法,其中,所述确定目标调查问卷中处于激活状态的目标问题和所述目标问题对应的目标答案,包括:显示所述目标调查问卷中处于激活状态的目标问题;
响应于调查对象针对所述目标问题触发的答案生成操作,获得所述目标问题对应的目标答案。
5.根据权利要求1或2所述的方法,其中,所述确定目标调查问卷中处于激活状态的目标问题和所述目标问题对应的目标答案之前,还包括:显示调查问卷库中多个调查问卷;
响应于问卷调查方针对多个所述调查问卷执行的问卷选择操作,获得所述目标调查问卷;
将所述目标调查问卷中的第一个问题确定为处于激活状态的目标问题。
6.根据权利要求1或2所述的方法,其中,所述输出所述下一个问题,包括:将所述目标问题切换至睡眠状态,并将所述下一个问题切换为激活状态;
按照预设语音提问规则,将所述下一个问题转换为最新的目标语音,输出所述最新的目标语音。
7.一种模型训练方法,用于训练如权利要求1‑6任一项所述的对话分析模型,所述方法包括:确定对话分析数据集,所述对话分析数据集包括多个对话分析样本,所述对话分析样本包括:训练问答对和所述训练问答对的对话分析结果标签;
获取预训练获得的大型语言模型;
利用所述对话分析数据集,对所述大型语言模型进行有监督微调训练,直至满足预设分析终止条件;
基于所述满足预设分析终止条件时获得的大型语言模型,确定所述对话分析模型。
8.根据权利要求7所述的方法,其中,所述利用所述对话分析数据集,对所述大型语言模型进行有监督微调训练,直至所述大型语言模型满足预设分析终止条件,包括:在所述大型语言模型的基础上,构建第一权重矩阵;
固定所述大型语言模型的模型参数,利用所述对话分析数据集,对所述第一权重矩阵进行迭代训练,直至所述大型语言模型和所述第一权重矩阵输出的对话预测结果满足预设分析终止条件;
所述基于所述满足预设分析终止条件时获得的大型语言模型,确定所述对话分析模型,包括:将所述满足预设分析终止条件时的大型语言模型和所述第一权重矩阵确定为所述对话分析模型。
9.根据权利要求7或8所述的方法,其中,所述确定对话分析数据集,包括:响应于用户按照对话分析模式触发的样本输入操作,获得初始对话分析样本;
基于所述初始对话分析样本,对所述对话分析模式进行样本扩充,获得扩充对话分析样本;
将所述初始对话分析样本和所述扩充对话分析样本确定为所述对话分析数据集。
10.一种模型训练方法,用于训练如权利要求1‑6任一项所述的对话流程控制模型,所述方法包括:确定流程控制数据集,所述流程控制数据集包括多个流程控制样本,所述流程控制样本包括:训练问答对和所述训练问答对对应的下一个问题的问题标签;
获取预训练获得的大型语言模型;
利用所述流程控制数据集,对所述大型语言模型进行有监督微调训练,直至满足预设流程终止条件;
基于所述满足预设流程终止条件时获得的大型语言模型,确定所述对话流程控制模型。
11.根据权利要求10所述的方法,其中,所述利用所述流程控制数据集,对所述大型语言模型进行有监督微调训练,直至满足预设流程终止条件,包括:在所述大型语言模型的基础上,构建第二权重矩阵;
固定所述大型语言模型的模型参数,利用所述流程控制数据集,对所述第二权重矩阵进行迭代训练,直至所述大型语言模型和所述第二权重矩阵预测的下一个问题满足预设的流程终止条件;
所述基于所述满足预设流程终止条件时获得的大型语言模型,确定所述对话流程控制模型,包括:将所述满足预设流程终止条件时获得的第二权重矩阵和所述大型语言模型确定为所述对话流程控制模型。
12.根据权利要求10或11所述的方法,其中,所述确定流程控制数据集,包括:响应于用户按照流程控制模式触发的样本输入操作,获得初始流程控制样本;
基于所述初始流程控制样本,对所述流程控制模式进行样本扩充,获得扩充流程控制样本;
将所述初始流程控制样本和所述扩充流程控制样本确定为所述流程控制数据集。
13.一种问卷调查装置,包括:
确定单元,用于确定目标调查问卷中处于激活状态的目标问题和所述目标问题对应的目标答案,并将所述目标问题和所述目标答案确定为目标问答对;
分析单元,用于根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得对话分析结果;
选择单元,用于若所述对话分析结果指示所述目标问题问答结束,则通过训练获得的对话流程控制模型,从所述目标调查问卷的剩余问题中选择下一个问题,所述剩余问题是指所述目标调查问卷中未完成问答的问题;
输出单元,用于输出所述下一个问题;
问题追问单元,用于若所述对话分析结果指示所述目标问题问答未结束,则生成所述目标问题对应的追问问题;
追问采集单元,用于输出所述追问问题并采集所述追问问题的追问答案;
答案更新单元,用于基于所述追问问题的追问答案,更新所述目标问题的目标答案;
其中,所述分析单元,包括:
结构分析模块,用于根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得所述对话分析模型按照预设的对话输出结构输出的对话分析结果,所述对话输出结构包括标识结束参数;
所述装置还包括:
状态检测单元,用于根据所述标识结束参数的参数值,检测所述对话分析结果是否指示所述目标问题问答结束;
其中,所述状态检测单元,包括:
第一检测模块,用于若所述标识结束参数的参数值为预设目标参数值,则确定所述对话分析结果指示所述目标问题问答结束;
第二检测模块,用于若所述标识结束参数的参数值不为所述目标参数值,则确定所述对话分析结果指示所述目标问题问答未结束。
14.根据权利要求13所述的装置,其中,所述分析单元,包括:历史获取模块,用于获取所述目标调查问卷的历史问答对,所述历史问答对包括历史问题和所述历史问题对应的历史答案,所述历史问题为所述目标调查问卷中已完成问答的问题;
问答分析模块,用于将所述目标问答对和所述历史问答对输入所述对话分析模型,获得所述对话分析模型输出的所述对话分析结果。
15.根据权利要求13或14所述的装置,其中,所述选择单元,包括:历史获取模块,用于获取所述目标调查问卷的历史问答对;
第一输入模块,用于将所述目标问答对和所述历史问答对输入所述训练获得的对话流程控制模型,获得所述对话流程控制模型输出的所述下一个问题,所述下一个问题是指所述对话流程控制模型从所述目标调查问卷的剩余问题中选择获得的。
16.根据权利要求13或14所述的装置,其中,所述确定单元,包括:问题显示模块,用于显示所述目标调查问卷中处于激活状态的目标问题;
答案输入模块,用于响应于调查对象针对所述目标问题触发的答案生成操作,获得所述目标问题对应的目标答案。
17.根据权利要求13或14所述的装置,其中,还包括:问卷显示单元,用于显示调查问卷库中多个调查问卷;
问卷输出单元,用于响应于问卷调查方针对多个所述调查问卷执行的问卷选择操作,获得所述目标调查问卷;
目标确定单元,用于将所述目标调查问卷中的第一个问题确定为处于激活状态的目标问题。
18.根据权利要求13或14所述的装置,其中,所述输出单元,包括:第二切换单元,用于将所述目标问题切换至睡眠状态,并将所述下一个问题切换为激活状态;
第二输出单元,用于按照预设语音提问规则,将所述下一个问题转换为最新的目标语音,输出所述最新的目标语音。
19.一种模型训练装置,用于训练如权利要求1‑6任一项所述的对话分析模型,所述装置包括:第一确定单元,用于确定对话分析数据集,所述对话分析数据集包括多个对话分析样本,所述对话分析样本包括:训练问答对和所述训练问答对的对话分析结果标签;
第一获取单元,用于获取预训练获得的大型语言模型;
第一训练单元,用于利用所述对话分析数据集,对所述大型语言模型进行有监督微调训练,直至满足预设分析终止条件;
对话确定单元,用于基于所述满足预设分析终止条件时获得的大型语言模型,确定所述对话分析模型。
20.根据权利要求19所述的装置,其中,所述第一训练单元,包括:第一构建模块,用于在所述大型语言模型的基础上,构建第一权重矩阵;
第一训练模块,用于固定所述大型语言模型的模型参数,利用所述对话分析数据集,对所述第一权重矩阵进行迭代训练,直至所述大型语言模型和所述第一权重矩阵输出的对话预测结果满足预设分析终止条件;
所述对话确定单元,包括:
对话确定模块,用于将所述满足预设分析终止条件时的大型语言模型和所述第一权重矩阵确定为所述对话分析模型。
21.根据权利要求19或20所述的装置,其中,所述第一确定单元,包括:第一获取模块,用于响应于用户按照对话分析模式触发的样本输入操作,获得初始对话分析样本;
第一扩充模块,用于基于所述初始对话分析样本,对所述对话分析模式进行样本扩充,获得扩充对话分析样本;
第一确定模块,用于将所述初始对话分析样本和所述扩充对话分析样本确定为所述对话分析数据集。
22.一种模型训练装置,用于训练如权利要求1‑6任一项所述的对话流程控制模型,所述装置包括:第二确定单元,用于确定流程控制数据集,所述流程控制数据集包括多个流程控制样本,所述流程控制样本包括:训练问答对和所述训练问答对对应的下一个问题的问题标签;
第二获取单元,用于获取预训练获得的大型语言模型;
第二训练单元,用于利用所述流程控制数据集,对所述大型语言模型进行有监督微调训练,直至满足预设流程终止条件;
流程确定单元,用于基于所述满足预设流程终止条件时获得的大型语言模型,确定所述对话流程控制模型。
23.根据权利要求22所述的装置,其中,所述第二训练单元,包括:第二构建模块,用于在所述大型语言模型的基础上,构建第二权重矩阵;
第二训练模块,用于固定所述大型语言模型的模型参数,利用所述流程控制数据集,对所述第二权重矩阵进行迭代训练,直至所述大型语言模型和所述第二权重矩阵预测的下一个问题满足预设的流程终止条件;
所述流程确定单元,包括:
流程确定模块,用于将所述满足预设流程终止条件时获得的第二权重矩阵和所述大型语言模型确定为所述对话流程控制模型。
24.根据权利要求22或23所述的装置,其中,所述第二确定单元,包括:第二获取模块,用于响应于用户按照流程控制模式触发的样本输入操作,获得初始流程控制样本;
第二扩充模块,用于基于所述初始流程控制样本,对所述流程控制模式进行样本扩充,获得扩充流程控制样本;
第二确定模块,用于将所述初始流程控制样本和所述扩充流程控制样本确定为所述流程控制数据集。
25.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑6、7‑9或10‑12中任一项所述的方法。
26.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑6、7‑9或10‑12中任一项所述的方法。
27.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1‑6、7‑9或10‑12中任一项所述方法的步骤。 说明书 : 问卷调查、模型训练方法、装置、设备、介质及产品技术领域[0001] 本公开涉及人工智能领域中的云计算、NLP、语音技术、深度学习等技术领域,尤其涉及一种问卷调查、模型训练方法、装置、设备、介质及产品。背景技术[0002] 问卷调查是一种采集调查对象对问题的答案,以获得意见调查结果的方法。问卷调查可以包括多个问题,多个问题顺序排列,并确定顺序排列的多个问卷调查表。之后,可以将问卷调查表分发给调查对象。调查对象填写答案之后,将填写完毕的问卷调查表反馈给调查方。[0003] 但是,上述问卷调查的方式中,各个问题是固定的,调查对象填写答案时,较为随意,造成问卷调查的回答有效性不高。发明内容[0004] 本公开提供了一种用于问卷调查的问卷调查、模型训练方法、装置、设备、介质及产品。[0005] 根据本公开的第一方面,提供了一种问卷调查方法,包括:[0006] 确定目标调查问卷中处于激活状态的目标问题和所述目标问题对应的目标答案,并将所述目标问题和所述目标答案确定为目标问答对;[0007] 根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得对话分析结果;[0008] 若所述对话分析结果指示所述目标问题问答结束,则通过训练获得的对话流程控制模型,从所述目标调查问卷的剩余问题中选择下一个问题,所述剩余问题是指所述目标调查问卷中未完成问答的问题;[0009] 输出所述下一个问题。[0010] 根据本公开的第二方面,提供了一种模型训练方法,用于训练对话分析模型,所述方法包括:[0011] 确定对话分析数据集,所述对话分析数据集包括多个对话分析样本,所述对话分析样本包括:训练问答对和所述训练问答对的对话分析结果标签;[0012] 获取预训练获得的大型语言模型;[0013] 利用所述对话分析数据集,对所述大型语言模型进行有监督微调训练,直至满足预设分析终止条件;[0014] 基于所述满足预设分析终止条件时获得的大型语言模型,确定所述对话分析模型。[0015] 根据本公开的第三方面,提供了一种模型训练方法,用于训练对话流程控制模型,所述方法包括:[0016] 确定流程控制数据集,所述流程控制数据集包括多个流程控制样本,所述流程控制样本包括:训练问答对和所述训练问答对对应的下一个问题的问题标签;[0017] 获取预训练获得的大型语言模型;[0018] 利用所述流程控制数据集,对所述大型语言模型进行有监督微调训练,直至满足预设流程终止条件;[0019] 基于所述满足预设流程终止条件时获得的大型语言模型,确定所述对话流程控制模型。[0020] 根据本公开的第四方面,提供了一种问卷调查装置,包括:[0021] 确定单元,用于确定目标调查问卷中处于激活状态的目标问题和所述目标问题对应的目标答案,并将所述目标问题和所述目标答案确定为目标问答对;[0022] 分析单元,用于根据训练获得的对话分析模型,对所述目标问答对进行对话分析,获得对话分析结果;[0023] 选择单元,用于若所述对话分析结果指示所述目标问题问答结束,则通过训练获得的对话流程控制模型,从所述目标调查问卷的剩余问题中选择下一个问题,所述剩余问题是指所述目标调查问卷中未完成问答的问题;[0024] 输出单元,用于输出所述下一个问题。[0025] 根据本公开的第五方面,提供了一种模型训练装置,用于训练对话分析模型,所述装置包括:[0026] 第一确定单元,用于确定对话分析数据集,所述对话分析数据集包括多个对话分析样本,所述对话分析样本包括:训练问答对和所述训练问答对的对话分析结果标签;[0027] 第一获取单元,用于获取预训练获得的大型语言模型;[0028] 第一训练单元,用于利用所述对话分析数据集,对所述大型语言模型进行有监督微调训练,直至满足预设分析终止条件;[0029] 对话确定单元,用于基于所述满足预设分析终止条件时获得的大型语言模型,确定所述对话分析模型。[0030] 根据本公开的第六方面,提供了一种模型训练装置,用于训练对话流程控制模型,所述装置包括:[0031] 第二确定单元,用于确定流程控制数据集,所述流程控制数据集包括多个流程控制样本,所述流程控制样本包括:训练问答对和所述训练问答对对应的下一个问题的问题标签;[0032] 第二获取单元,用于获取预训练获得的大型语言模型;[0033] 第二训练单元,用于利用所述流程控制数据集,对所述大型语言模型进行有监督微调训练,直至满足预设流程终止条件;[0034] 流程确定单元,用于基于所述满足预设流程终止条件时获得的大型语言模型,确定所述对话流程控制模型。[0035] 根据本公开的第七方面,提供了一种电子设备,包括:[0036] 至少一个处理器;以及[0037] 与至少一个处理器通信连接的存储器;其中,[0038] 存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面、第二方面或者第三方面的方法。[0039] 根据本公开的第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行根据第一方面、第二方面或者第三方面的方法。[0040] 根据本公开的第九方面,提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行第一方面、第二方面或者第三方面的方法。[0041] 根据本公开的技术方案中,可以确定目标调查问卷中处于激活状态的目标问题和目标问题对应的目标答案,并将目标问题和目标答案确定为目标问答对,目标问答对可以使目标问题和目标答案作为一个整体进行分析。之后,可以利用训练获得的对话分析模型对目标问答对进行对话分析,获得对话分析结果。对话分析结果中可以用于检测目标问题是否问答结束,若结束,则可以在此基础上,通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中可以选择下一个问题,而剩余问题可以是指目标调查问卷中未完成问答的问题,下一个问题输出之后可以继续问答。通过上述流程可以实现目标调查问卷中的问题的问答结束检测和问题的自动决策,实现对调查问卷过程中的整体把控,有效提升了调查问卷的调查效率和有效性。[0042] 应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明[0043] 附图用于更好地理解本方案,不构成对本公开的限定。其中:[0044] 图1是根据本公开实施例提供的一种问卷调查系统的应用示意图;[0045] 图2是根据本公开第一实施例的示意图;[0046] 图3是根据本公开实施例提供的一种答案输入的示例图;[0047] 图4是根据本公开实施例提供的一种答案选择的示例图;[0048] 图5是根据本公开实施例提供的一种问卷调查方法的流程示例图;[0049] 图6是根据本公开第二实施例的示意图;[0050] 图7是根据本公开实施例提供的一种对话分析模型训练的示意图;[0051] 图8是根据本公开第三实施例的示意图;[0052] 图9是根据本公开实施例提供的一种对话流程控制模型训练的示意图;[0053] 图10是根据本公开第四实施例的示意图;[0054] 图11是根据本公开第五实施例的示意图;[0055] 图12是根据本公开第六实施例的示意图;[0056] 图13是根据本公开实施例提供的一种电子设备的框图。具体实施方式[0057] 以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。[0058] 本公开提供一种问卷调查方法、装置、设备、介质及产品,应用于人工智能领域中的云计算、NLP(NaturalLanguageProcessing,自然语言处理)、语音技术、深度学习等技术领域,以达到提高问卷调查效率和有效性的目标。[0059] 相关技术中,问卷调查时,可以包括多个问题,多个问题可以顺序排列,顺序排列的问题可以为用户展示。每个问题需要调查对象回复,例如从候选结果中选定目标结果或者直接采集调查对象输入的目标结果。又例如,可以将问卷调查表分发给调查对象。调查对象填写答案之后,将填写完毕的问卷调查表反馈给调查方。但是上述问卷调查表的采集方式,各个问题展示给调查对象之后,调查对象填写答案时,较为随意,造成问卷调查的回答有效性不高。[0060] 为了解决上述问题,本公开考虑将大模型应用于问卷调查场景中。通过大模型训练对话分析模型和对话流程控制模型。通过对象分析模型对问答过程进行分析以获取更高质量的对话,而对话流程控制模型可以实现对话的自动决策,提升调查对象的回复意愿,进而提供更加有效的回复,提高调查问卷的有效性,最终达到提升问卷调查效率和有效性的目标。[0061] 本公开的技术方案中,可以确定目标调查问卷中处于激活状态的目标问题和目标问题对应的目标答案,并将目标问题和目标答案确定为目标问答对,目标问答对可以使目标问题和目标答案作为一个整体进行分析。之后,可以利用训练获得的对话分析模型对目标问答对进行对话分析,获得对话分析结果。对话分析结果中可以用于检测目标问题是否问答结束,若结束,则可以在此基础上,通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中可以选择下一个问题,而剩余问题可以是指目标调查问卷中未完成问答的问题,下一个问题输出之后可以继续问答。通过上述流程可以实现目标调查问卷中的问题的问答结束检测和问题的自动决策,实现对调查问卷过程中的整体把控,有效提升了调查问卷的调查效率和有效性。[0062] 下面将结合附图对本公开的技术方案详细说明。[0063] 图1示出了本公开实施例提供的一种问卷调查系统的应用示意图,参考图1所示的问卷调查系统,可以包括:电子设备11、模型训练装置12、模型训练装置13以及用户终端14。[0064] 其中,模型训练装置12可以用于训练对话分析模型10。模型训练装置13可以用于训练对话流程控制模型20。[0065] 在获得对话分析模型10和对话流程控制模型20之后,可以将对话分析模型10和对话流程控制模型20配置于电子设备11。[0066] 电子设备11可以配置本公开的问卷调查方法。该问卷调查方法可以确定目标调查问卷中处于激活状态的目标问题和目标问题对应的目标答案,并将目标问题和目标答案确定为目标问答对;根据训练获得的对话分析模型10,对目标问答对进行对话分析,获得对话分析结果;若对话分析结果指示目标问题问答结束,则通过训练获得的对话流程控制模型20,从目标调查问卷的剩余问题中选择下一个问题,剩余问题是指目标调查问卷中未完成问答的问题;输出下一个问题。通过不断获取目标问题,并根据目标问题进行下一个问题的选择,实现问卷调查的持续性进行,提高问卷调查效率。[0067] 图2为本公开第一实施例的示意图,参考图2所示的问卷调查方法,可以包括下列步骤:[0068] 201、确定目标调查问卷中处于激活状态的目标问题和目标问题对应的目标答案,并将目标问题和目标答案确定为目标问答对。[0069] 其中,目标调查问卷可以为调查问卷库中的调查问卷。可以从调查问卷库中选择满足问卷需求的目标调查问卷。具体地,问卷需求可以是指问卷调查方输入的需求信息,可以将调查问卷库中多个调查问卷分别对应的问卷信息与需求信息进行匹配,获得多个调查问卷分别对应的需求匹配度,将需求匹配度最高的调查问卷确定为目标调查问卷。问卷信息可以是指问卷标题、问卷关键词、关键语句等一种或多种信息。[0070] 可选地,激活状态可以是指问题处于需要进行答案采集的状态。与激活状态相对的状态为睡眠状态。睡眠状态可以是指问题已采集到答案或者问题等待启动采集答案。[0071] 目标问题对应的目标答案可以是指调查对象为目标问题提供的答案。例如目标答案可以是指调查对象从多个候选答案中选择的答案,目标答案还可以是指调查对象针对目标问题输入的答案。[0072] 在一种可能的设计中,目标问题可以为目标调查问卷中的第一个问题或者通过对话流程控制模型从目标调查问卷的剩余问题中决策的下一个问题。[0073] 202、根据训练获得的对话分析模型,对目标问答对进行对话分析,获得对话分析结果。[0074] 可选地,对话分析模型可以用于对输入的问答对进行对话分析,输出对话分析结果。[0075] 对话分析模型可以通过大型语言模型训练获得。关于对话分析模型的训练过程可以参考下列实施例的描述,在此不再赘述。[0076] 对话分析结果可以按照对话输出结构表示,以使得对话分析结果的表述统一化,便于对话分析结果的管理。[0077] 203、若对话分析结果指示目标问题问答结束,则通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中选择下一个问题,剩余问题是指目标调查问卷中未完成问答的问题。[0078] 可选地,对话流程控制模型可以根据输入的目标问答对,从目标调查问卷的剩余问题中选择下一个问题。[0079] 对话流程控制模型可以通过大型语言模型训练获得。关于对话流程控制模型的训练过程可以参考下列实施例的描述,在此不再赘述。[0080] 可选地,通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中选择下一个问题,可以包括:利用目标问题,通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中选择下一个问题。[0081] 进一步地,通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中选择与目标问题相关的下一个问题。[0082] 其中,选择与目标问题相关的下一个问题,可以是指通过对话流程控制模型对目标问题的提问意图进行识别,获得目标问题的提问意图。根据目标问题的提问意图,可以通过对话流程控制模型从剩余问题中选择与目标问题的提问意图关联度最高的问题,将该问题确定为下一个问题。[0083] 进一步地,对话流程控制模型中可以包括大型语言模型,该大型语言模型可以识别目标问题的提问意图。[0084] 可选地,对话分析结果指示目标问题问答结束还可以包括:对话分析结果中的目标问题为最后一个未问答的问题,则确定目标问题问答结束。[0085] 204、输出下一个问题。[0086] 可选地,步骤204,可以包括:将下一个问题切换至激活状态。将目标问题切换至睡眠状态。将下一个问题作为新的目标问题输出。[0087] 获取输出的下一个问题为最新的目标问题。采集调查对象对目标问题提供的目标答案。[0088] 作为一种可选实施方式,问题的输出方式可以包括多种,例如可以通过即时通讯方式、短时对话方式、语音输出方式等任意一种,本实施例中对问题的输出方式并不过多限定。相应地,各问题的答案的采集方式与问题的输出方式可以相同。例如,采用语音输出方式输出问题时,可以通过语音采集方式采集该问题的答案。[0089] 本公开的技术方案中,可以确定目标调查问卷中处于激活状态的目标问题和目标问题对应的目标答案,并将目标问题和目标答案确定为目标问答对,目标问答对可以使目标问题和目标答案作为一个整体进行分析。之后,可以利用训练获得的对话分析模型对目标问答对进行对话分析,获得对话分析结果。对话分析结果中可以用于检测目标问题是否问答结束,若结束,则可以在此基础上,通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中可以选择下一个问题,而剩余问题可以是指目标调查问卷中未完成问答的问题,下一个问题输出之后可以继续问答。通过上述流程可以实现目标调查问卷中的问题的问答结束检测和问题的自动决策,实现对调查问卷过程中的整体把控,有效提升了调查问卷的调查效率和有效性。[0090] 为使读者更深刻地理解本公开的实现原理,现结合以下图3‑图5对图2所示的实施例进行进一步细化。[0091] 为了使得对话分析更准确,进一步地,在上述任一实施例的基础上,根据训练获得的对话分析模型,对目标问答对进行对话分析,获得对话分析结果,包括:[0092] 获取目标调查问卷的历史问答对,历史问答对包括历史问题和历史问题对应的历史答案,历史问题为目标调查问卷中已完成问答的问题;[0093] 将目标问答对和历史问答对输入对话分析模型,获得对话分析模型输输出的对话分析结果。[0094] 可选地,获取目标调查问卷的历史问答对,可以包括:获取目标答案的时间戳为目标采集时间,根据目标采集时间,查询时间戳位于该目标采集时间之间的历史问答对。进一步地,可以查询时间戳位于该目标采集时间之前且与同一调查对象关联的历史问答对。[0095] 可选地,获取目标调查问卷的历史问答对,还可以包括:获取调查对象已回复的历史问题,以及各历史问题对应的历史答案,将历史问题和该历史问题对应的历史答案确定为历史问答对。[0096] 其中,将目标问答对和历史问答对输入对话分析模型之后,对话分析模型可以基于历史问答对,对目标问答对进行分析,获得对话分析模型输输出的对话分析结果。历史问答对可以作为目标问答对的对话分析过程的参考信息,可以使得目标问答对的对话分析结果更准确。[0097] 本公开的技术方案中,通过获取目标调查问卷的历史问答对,并将目标问答对和历史问答对输入到对话分析模型,使得对话分析模型既提取到目标问答对的特征又提取到历史问答对的特征。将历史问答对参与到目标问答对的分析过程,可以使得目标问答对的分析并非是孤立的,而是将已完成问答的历史问答对作为分析参照,可以使得目标问答对的分析内容更完善,分析过程更全面,获得的对话分析结果更准确。进而利用更准确更全面的对话分析结果参与到后续的问题决策,可以使得问题决策与用户的历史问答对应度更高,提高用户回答的积极性,进一步提升回复有效性和可靠性。[0098] 为了便于对话分析结果的统一管理,作为一个实施例,根据训练获得的对话分析模型,对目标问答对进行对话分析,获得对话分析结果,包括:[0099] 根据训练获得的对话分析模型,对目标问答对进行对话分析,获得对话分析模型按照预设的对话输出结构输出的对话分析结果,对话输出结构包括结束标识参数。[0100] 方法还包括:[0101] 根据标识结束参数的参数值,检测对话分析结果是否指示目标问题问答结束。[0102] 可选地,对话分析结构可以是指为对话分析预先设置的用于存储对话分析结果的结构性参数。对话分析结构可以使用(key(键),value(值))来存储对话分析结果。其中,key具体可以为设置的参数,value具体可以为参数对应的参数值。[0103] 示例性地,对话分析结构中的参数可以包括:当前问题参数、思考过程参数、标识结束参数以及问题答案参数。[0104] 其中,当前问题参数的参数值为目标问题。思考过程参数的参数值为输出的思考过程。标识结束参数的参数值为是或否。问题答案参数为目标答案。[0105] 以上述对话分析结构输出的对话分析结果例如可以为:[0106] {[0107] "当前问题参数":"<调查问卷当前问题>",[0108] "思考过程参数:":"<输出思考过程>",[0109] "标识结束参数":"<是/否>",[0110] "问题答案参数":"<问题答复>"[0111] }[0112] 本公开的技术方案中,对话分析模型中可以设置对话输出结构,可以使得对话分析模型输出的结果使用统一的对话输出结果输出,进而消除不同问题和答案之间的结构化差异。而根据对话输出结构中可以包括结束标识参数,通过标识结束参数的参数值,可以快速检测对话分析结果是否问答结束。提高问答结束的检测效率,而参数值可以明确标识是否结束,可以避免出现结束判别错误的现象,有利于提升问答结束与否的检测准确性。而问答结束检测效率和准确性的提升可以进一步提高整个问卷调查的速度。[0113] 对话分析结果中可以包括标识结束参数,该标识结束参数可以用于判断是否问答结束。进一步地,根据标识结束参数的参数值,检测对话分析结果是否指示目标问题问答结束,包括:[0114] 若标识结束参数的参数值为预设目标参数值,则确定对话分析结果指示目标问题问答结束;[0115] 若标识结束参数的参数值不为目标参数值,则确定对话分析结果指示目标问题问答未结束。[0116] 可选地,目标参数值可以为是。也即标识参数值的参数值为是,则可以确定对话分析结果指示目标问题问答结束。而标识参数值的参数值为否,则可以确定对话分析结果指示目标问题问答未结束。[0117] 本公开的技术方案中,利于标识结束参数的参数值来进行目标问题的问答结束时,直接将标识结束参数的参数值与预设的目标参数值进行比对,若比对成功,则可以确定问答结束,若比对不成功,则确定问答未结束。通过目标参数值的设置可以使得对话结束的检测效率更高,准确度更高。[0118] 进一步地,在上述任一实施例的基础上,还包括:[0119] 若对话分析结果指示目标问题问答未结束,则生成目标问题对应的追问问题;[0120] 输出追问问题,并获取追问问题对应的追问答案;[0121] 基于追问问题的追问答案,更新目标问题的目标答案。[0122] 可选地,目标问题问答未结束时,则可以基于目标问题和目标答案,生成追问问题。追问问题可以是指与目标问题相关的问题。例如,假设目标问题为“请问今天天气怎么样”,目标答案为“不太好”。追问问题可以为“不太好具体是什么样”。[0123] 通过追问问题,可以对目标问题进行追问,进而使得目标问题的答案更完善,获得更有效的目标答案。[0124] 可选地,基于追问问题的追问答案,更新目标问题的目标答案之后,可以返回至少步骤201中将目标问题和目标答案确定为目标问答对继续执行,直至目标问题问答结束。[0125] 当然,在实际应用中,若对话分析结果指示目标问题问答未结束的次数超过预设次数阈值,则终止此次问卷调查。[0126] 本公开的技术方案中,在对话分析结果指示目标问题问答未结束时,则对目标问题生成相应的追问问题,获取追问问题的追问答案,通过追问问题的追问答案更新目标问题的目标答案。通过追问可以使得目标问题更丰富,获得更多的答案,进而实现更有效的答案采集。此外,在问答对不满足需求时,再次追问时,设置追问问题,可以实现对目标答案进行多伦采集,避免因用户答复不准确导致目标答案不符合需要的现象,进一步提高了问卷调查效率和有效性。[0127] 为了实现更准确的对话流程控制,作为一个实施例,通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中选择下一个问题,包括:[0128] 获取目标调查问卷的历史问答对。[0129] 将目标问答对和历史问答对输入训练获得的对话流程控制模型,获得对话流程控制模型输出的下一个问题,下一个问题是指对话流程控制模型从目标调查问卷的剩余问题中选择获得的。[0130] 可选地,历史问答对和目标问答对可以作为对话流程控制模型的输入数据,使得对话流程控制模型对目标问答对和其相关的历史问答对进行流程决策,选择下一个问题,实现下一个问题的自动选择。[0131] 可选地,除上述实施例中涉及到的历史问答对的获取方式之外,获取目标调查问卷的历史问答对还可以包括:按照预设问答对数量,获取调查对象关联的历史问答对,使得历史问答对的数量与该预设问答对数量相等。例如可以获取前10个历史问答对,参与到对话流程控制和对话分析。[0132] 本公开的技术方案中,在利用对话流程控制模型决策下一个问题时,可以将目标问答对和历史问答对均输入到训练获得的对话流程控制模型,可以使得对话流程控制模型学习到目标问题之前的历史问题,对问题的相关流程具备更丰富的知识,因此,提供更准确的问题决策参考,提高使得下一个问题的选择与目标问题对和历史问题对的关系更紧密,提高下一个问题的选择有效性。[0133] 进一步地,在上述任一实施例的基础上,确定目标调查问卷中处于激活状态的目标问题和目标问题对应的目标答案,包括:[0134] 显示目标调查问卷中处于激活状态的目标问题。[0135] 响应于调查对象针对目标问题触发的答案生成操作,获得目标问题对应的目标答案。[0136] 可选地,显示目标调查问卷中处于激活状态的目标问题可以是指通过用户终端的显示屏幕显示目标调查问卷中处于激活状态的目标问题。具体地,目标调查问卷中处于激活状态的目标问题可以生成问题显示页面。并将问题显示页面在用户终端的显示屏幕中显示。[0137] 可选地,任意问题可以关联至少一个候选答案也可以直接进行问题的采集。[0138] 进一步地,答案生成操作可以包括:调查对象触发答案输入区域的输入操作之后,执行的答案输入操作。[0139] 为了便于理解,图3示出了一种答案输入的示例图,参考图3所示的问题答复页面300,可以包括问题展示区域301、答案输入区域302。其中,问题展示区域301可以用于显示处于激活状态的目标问题。例如,该问题展示区域301中显示了“请您回答下列问题:1、问题一”其中,问题一为目标问题。而答案输入区域302用于显示输输入的答案。图3中的软键盘303可以用于响应调查对象的输入操作,获得调查对象输入的答案。[0140] 进一步地,答案生成操作还可以包括:调查对象针对目标问题关联的多个候选答案执行的答案选择操作。[0141] 图4示出了一种答案选择的示例图。参考图4所示的答案选择页面400,可以包括问题提示区域401、答案提示区域402。其中,答案提示区域402中显示“问题二”的多个候选答案,分别为A、答案1,B答案2,C、答案3,D、答案4等四个候选答案。检测调查对象对任意候选答案执行的点击操作,则可以确定该调查对象点击的答案为目标答案。[0142] 当然,上述问题的输出方式仅是示例性的并不构成输出方式的具体限定。[0143] 本公开的技术方案中,在获取目标问题对应的目标答案时,可以先显示目标调查问卷中处于激活状态的目标问题,目标问题的显示可以指示调查对象进行答复。进而可以响应于调查对象针对目标问题触发的答案生成操作,获得目标问题对应的目标答案,实现目标答案的用户输入。通过与用户的交互可以实现对目标问题对应的目标答案的实时性采集,进而及时采用问卷调查方法对目标问题和目标答案进行对话分析、下一个对话决策等处理,可以提高整个问卷调查方法的时效性,进一步提升问卷调查效率。[0144] 进一步地,在上述任一实施例的基础上,确定目标调查问卷中处于激活状态的目标问题和目标问题对应的目标答案之前,还包括:[0145] 显示调查问卷库中多个调查问卷;[0146] 响应于问卷调查方针对多个调查问卷执行的问卷选择操作,获得目标调查问卷;[0147] 将目标调查问卷中的第一个问题确定为处于激活状态的目标问题。[0148] 进一步地,在上述任一实施例的基础上,输出下一个问题,包括:[0149] 将目标问题切换至睡眠状态,并将下一个问题切换为激活状态;[0150] 按照预设语音提问规则,将下一个问题转换为最新的目标语音,输出最新的目标语音。[0151] 可选地,语音提问规则可以包括提问语气、提问语调、提问声音大小、声音播放类型等规则,可以通过语音提问规则,将下一个问题转化为目标语音,使得目标语音播放时符号语音提问规则。[0152] 本公开的技术方案中,可以显示问卷调查库中的多个调查问卷,进而可以响应于问卷调查方这对多个调查问卷执行的问卷选择操作,可以获得目标调查问卷。通过问卷的显示与选择,问卷调查方可以对整个问卷调查过程进行决策,可以使得参与调查的目标调查问卷与问卷调查方的实际需求更匹配。而在调查启动时,可以将目标调查问卷中的第一个问题确定为处于激活状态的目标问题,实现目标问题的初步确定,进而执行后续的目标答案的采集和下一个问题的决策两个关键步骤的循环,实现目标调查问卷的连续性调查,有效提升了问卷调查效率。此外,按照预设语音提问规则,将下一个问题转换为最新的目标语音,输出最新的目标语音,可以使得下一个问题输出时,更具个性化的语音输出,输出效率更高进而提升调查对象参与调查的积极性,提升答案的质量。[0153] 图5示出了本公开实施例提供的一种问卷调查方法的流程示例图,参考图5,对于调查问卷库中的多个调查问卷,可以从中选择目标调查问卷。进而目标调查问卷中的目标问题可以输出至调查对象。该目标问题可以为对话流程控制模型决策出的下一个问题或者目标调查问卷中的第一个问题。在输出目标问题之后,可以与调查对象对话,获得目标问题对应的目标答案,进而确定目标问题和目标答案对应的目标问答对。之后可以通过对话分析模型,对目标问答对进行对话分析,获得对话分析结果;若对话分析结果指示目标问题问答结束,则通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中选择下一个问题;输出下一个问题,进而实现从问题到流程决策的循环,直至问卷调查结束。[0154] 图6示出了本公开第二实施例的示意图,参考图6所示的模型训练方法,用于训练如上述任一实施例所涉及对话分析模型,该模型训练方法可以包括下列步骤:[0155] 601、确定对话分析数据集,对话分析数据集包括多个对话分析样本,对话分析样本包括:训练问答对和训练问答对的对话分析结果标签。[0156] 可选地,训练问答对可以是指参与训练的问答对和该问答对关联的历史问答对。参与训练的问答对可以与上述实施例中的目标问答对等同。在一种可能的设计中,可以将目标问答对参与到对话分析模型的优化。[0157] 对话分析结果标签可以为训练问答对对应的真实对话分析结果。[0158] 602、获取预训练获得的大型语言模型。[0159] 可选地,大型语言模型(LLM,LargeLanguageModel)可以是指预先训练获得的大模型,可以用于自然语言理解、自然语言识别等各类语言处理。大型语言模型可以为现有的任意一种大模型。[0160] 其中,获取预训练获得的大型语言模型,可以包括:从大型语言模型的模型存储文件中加载该大型语言模型。[0161] 603、利用对话分析数据集,对大型语言模型进行有监督微调训练,直至满足预设分析终止条件。[0162] 其中,有监督微调训练可以是指有监督微调算法对应的模型训练。有监督微调算法例如可以为Lora(Low‑RankAdaptationofLargeLanguageModels,大语言模型的低阶适应)算法,本公开中对有监督微调算法的具体算法类型并不过多限定。[0163] 可选地,预设分析终止条件可以是指大型语言模型达到收敛条件。[0164] 604、基于满足预设分析终止条件时获得的大型语言模型,确定对话分析模型。[0165] 本公开的技术方案中,确定对话分析数据集之后,可以利用对话分析数据集对大型语言模型进行有监督微调训练,直至满足预设的分析终止条件,进而基于满足预设分析终止条件时获得的大型语言模型,确定对话分析模型。在已训练获得的大型语言模型的基础上,进行有监督微调训练,可以使得对话分析模型的训练难度降低,可以有效提高对话模型的训练效率,降低对话分析模型的训练难度。[0166] 进一步地,在上述任一实施例的基础上,利用对话分析数据集,对大型语言模型进行有监督微调训练,直至大型语言分析模型满足预设分析终止条件,包括:[0167] 在大型语言模型的基础上,构建第一权重矩阵。[0168] 固定大型语言模型的模型参数,利用对话分析数据集,对第一权重矩阵进行迭代训练,直至大型语言模型和第一权重矩阵输出的对话预测结果满足预设的分析终止条件。[0169] 基于满足预设分析终止条件时获得的大型语言模型,确定对话分析模型,包括:[0170] 将满足分析终止条件时的大型语言模型和第一权重矩阵确定为对话分析模型。[0171] 构建第一权重矩阵具体可以是指构建与大型语言模型并行的第一权重矩阵。[0172] 可选地,假设大型语言模型的模型参数为W0第一权重矩阵的矩阵参数为ΔW1,模型输入为x,则模型输出公式为:h=W0x+ΔW1x。在大型语言模型W0固定的情况下,对ΔW1进行迭代训练,获得最终的ΔW1。进而将ΔW1对应的第一权重矩阵和W0对应的大型语言模型确定为对话分析模型。[0173] 如图7所示,示出了一种对话分析模型训练的示意图,大型语言模型701固定不动,与该大型语言模型701并列的第一权重矩阵702进行迭代训练。大型语言模型701的输出和第一权重矩阵702的输出加权之后,可以获得对话预测结果。对话预测结果和对话分析结果标签进行损失计算,获得分析损失。若检测分析损失小于预设的分析阈值,则确定满足预设的分析终止条件。[0174] 本公开的技术方案中,可以在大型语言模型的基础上,构建第一权重矩阵,使得第一权重矩阵与大型语言模型并列。进而固定大型语言模型的模型参数,利用对话分析数据集,对第一权重矩阵进行迭代训练,直至大型语言模型和第一权重矩阵输出的对话预测结果满足预设的分析终止条件,进而可以将满足分析终止条件时的大型语言模型和第一权重矩阵确定为对话分析模型。有监督的微调训练可以是指对与预训练的大型语言模型的基础上增加第一权重矩阵的训练,对第一权重矩阵的参数进行调整即可以完成迭代训练。相较于大模型的参数量,第一权重矩阵的参数量较少,可以实现以较少的参数调整实现具备对话分析功能的对话分析模型的训练,提高对话分析模型的训练效率,降低对话分析模型的训练难度。[0175] 而为了获取更多的训练样本,在一种可能的设计中,确定对话分析数据集,包括:[0176] 响应于用户按照对话分析模式触发的样本输入操作,获得初始对话分析样本;[0177] 基于初始对话分析样本,对对话分析模式进行样本扩充,获得扩充对话分析样本;[0178] 将初始对话分析样本和扩充对话分析样本确定为对话分析数据集。[0179] 可选地,基于初始对话分析样本,对对话分析模式所需样本进行样本扩充,获得扩充对话分析样本,包括:从调查问卷库的调查问卷中确定扩充问题;利用预训练获得的大型语言模型,生成扩充问题对应的扩充答案,并将扩充问题和扩充答案确定为的扩充问答对;以初始对话分析样本中的对话分析结果标签为输出目标,通过大型语言模型生成扩充问答对对应的对话分析结果标签;将扩充问答对和扩充问答对对应的对话分析结果标签确定为扩充对话分析样本。[0180] 本公开的技术方案中,可以在用户执行样本输入操作的基础上获得初始对话分析样本,进而基于初始对话分析样本,进行样本扩充,获得扩充对话分析样本,获得初始对话分析样本和扩充对话分析样本对应的对话分析数据集,可以在人工提供的样本的基础上,实现样本扩充,增加了样本数量,使得对话分析数据集的样本更丰富。因此,利用对话分析数据集可以对对话分析模型进行更准确的训练,提高对话分析模型的模型精度。[0181] 图8示出了本公开第三实施例的示意图,参考图8所示的模型训练方法,可以用于训练上述任一实施例所涉及的对话流程控制模型,该模型训练方法可以包括下列步骤:[0182] 801、确定流程控制数据集,流程控制数据集包括多个流程控制样本,流程控制样本包括:训练问答对和训练问答对对应的下一个问题的问题标签。[0183] 可选地,训练问答对可以是指参与训练的问答对和该问答对关联的历史问答对。参与训练的问答对可以与上述实施例中的目标问答对等同。在一种可能的设计中,可以将目标问答对参与到对话分析模型的优化。[0184] 下一个问题的问题标签可以是指训练问答对对应的真实的下一个问题。[0185] 802、获取预训练获得的大型语言模型。[0186] 本实施例中部分步骤与前述实施例中部分步骤相同,在此不再赘述。[0187] 803、利用流程控制数据集,对大型语言模型进行有监督微调训练,直至满足预设流程终止条件;[0188] 804、基于满足预设流程终止条件时获得的大型语言模型,确定对话流程控制模型。[0189] 本公开的技术方案中,确定流程控制数据集之后,可以利用流程控制数据集对大型语言模型进行有监督微调训练,直至满足预设的分析终止条件,进而基于满足预设分析终止条件时获得的大型语言模型,确定对话流程控制模型。在已训练获得的大型语言模型的基础上,进行对话流程控制的训练,可以使得对话流程控制模型是在已有大型语言模型的基础上实现的,可以有效提高对话流程控制模型的训练效率,降低对话流程控制模型的训练难度。[0190] 进一步地,在上述任一实施例的基础上,利用流程控制数据集,对大型语言模型进行有监督微调训练,直至满足预设流程终止条件,包括:[0191] 在大型语言模型的基础上,构建第二权重矩阵;[0192] 固定大型语言模型的模型参数,利用流程控制数据集,对第二权重矩阵进行迭代训练,直至大型语言模型和第二权重矩阵预测的下一个问题满足预设的流程终止条件;[0193] 基于满足预设流程终止条件时获得的大型语言模型,确定对话流程控制模型,包括:[0194] 将满足预设流程终止条件时获得的第二权重矩阵和大型语言模型确定为对话流程控制模型。[0195] 构建第二权重矩阵具体可以是指构建与大型语言模型并行的第二权重矩阵。[0196] 可选地,假设大型语言模型的模型参数为W0第二权重矩阵的矩阵参数为ΔW2,模型输入为x,则模型输出公式为:h=W0x+ΔW2x。在大型语言模型W0固定的情况下,对ΔW2进行迭代训练,获得最终的ΔW2。进而将ΔW2对应的第二权重矩阵和W0对应的大型语言模型确定为对话流程控制模型。[0197] 如图9所示,示出了一种对话流程控制模型训练的示意图,大型语言模型901固定不动,与该大型语言模型901并列的第二权重矩阵902进行迭代训练。大型语言模型901的输出和第二权重矩阵902的输出加权之后,可以获得对话预测结果。对话预测结果和对话分析结果标签进行损失计算,获得流程控制损失。若检测流程控制损失小于预设的流程控制阈值,则确定满足预设的流程终止条件。[0198] 本公开的技术方案中,可以在大型语言模型的基础上,构建第二权重矩阵,使得第二权重矩阵与大型语言模型并列。进而固定大型语言模型的模型参数,利用对话分析数据集,对第二权重矩阵进行迭代训练,直至大型语言模型和第二权重矩阵预测的下一个问题满足预设的流程终止条件,进而可以将满足流程终止条件时的大型语言模型和第二权重矩阵确定为对话流程控制模型。有监督的微调训练可以是指对与预训练的大型语言模型的基础上增加第二权重矩阵的训练,对第二权重矩阵的参数进行调整即可以完成迭代训练。相较于大模型的参数量,第二权重矩阵的参数量较少,可以实现以较少的参数调整实现具备下一个问题的预测功能的对话流程控制模型的训练,提高对话流程控制模型的训练效率,降低对话流程控制模型的训练难度。[0199] 而为了获取更多的训练样本,在一种可能的设计中,确定流程控制数据集,包括:[0200] 响应于用户按照流程控制模式触发的样本输入操作,获得初始流程控制样本;[0201] 基于初始流程控制样本,对流程控制模式进行样本扩充,获得扩充流程控制样本;[0202] 将初始流程控制样本和扩充流程控制样本确定为流程控制数据集。[0203] 可选地,基于初始流程控制样本,对流程控制模式进行样本扩充,获得扩充流程控制样本,包括:从调查问卷库的调查问卷中确定扩充问题;利用预训练获得的大型语言模型,生成扩充问题对应的扩充答案,并将扩充问题和扩充答案确定为的扩充问答对;以初始流程控制样本中下一个问题的问题标签为输出目标,通过大型语言模型生成扩充问答对对应的下一个问题的问题标签;将扩充问答对和扩充问答对对应的下一个问题的问题标签确定为扩充流程控制样本。[0204] 本公开的技术方案中,可以在用户执行样本输入操作的基础上获得初始流程控制样本,进而基于初始流程控制样本,进行样本扩充,获得扩充流程控制样本,获得初始流程控制样本和扩充流程控制样本对应的流程控制数据集,可以在人工提供的样本的基础上,实现样本扩充,增加了样本数量,使得流程控制数据集的样本更丰富。因此,利用流程控制数据集可以对对话流程控制模型进行更准确的训练,提高对话流程控制模型的模型精度。[0205] 图10示出了本公开第四实施例的示意图,参考图9所示的问卷调查装置1000可以包括:确定单元1001、分析单元1002、选择单元1003以及输出单元1004。[0206] 其中,确定单元1001,用于确定目标调查问卷中处于激活状态的目标问题和目标问题对应的目标答案,并将目标问题和目标答案确定为目标问答对;分析单元1002,用于根据训练获得的对话分析模型,对目标问答对进行对话分析,获得对话分析结果;选择单元1003,用于若对话分析结果指示目标问题问答结束,则通过训练获得的对话流程控制模型,从目标调查问卷的剩余问题中选择下一个问题,剩余问题是指目标调查问卷中未完成问答的问题;输出单元1004,用于输出下一个问题。[0207] 进一步地,在上述任一实施例的基础上,分析单元,包括:[0208] 历史获取模块,用于获取目标调查问卷的历史问答对,历史问答对包括历史问题和历史问题对应的历史答案,历史问题为目标调查问卷中已完成问答的问题;[0209] 问答分析模块,用于将目标问答对和历史问答对输入对话分析模型,获得对话分析模型输输出的对话分析结果。[0210] 进一步地,在上述任一实施例的基础上,分析单元,包括:[0211] 结构分析模块,用于根据训练获得的对话分析模型,对目标问答对进行对话分析,获得对话分析模型按照预设的对话输出结构输出的对话分析结果,对话输出结构包括结束标识参数;[0212] 装置还包括:[0213] 状态检测单元,用于根据标识结束参数的参数值,检测对话分析结果是否指示目标问题问答结束。[0214] 进一步地,在上述任一实施例的基础上,状态检测单元,包括:[0215] 第一检测模块,用于若标识结束参数的参数值为预设目标参数值,则确定对话分析结果指示目标问题问答结束;[0216] 第二检测模块,用于若标识结束参数的参数值不为目标参数值,则确定对话分析结果指示目标问题问答未结束。[0217] 进一步地,在上述任一实施例的基础上,还包括:[0218] 问题追问单元,用于若对话分析结果指示目标问题问答未结束,则生成目标问题对应的追问问题;[0219] 追问采集单元,用于输出追问问题,并获取追问问题对应的追问答案;[0220] 答案更新单元,用于基于追问问题的追问答案,更新目标问题的目标答案。[0221] 进一步地,在上述任一实施例的基础上,选择单元,包括:[0222] 历史获取模块,用于获取目标调查问卷的历史问答对;[0223] 第一输入模块,用于将目标问答对和历史问答对输入训练获得的对话流程控制模型,获得对话流程控制模型输出的下一个问题,下一个问题是指对话流程控制模型从目标调查问卷的剩余问题中选择获得的。[0224] 进一步地,在上述任一实施例的基础上,确定单元,包括:[0225] 问题显示模块,用于显示目标调查问卷中处于激活状态的目标问题;[0226] 答案输入模块,用于响应于调查对象针对目标问题触发的答案生成操作,获得目标问题对应的目标答案。[0227] 进一步地,在上述任一实施例的基础上,还包括:[0228] 问卷显示单元,用于显示调查问卷库中多个调查问卷;[0229] 问卷输出单元,用于响应于问卷调查方针对多个调查问卷执行的问卷选择操作,获得目标调查问卷;[0230] 目标确定单元,用于将目标调查问卷中的第一个问题确定为处于激活状态的目标问题。[0231] 进一步地,在上述任一实施例的基础上,输出单元,包括:[0232] 第二切换单元,用于将目标问题切换至睡眠状态,并将下一个问题切换为激活状态;[0233] 第二输出单元,用于按照预设语音提问规则,将下一个问题转换为最新的目标语音,输出最新的目标语音。[0234] 图11示出了本公开第五实施例的示意图,参考图11所示的模型训练装置1100可以包括:第一确定单元1101、第一获取单元1102、第一训练单元1103以及对话确定单元1104。[0235] 第一确定单元1101,用于确定对话分析数据集,对话分析数据集包括多个对话分析样本,对话分析样本包括:训练问答对和训练问答对的对话分析结果标签;第一获取单元1102,用于获取预训练获得的大型语言模型;第一训练单元1103,用于利用对话分析数据集,对大型语言模型进行有监督微调训练,直至满足预设分析终止条件;对话确定单元1104,用于基于满足预设分析终止条件时获得的大型语言模型,确定对话分析模型。[0236] 进一步地,在上述任一实施例的基础上,第一训练单元,包括:[0237] 第一构建模块,用于在大型语言模型的基础上,构建第一权重矩阵;[0238] 第一训练模块,用于固定大型语言模型的模型参数,利用对话分析数据集,对第一权重矩阵进行迭代训练,直至大型语言模型和第一权重矩阵输出的对话预测结果满足预设的分析终止条件;[0239] 对话确定单元,包括:[0240] 对话确定模块,用于将满足分析终止条件时的大型语言模型和第一权重矩阵确定为对话分析模型。[0241] 进一步地,在上述任一实施例的基础上,第一确定单元,包括:[0242] 第一获取模块,用于响应于用户按照对话分析模式触发的样本输入操作,获得初始对话分析样本;[0243] 第一扩充模块,用于基于初始对话分析样本,对对话分析模式进行样本扩充,获得扩充对话分析样本;[0244] 第一确定模块,用于将初始对话分析样本和扩充对话分析样本确定为对话分析数据集。[0245] 图12示出了本公开第六实施例的示意图,参考图12所示的模型训练装置1200,用于训练如上述任一实施例中的对话流程控制模型,模型训练装置1200包括:第二确定单元1201、第二获取单元1202、第二训练单元1203以及流程确定单元1204。[0246] 第二确定单元1201,用于确定流程控制数据集,流程控制数据集包括多个流程控制样本,流程控制样本包括:训练问答对和训练问答对对应的下一个问题的问题标签;第二获取单元1202,用于获取预训练获得的大型语言模型;第二训练单元1203,用于利用流程控制数据集,对大型语言模型进行有监督微调训练,直至满足预设流程终止条件;流程确定单元1204,用于基于满足预设流程终止条件时获得的大型语言模型,确定对话流程控制模型。[0247] 进一步地,在上述任一实施例的基础上,第二训练单元,包括:[0248] 第二构建模块,用于在大型语言模型的基础上,构建第二权重矩阵;[0249] 第二训练模块,用于固定大型语言模型的模型参数,利用流程控制数据集,对第二权重矩阵进行迭代训练,直至大型语言模型和第二权重矩阵预测的下一个问题满足预设的流程终止条件;[0250] 流程确定单元,包括:[0251] 流程确定模块,用于将满足预设流程终止条件时获得的第二权重矩阵和大型语言模型确定为对话流程控制模型。[0252] 进一步地,在上述任一实施例的基础上,第二确定单元,包括:[0253] 第二获取模块,用于响应于用户按照流程控制模式触发的样本输入操作,获得初始流程控制样本;[0254] 第二扩充模块,用于基于初始流程控制样本,对流程控制模式进行样本扩充,获得扩充流程控制样本;[0255] 第二确定模块,用于将初始流程控制样本和扩充流程控制样本确定为流程控制数据集。[0256] 需要说明的是,本实施例中的人头模型并不是针对某一特定用户的人头模型,并不能反映出某一特定用户的个人信息。需要说明的是,本实施例中的二维人脸图像来自于公开数据集。[0257] 本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。[0258] 根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。[0259] 根据本公开的实施例,本公开还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。[0260] 图13示出了可以用来实施本公开的实施例的示例电子设备1300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。[0261] 如图13所示,设备1300包括计算单元1301,其可以根据存储在只读存储器(ROM)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(RAM)1303中的计算机程序,来执行各种适当的动作和处理。在RAM1303中,还可存储设备1300操作所需的各种程序和数据。计算单元1301、ROM1302以及RAM1303通过总线1304彼此相连。输入/输出(I/O)接口1305也连接至总线1304。[0262] 设备1300中的多个部件连接至I/O接口1305,包括:输入单元1306,例如键盘、鼠标等;输出单元1307,例如各种类型的显示器、扬声器等;存储单元1308,例如磁盘、光盘等;以及通信单元1309,例如网卡、调制解调器、无线通信收发机等。通信单元1309允许设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。[0263] 计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理,例如问卷调查方法、模型训练方法。例如,在一些实施例中,问卷调查方法、模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1308。在一些实施例中,计算机程序的部分或者全部可以经由ROM1302和/或通信单元1309而被载入和/或安装到设备1300上。当计算机程序加载到RAM1303并由计算单元1301执行时,可以执行上文描述问卷调查方法、模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元1301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行问卷调查方法、模型训练方法。[0264] 本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。[0265] 用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。[0266] 在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD‑ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。[0267] 为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。[0268] 可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。[0269] 计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端‑服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("VirtualPrivateServer",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。[0270] 应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。[0271] 上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

专利地区:北京

专利申请日期:2023-11-10

专利公开日期:2024-09-03

专利公告号:CN117312530B


以上信息来自国家知识产权局,如信息有误请联系我方更正!
电话咨询
读内容
搜本页
回顶部