一种基于在线会话标注的模型训练方法及装置
2021-12-28
本申请提供了一种基于在线会话标注的模型训练方法及装置,获取目标通信应用在线会话中的当前的会话消息;获取当前的会话消息中包括关键提取内容的目标会话消息;根据关键提取内容的定义对目标会话消息添加第一标识;根据初始的会话标注模型,得到被标识有第二标识的当前的会话消息;根据使用标识有第一标识的目标会话消息与标识有第二标识的会话消息进行一致性比对的结果,筛选出用于迭代训练初始的会话标注模型的正负训练样本并进行训练,得到最终的会话标注模型。这样,本申请通过识别在线会话消息的关键提取内容进行标识标注,并将标注后的会话消息自动转机器学习训练,从而可以训练得到准确率较高的会话标注模型以及缩短模型训练周期。
一种基于在线会话标注的模型训练方法,其特征在于,所述模型训练方法包括:获取目标通信应用在线会话中的当前的会话消息;获取所述当前的会话消息中包括关键提取内容的目标会话消息;所述关键提取内容表征包括含有预设关键词、预设关键语句和预设符号中至少一个的内容;根据所述关键提取内容的定义对所述目标会话消息进行标识,得到被标识有第一标识的目标会话消息;将所述当前的会话消息输入初始的会话标注模型,得到被标识有第二标识的会话消息;根据使用标识有第一标识的目标会话消息与标识有第二标识的会话消息进行一致性比对的结果,筛选出用于训练所述初始的会话标注模型的正负训练样本;所述一致性比对包括文本一致性比对和/或标识一致性比对;使用所述正负训练样本对所述初始的会话标注模型进行迭代训练,更新所述初始的会话标注模型,以得到最终的会话标注模型。
申请号:CN202110978287.5
申请(专利权)人:北京明略软件系统有限公司
公开日期(公开):2021.09.24
公开日期(授权):2021.12.28
信息填写