一种白皮书生成方法、装置、设备及存储介质
2021-11-02
本申请提供了一种白皮书生成方法、装置、设备及存储介质,其中,该方法包括:将目标文本作为关键词抽取模型的输入数据,得到至少一个关键词;将各关键词作为话术生成模型的输入数据,得到至少一个话术模板;针对每个话术模板中的每个待填充位置,根据各历史关键词在该待填充位置处出现的词频,将在各关键词中确定的第一关键词填充至该待填充位置,以得到目标话术文本;针对每个目标话术文本包括的每个目标字词,根据历史字词在目标白皮书模板的各段落主题下出现的频率,将该目标话术文本填充至与其匹配度最高的段落主题下,以得到目标行业的白皮书;通过上述方法,有利于降低人工工作量和人工成本。
一种白皮书生成方法,其特征在于,包括:将获取到的至少一个目标文本作为关键词抽取模型的输入数据,得到从各所述目标文本中确定的至少一个关键词,其中,所述目标文本为用于描述目标行业的文本,所述关键词为所述目标文本中出现的词频大于或者等于预设阈值的词语;将关键词组作为话术生成模型的输入数据,得到为所述关键词组匹配的至少一个话术模板,其中,所述关键词组包括各所述关键词;针对每个话术模板中的每一个待填充位置,根据各历史关键词在该待填充位置处出现的词频,在所述关键词组中确定第一关键词,其中,与所述第一关键词相同的历史关键词所对应的第一词频大于或者等于与第二关键词相同的历史关键词所对应的第二词频,所述第二关键词包括所述关键词组中除所述第一关键词之外的其他关键词,各所述历史关键词包括在至少一个历史白皮书中确定的关键词,各所述历史白皮书针对的行业领域与所述目标行业所属的行业领域相同;将所述第一关键词填充至该待填充位置,以得到目标话术文本;针对每一个目标话术文本包括的每一个目标字词,根据与该目标字词相同的历史字词在目标白皮书模板的各段落主题下出现的频率,确定该目标话术文本与各段落主题的匹配度,其中,所述目标字词是通过对该目标话术文本进行分词处理得到的,所述历史字词是通过对至少一个历史话术文本进行分词处理得到的,各所述历史话术文本包括:在各所述历史白皮书中位于各所述段落主题下的文本,所述目标白皮书模板针对的行业领域与所述目标行业所属的行业领域相同;将该目标话术文本填充至与其匹配度最高的段落主题下,以得到所述目标行业的白皮书。
申请号:CN202110894357.9
申请(专利权)人:北京明略软件系统有限公司
公开日期(公开):2021.09.07
公开日期(授权):2021.11.02
信息填写