目标词向量的确定方法、装置、存储介质和电子装置
2024-04-19
本申请涉及一种目标词向量的确定方法、装置、存储介质和电子装置,其中,该方法包括:获取目标领域的目标文本中包含的目标未登录词、目标未登录词中包含的多个目标字符以及每个目标字符的字符向量,已登录词为目标领域内词向量已知的词,未登录词为目标领域内词向量未知的词;确定目标字符与领域文本之间的目标关系,其中,领域文本为目标领域内的文本,领域文本包括目标文本,领域文本中包括已登录词和未登录词,目标关系用于指示目标字符在已登录词和未登录词中出现的频率;根据目标关系和目标字符的字符向量确定目标文本中包含的目标未登录词在目标领域内的目标词向量。本申请解决了确定未登录词在目标领域内的词向量效率较低的技术问题。
一种目标词向量的确定方法,其特征在于,包括:获取目标领域的目标文本中包含的目标未登录词、所述目标未登录词中包含的多个目标字符以及每个所述目标字符的字符向量,其中,所述目标文本中包括已登录词和未登录词,所述已登录词为所述目标领域内词向量已知的词,所述未登录词为所述目标领域内词向量未知的词;确定所述目标字符与领域文本之间的目标关系,其中,所述领域文本为所述目标领域内的文本,所述领域文本包括所述目标文本,所述领域文本中包括所述已登录词和所述未登录词,所述目标关系用于指示所述目标字符在所述已登录词和所述未登录词中出现的频率;根据所述目标关系和所述目标字符的所述字符向量确定所述目标文本中包含的所述目标未登录词在所述目标领域内的目标词向量。
申请号:CN202110599805.2
申请(专利权)人:北京明略软件系统有限公司
公开日期(公开):2021.09.03
公开日期(授权):2024.04.19
信息填写