一种构词紧密度确定方法、装置、电子设备及存储介质
2021-09-17
本申请涉及一种构词紧密度确定方法、装置、电子设备及存储介质。其中,方法包括:获取目标词库,其中,目标词库中包括候选汉字和由候选汉字构成的候选词语;通过确定每个候选词语中包括的候选汉字,来确定目标词库对应的共现关系;基于共现关系计算得到每两个候选汉字之间的汉字间构词紧密度;基于共现关系计算得到每个候选汉字与每个候选词语之间的字词间构词紧密度。本申请不需要大规模训练数据集,只需基于目标词库对应的共现关系,即可快速确定出没两个候选汉字之间的汉字间构词紧密度,以及每个候选汉字与每个候选词语之间的字词间构词紧密度,便于后期计算得到每个候选汉字的字向量。
一种构词紧密度确定方法,其特征在于,包括:获取目标词库,其中,所述目标词库中包括候选汉字和由所述候选汉字构成的候选词语;通过确定每个所述候选词语中包括的所述候选汉字,来确定所述目标词库对应的共现关系,其中,所述共现关系用于指示所述候选汉字与其他候选汉字以及所述候选词语中至少之一之间的构词关系;基于所述共现关系计算得到每两个所述候选汉字之间的汉字间构词紧密度,其中,每两个所述候选汉字之间的所述汉字间构词紧密度用于描述每两个所述候选汉字在进行构词时的相关性;基于所述共现关系计算得到每个所述候选汉字与每个所述候选词语之间的字词间构词紧密度,其中,所述字词间构词紧密度用于描述所述字词间构词紧密度对应的所述候选汉字与所述候选词语在进行构词时的相关性。
申请号:CN202110636673.6
申请(专利权)人:北京明略软件系统有限公司
公开日期(公开):2021.09.03
公开日期(授权):2024.03.22
信息填写