一种中文字向量学习方法及装置
2021-09-17
本申请提供了一种中文字向量学习方法及装置,该方法包括:将中文词语库中的词进行拆分,得到待学习汉字,并将所述待学习汉字存入汉字库;根据所述中文词语库和汉字库,统计每个待学习汉字在所述中文词语库中的构词数,以及每个待学习汉字在每个词中的使用频次;针对每个待学习汉字,根据该待学习汉字对应的构词数,计算该待学习汉字对应的反词语频率;根据所述每个待学习汉字在每个词中的使用频次和每个待学习汉字的反词语频率进行加权计算,得到每个待学习汉字的字向量。
一种中文字向量学习方法,其特征在于,包括:将中文词语库中的词进行拆分,得到待学习汉字,并将所述待学习汉字存入汉字库;根据所述中文词语库和汉字库,统计每个待学习汉字在所述中文词语库中的构词数,以及每个待学习汉字在每个词中的使用频次;针对每个待学习汉字,根据该待学习汉字对应的构词数,计算该待学习汉字对应的反词语频率;根据所述每个待学习汉字在每个词中的使用频次、每个待学习汉字的反词语频率和每个词对应的词向量进行加权计算,得到每个待学习汉字的字向量。
申请号:CN202110645779.2
申请(专利权)人:北京明略软件系统有限公司
公开日期(公开):2021.07.09
公开日期(授权):2021.09.17
信息填写