全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211258785.3 (22)申请日 2022.10.14 (71)申请人 成都晓多科技有限公司 地址 610218 四川省成 都市天府新区兴隆 街道湖畔路西段123号 (72)发明人 江岭 王思宇 黄鹏  (74)专利代理 机构 成都市集智汇华知识产权代 理事务所(普通 合伙) 51237 专利代理师 李华 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/279(2020.01) G06N 20/00(2019.01) (54)发明名称 一种语句中方面类别及情感极性联合识别 的方法及系统 (57)摘要 本发明公开了一种语句中方面类别及情感 极性联合识别的方法及系统, 该方法包括获得训 练语句的双向隐状态; 取当前时间步的隐状态; 把训练语句的双向隐状态转换成训练语句方面 类别数量的高阶表示向量, 并通过训练语句的高 阶表示向量预测训练语句仅包含一个方面类别 的概率; 获得聚合值, 利用聚合值以及方面类别 数量的高阶表示向量获得训练语句的若干混合 特征; 将混合特征输入到全连接层I和全连接层 II预测当前步长的方面类别和情感极性; 对模型 进行优化; 将需要识别的目标语句输入模型进行 识别; 通过增加方面类别预测功能对语句包含的 方面类别个数进行预测, 降低 在进行情感极性检 测的时候出错的可能性。 权利要求书3页 说明书10页 附图1页 CN 115329775 A 2022.11.11 CN 115329775 A 1.一种语句中方面类别及情感极性联合识别的方法, 其特 征在于包括: 获取训练语句的双向隐状态; 获取预测的方面类别在当前时间步的隐状态, 每 个时间步仅输出一个方面类别; 把训练语句的双向隐状态转换成训练语句方面类别数量的高阶表示向量, 并通过训练 语句的高阶表示向量预测训练语句仅包 含一个方面类别的概 率; 将方面类别数量的高阶表示向量、 当前时间步的隐状态、 之前所有时间步 隐状态的平 均值进行聚合获得聚合值, 利用聚合值以及方面类别数量的高阶表示向量获得训练语句的 若干混合特征; 利用混合特征预测训练语句当前步长的方面类别以及方面类别的情感极 性。 2.根据权利要求1所述的一种语句中方面类别及情感极性联合识别的方法, 其特征在 于所述获取训练语句的双向隐状态的方法为: 从正反两个方向读取训练语句的文本序列, 获取训练语句中每个单词正反两个方向的 隐状态; 将每个单词正反两个方向的隐状态分别进行拼接获得每 个单词的双向隐状态; 将训练语句中所有单词的双向隐状态进行拼接从而获得整个训练语句的双向隐状态。 3.根据权利要求1所述的一种语句中方面类别及情感极性联合识别的方法, 其特征在 于: 通过门控循环单元利用预测的前一个时间步的方面类别获取当前步长方面类别的隐状 态。 4.根据权利要求1所述的一种语句中方面类别及情感极性联合识别的方法, 其特征在 于: 利用函数 计算预测训练语句 仅包含一个方面类别的概率, 其中 为概率, v为高阶表示向量, Wv 为概率预测权 重矩阵, b为偏置, 为sigmod函数。 5.根据权利要求1所述的一种语句中方面类别及情感极性联合识别的方法, 其特征在 于: 利用全连接层I 预测训练语句的方面类别, 其中 为预测的当前步长t的方面类别, wa为方面类别预 测权重矩阵, ut为混合特 征; 利用全连接层I I 预测当前方面类别的情 感极性, 其中 为预测的方面类别的情 感极性, ws为情感极性 预测权重矩阵, ut为混合特 征。 6.根据权利要求1所述的一种语句中方面类别及情感极性联合识别的方法, 其特征在权 利 要 求 书 1/3 页 2 CN 115329775 A 2于: 利用预测的当前步长的方面类别和情感极性与真实的方面类别和情感极性对比, 对权 重矩阵中的参数进行优化。 7.根据权利要求1所述的一种语句中方面类别及情感极性联合识别的方法, 其特征在 于: 在获取训练语句的双向隐状态之后, 对训练语句的方面类别进 行排序; 在训练语句的前 后分别加上<bos>和<eos>符号用于标示 一个训练语句的开始和结束。 8.一种语句中方面类别及情感极性联合识别的系统, 其特 征在于包括: 编码模块, 用于获取整个训练语句的双向隐状态; 解码模块, 用于获取预测的方面类别在当前时间步的隐状态, 每个时间步仅输出一个 方面类别; 方面个数预测模块, 用于双 向隐状态转换成训练语句方面类别数量的高阶表示向量, 并通过训练语句的高阶表示向量预测训练语句仅包 含一个方面类别的概 率; 方面类别及情感极性检测模块, 用于将方面类别数量的高阶表示向量、 当前预测的方 面类别在当前时间步的隐状态、 之前所有时间步隐状态的平均值进行聚合获得聚合值, 利 用聚合值以及方面类别数量的高阶表示向量 获得训练语句的若干混合特征, 通过混合特征 预测当前步长的方面类别以及当前 方面类别的情感极性。 9.根据权利要求8所述的一种语句中方面类别及情感极性联合识别的系统, 其特征在 于所述编码模块包括: 隐状态获取模块, 用于从正反两个方向读取训练语句序列并输出每个单词正反两个方 向的隐状态; 隐状态拼接模块, 用于将每个单词正反两个方向的隐状态分别进行拼接获得每个单词 的双向隐状态, 并将所有单词的双向隐状态拼接为整个训练语句的双向隐状态。 10.根据权利要求8所述的一种语句中方面类别及情感极性联合识别的系统, 其特征在 于所述解码模块包括: 当前时间步隐状态获取模块, 用于通过门控循环单元利用预测的前一个时间步的方面 类别获取当前步长方面类别的隐状态。 11.根据权利要求8所述的一种语句中方面类别及情感极性联合识别的系统, 其特征在 于所述方面个数 预测模块包括: 高阶表示向量获取模块, 用于计算训练语句方面类别数量的高阶表示向量; 单个方面类别概 率预测模块, 用于利用函数 计算预测训练语句 仅包含一个方面类别的概率, 其中 为概率, v为高阶表示向量, Wv 为概率预测权 重矩阵, b为偏置, 为sigmod函数。 12.根据权利要求8所述的一种语句中方面类别及情感极性联合识别的系统, 其特征在 于所述方面类别及情感极性检测模块包括: 聚合值获取模块, 用于将方面类别数量的高阶表示向量、 当前预测的方面类别在当前 时间步的隐状态、 之前 所有时间步隐状态的平均值进行聚合获得聚合 值; 混合特征获取模块, 用于利用聚合值以及方面类别数量的高阶表示向量获得训练语句权 利 要 求 书 2/3 页 3 CN 115329775 A 3

PDF文档 专利 一种语句中方面类别及情感极性联合识别的方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种语句中方面类别及情感极性联合识别的方法及系统 第 1 页 专利 一种语句中方面类别及情感极性联合识别的方法及系统 第 2 页 专利 一种语句中方面类别及情感极性联合识别的方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:07:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。