全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210975410.2 (22)申请日 2022.08.15 (71)申请人 四川长虹电器股份有限公司 地址 621000 四川省绵阳市高新区绵兴东 路35号 (72)发明人 孙云云 高美军 周杰  (74)专利代理 机构 成都虹桥专利事务所(普通 合伙) 51124 专利代理师 吴中伟 (51)Int.Cl. G06F 16/332(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 人机对话上 下文语义拒识方法 (57)摘要 本发明涉及自然语 言处理领域, 为了提高拒 识准确率, 提供了一种人机对话上下文语义拒识 方法, 包括: 步骤1、 建立强弱语义模型及上下文 关系模型并训练, 所述强弱语义模 型用于判断语 句是否是针对机器作出的, 所述上下文关系模型 用于判断当前语句与前一轮语句是否有关联; 步 骤2、 获取用户当前语句, 并将其输入强弱语义模 型进行判断, 若语句不是针对机器的, 则将语句 输入上下文关系模型; 步骤3、 上下文关系模型判 断当前语句与前一轮语句是否有关联: 若不相 关, 则当前语句为拒识; 若相关且前一轮语句为 拒识, 则当前语句为拒识。 采用上述步骤可以提 高拒识准确率。 权利要求书1页 说明书5页 附图2页 CN 115329060 A 2022.11.11 CN 115329060 A 1.人机对话上 下文语义拒识方法, 其特 征在于, 包括: 步骤1、 建立强弱语义模型及上下文关系 模型并训练, 所述强弱语义模型用于判断语句 是否是针对机器作出的, 所述上下文关系模型用于判断当前语句与前一轮语句是否有关 联; 步骤2、 获取用户当前语句, 并将其输入强弱语义模型进行判断, 若语句不是针对机器 的, 则将语句输入上 下文关系模型; 步骤3、 上下文关系模型判断当前语句与前一轮语句是否有关联: 若不相关, 则当前语 句为拒识; 若相关且前一轮 语句为拒识, 则当前语句为拒识。 2.根据权利要求1所述的人机对话上下文语义拒识方法, 其特征在于, 所述强弱 语义模 型包括: 词嵌入层、 卷积层、 池化层 及输出层。 3.根据权利要求1所述的人机对话上下文语义拒识方法, 其特征在于, 所述上下文关系 模型包括: 输入层、 Embed ding层、 LSTM层、 A ttention层及输出层。 4.根据权利要求1所述的人机对话上下文语义拒识方法, 其特征在于, 所述步骤2具体 为: 步骤21、 获取用户当前语句并使用ber t模型将其 转换为向量; 步骤22、 将步骤21得到的向量输入强弱语义模型进行判断, 若语句不是针对机器的, 则 将语句输入上 下文关系模型。 5.根据权利要求1所述的人机对话上下文语义拒识方法, 其特征在于, 所述步骤1还包 括建立关键词 库, 对应的, 所述步骤2中, 若语句不是针对机器的, 则将其输入上下文关系模 型前, 还包括判断语句中是否包含关键词, 若不包含, 则将语句输入上下文关系模型, 若包 含, 则当前语句不拒识。 6.根据权利要求1 ‑5任意一项所述的人机对话上下文语义拒识方法, 其特征在于, 所述 步骤3具体为: 上下文关系模型判断当前语句与前一轮语句是否有关联: 若不相关, 则 当前 语句拒识; 若相关, 前一轮 语句为拒识、 且两轮时间 间隔小于设定值, 则当前语句为拒识。 7.根据权利要求6所述的人机对话上下文语义拒识方法, 其特征在于, 所述步骤3将当 前语句判定为拒识后, 还包括判断当前语句与前一轮语句的拼音相似度, 若拼音相似度大 于阈值, 则当前语句不拒识。权 利 要 求 书 1/1 页 2 CN 115329060 A 2人机对话上下文语 义拒识方法 技术领域 [0001]本发明涉及自然语言处 理领域, 具体是一种人机对话上 下文语义拒识方法。 背景技术 [0002]人机交互已经渗透到我们的生活, 如我们可以通过语音控制身边的电视, 空调等。 目前市面上运行在智能电视的语音助手普遍采用半双工交互方式进行人机交互。 其不足在 于: 一是使用唤醒词, 每次对话都需要使用唤醒词, 唤醒后才能进行交互; 二是使用语音遥 控器, 当用户按 下语音键, 开启对话进入拾音状态, 当用户抬起语音键, 停止拾音; 三是在半 双工状态下, 环境噪声以及周围人声容易引起无效输入, 对话系统或错误响应, 或给出 “没 听懂”的呆板播报, 并且播报时不能打断, 十分影响交 互效率。 [0003]为了优化体验, 引入了全双工技术。 当用户开启全双工模式时, 由于周围噪声及语 音技术局限, 当说话人的语音模糊不清、 有周围人说话声、 无意义语音或者语音 数据不在已 有训练集合中时, 识别系统会产生识别错误, 从而影响对话系统的识别和理解效果。 为了解 决这一问题, 采用了语义拒识别方法。 [0004]现有的人机对话中的语义拒识别一般采用以下两种方式: 一是采用文本分类模型 或文本相似度模型, 获取用户问句和知识库所有知识点的类别概率或相似度, 从获取 的多 个相似度中选取最大的类别概率或相似度, 若最大类别概率或最大相似度未超过预设阈 值, 则拒绝识别用户问句。 二是在分类器新增 “拒绝识别类 ”, 如果用户问句被分为拒绝识别 类, 则拒绝识别, 否则, 从知识库获取分类类别对应知识点回答。 第一种 方式中的文本相似 度模型方法, 对 特征工程具有较强的依赖性, 容易造成拒识 准确率低。 第二种方式, “拒绝识 别类”的训练语料有限, 因而拒绝识别范围有限, 面对真实世界中成千上万的业务无关问 句, 造成拒识率太低。 发明内容 [0005]为了提高拒识准确率, 提供了一种人机对话上 下文语义拒识方法。 [0006]本发明解决上述问题所采用的技 术方案是: [0007]人机对话上 下文语义拒识方法, 包括: [0008]步骤1、 建立强弱语义模型及上下文 关系模型并训练, 所述强弱语义模型用于判断 语句是否是针对机器作出的, 所述上下文关系模型用于判断当前语句与前一轮语句是否有 关联; [0009]步骤2、 获取用户当前语句, 并将其输入强弱语义模型进行判断, 若语句不是针对 机器的, 则将语句输入上 下文关系模型; [0010]步骤3、 上下文关系模型判断当前语句与前一轮语句 是否有关联: 若不相关, 则当 前语句为拒识; 若相关且前一轮 语句为拒识, 则当前语句为拒识。 [0011]进一步地, 所述强弱语义模型包括: 词嵌入层、 卷积层、 池化层 及输出层。 [0012]进一步地, 所述上下文关系模型包括: 输入层、 E mbedding层、 LSTM层、 Attent ion层说 明 书 1/5 页 3 CN 115329060 A 3

PDF文档 专利 人机对话上下文语义拒识方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 人机对话上下文语义拒识方法 第 1 页 专利 人机对话上下文语义拒识方法 第 2 页 专利 人机对话上下文语义拒识方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:07:07上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。