全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211178549.0 (22)申请日 2022.09.26 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 申请人 建信金融科技有限责任公司 (72)发明人 丁晓璐 王晔 杨凯 吴磊 朱军  (74)专利代理 机构 北京润平知识产权代理有限 公司 11283 专利代理师 李红 (51)Int.Cl. G06V 10/764(2022.01) G06V 30/18(2022.01) G06V 30/19(2022.01) G06V 30/412(2022.01) (54)发明名称 票证分类方法、 装置、 处 理器及存 储介质 (57)摘要 本申请提供一种票证分类方法、 装置、 处理 器及存储介质, 属于计算机技术领域, 包括: 获取 目标票据图像; 对目标票据图像进行识别操作, 根据识别结果确定目标票据类别; 所述识别操作 包括计算机视觉分类、 光学字符识别、 自然语言 分类和关键字分类中的至少一者。 通过本申请提 供的方法, 能够对目标票据进行准确分类, 提高 分类精度和分类效率。 权利要求书2页 说明书8页 附图2页 CN 115424078 A 2022.12.02 CN 115424078 A 1.一种票证分类方法, 其特 征在于, 所述 票证分类方法包括: 获取目标票据图像; 对目标票据图像进行识别操作, 根据识别结果确定目标票据类别; 所述识别操作包括计算机视觉分类、 光学字符识别、 自然语言分类和关键字分类中的 至少一者。 2.根据权利要求1所述的票证分类方法, 其特征在于, 所述对目标票据图像进行识别操 作, 根据识别结果确定目标票据类别, 包括: 对所述目标票据图像进行计算机视觉分类, 根据计算机视觉分类结果确定目标票据类 别; 若根据计算机视觉分类结果无法确定票据类别, 对所述目标票据图像进行光学字符识 别, 对光学字符识别结果进行自然语言 分类, 根据自然语言 分类结果确定目标票据类别; 若根据自然语言分类结果无法确定目标票据类别, 对所述目标票据图像进行关键字分 类, 根据关键 字分类结果确定目标票据类别。 3.根据权利要求2所述的票证分类方法, 其特征在于, 所述对目标票据图像进行计算机 视觉分类, 包括: 利用票证数据集训练计算机视觉分类模型, 其中所述票证数据集包括中文票证、 英文 票证、 手写体票证和打印体票证; 将目标票据图像输入计算机视觉分类模型, 对所述目标票据图像进行计算机视觉分 类。 4.根据权利要求3所述的票证分类方法, 其特征在于, 所述对所述目标票据图像进行计 算机视觉分类, 包括: 获取所述目标票据图像的图像信息, 所述图像信息包括版式信息和颜色信息; 将所述图像信 息输入所述将所述图像信 息输入所述计算机视觉分类模型, 对所述目标 票据图像进行计算机 视觉分类。 5.根据权利要求2所述的票证分类方法, 其特征在于, 所述对光学字符识别结果进行自 然语言分类, 包括: 制作自然语言 分类数据集; 利用自然语言 分类数据集训练二分类 基分类器; 将光学字符识别结果输入所述 二分类基分类器, 计算类别概 率; 根据类别概 率确定目标票据类别。 6.根据权利要求5所述的票证分类方法, 其特征在于, 所述利用自然语言分类数据集训 练二分类 基分类器, 包括: 利用自然语言 分类票证数据集训练多个并行的二分类 基分类器; 所述将光学字符识别结果输入所述 二分类基分类器, 计算类别概 率, 包括: 分别将光学字符识别结果输入多个并行的二分类 基分类器, 计算对应的类别概 率; 所述根据类别概 率确定目标票据类别, 包括: 从多个并行的二分类 基分类器所对应的类别概 率中确定最大类别概 率; 若最大类别概率大于设定概率, 根据所述最大类别概率对应的类别确定目标票据类 别。权 利 要 求 书 1/2 页 2 CN 115424078 A 27.根据权利要求6所述的票证分类方法, 其特 征在于, 所述方法还 包括: 若所述最大类别概率小于等于设定概率, 确定根据自然语言分类结果无法确定目标票 据类别。 8.根据权利要求2所述的票证分类方法, 其特征在于, 所述对所述目标票据图像进行关 键字分类, 根据关键 字分类结果确定目标票据类别, 包括: 确定所述目标票据图像的多个匹配区域; 在每一匹配区域内进行关键字识别, 确定每一匹配区域的关键字与 该关键字的位置信 息; 利用关键字分类数据集在每一匹配区域内进行关键字匹配, 获得匹配结果, 其中, 所述 关键字分类数据集用于表示 票据的多个匹配区域内关键 字与其位置信息的对应关系; 根据所有匹配区域的匹配结果确定目标票据类别。 9.根据权利要求1所述的票证分类方法, 其特 征在于, 所述获取目标票据图像, 包括: 获取混贴票据图像, 所述混 贴票据图像中包括多个票据对象; 从所述混贴票据图像中分割出所述多个票据对象, 得到对应每个票据对象的目标票据 图像。 10.一种票证分类装置, 其特 征在于, 所述 票证分类装置包括: 获取模块, 用于获取目标票据图像; 分类模块, 用于对目标票据图像进行识别操作, 根据识别结果确定目标票据类别; 所述 识别操作包括计算机 视觉分类、 光学字符识别、 自然语言 分类和关键 字分类中的至少一 者。 11.一种处理器, 其特征在于, 被配置成执行权利要求1至9中任一项所述的票证分类方 法。 12.一种机器可读存储介质, 该机器可读存储介质上存储有指令, 其特征在于, 该指令 在被处理器执行时使得所述处理器被配置成执行权利要求1至9中任一项所述的票证分类 方法。 13.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序在被处理器 执行时实现权利要求1至9中任一项所述的票证分类方法。权 利 要 求 书 2/2 页 3 CN 115424078 A 3

PDF文档 专利 票证分类方法、装置、处理器及存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 票证分类方法、装置、处理器及存储介质 第 1 页 专利 票证分类方法、装置、处理器及存储介质 第 2 页 专利 票证分类方法、装置、处理器及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。