全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210421776.5 (22)申请日 2022.04.21 (71)申请人 蚂蚁区块链科技 (上海) 有限公司 地址 200010 上海市黄浦区外马路618号8 层803室 (72)发明人 李正煜  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 孙欣欣 周良玉 (51)Int.Cl. G06F 21/62(2013.01) G06F 40/295(2020.01) G06K 9/62(2022.01) H04L 9/00(2022.01) (54)发明名称 保护隐私数据的第三方识别类别的方法和 装置 (57)摘要 本说明书实施例提供一种保护隐私数据的 第三方识别类别的方法和装置。 方法包括: 数据 持有方将其持有的待识别样本的明文样本数据 利用同态加密算法进行加密, 得到第一密文样本 数据; 将第一密文样本数据发送给第三方, 以使 第三方利用第一密文样本数据和预先训练得到 的统计学习模 型, 确定待识别样 本的类别识别结 果; 统计学习模 型是利用训练样 本的密文样本数 据进行训练得到的; 训练样本的密文样本数据是 对训练样本的明文样本数据利用同态加密算法 进行加密得到的; 数据持有 方接收第三方返回的 类别识别结果, 并根据类别识别结果确定待识别 样本的目标类别。 能够保证安全性和识别精度。 权利要求书3页 说明书10页 附图3页 CN 114741728 A 2022.07.12 CN 114741728 A 1.一种保护隐私数据的第三方识别类别的方法, 所述方法包括: 数据持有方将其持有的待识别样本的明文样本数据利用同态加密算法进行加密, 得到 第一密文样本数据; 所述数据持有方将所述第 一密文样本数据发送给所述第 三方, 以使所述第 三方利用所 述第一密 文样本数据和预先训练得到的统计学习模型, 确定所述待识别样本的类别识别结 果; 所述统计学习模型是利用训练样本的密文样本数据进行训练得到的; 所述训练样本的 密文样本数据是对训练样本的明文样本数据利用所述同态加密算法进行加密得到的; 所述数据持有方接收所述第 三方返回的所述类别识别结果, 并根据所述类别识别结果 确定所述待识别样本的目标类别。 2.如权利要求1所述的方法, 其中, 所述训练样本来自所述数据持有方。 3.如权利要求1所述的方法, 其中, 所述统计学习模型为命名实体识别NER模型, 所述目 标类别为隐私类别。 4.如权利要求1所述的方法, 其中, 所述方法还 包括: 所述数据持有方将其持有的各个训练样本对应的各个明文样本数据利用所述同态加 密算法分别进行加密, 得到各个第二密文样本数据; 所述数据持有方将所述各个第 二密文样本数据发送给所述第 三方, 以使所述第 三方利 用所述各个第二密文样本数据训练所述统计学习模型, 在 模型训练过程中通过同态计算的 方式计算预测损失。 5.如权利要求4所述的方法, 其中, 所述各个明文样本数据属于不同样本对象的同一样 本特征的各个特 征值。 6.如权利要求4所述的方法, 其中, 所述各个明文样本数据属于数据库中的同一字段的 各个字段 取值。 7.如权利要求 4所述的方法, 其中, 所述方法还 包括: 所述数据持有方根据其维护的类别明文与密文标签的对应关系, 确定其持有的各个明 文样本数据分别对应的密文标签; 所述数据持有方将所述各个第二密文样本数据发送给 所述第三方, 包括: 所述数据持有方将所述各个第二密文样本数据和对应的各个密文标签发送给所述第 三方, 以使所述第三方利用所述各个第二密 文样本数据和对应的各个密 文标签训练所述统 计学习模型。 8.如权利要求7 所述的方法, 其中, 所述类别识别结果 为目标密文标签; 所述根据所述类别识别结果确定所述待识别样本的目标类别, 包括: 所述数据持有方根据 所述目标密文标签, 以及其维护的类别明文与密文标签的对应关 系, 确定所述目标类别。 9.如权利要求1所述的方法, 其中, 所述待识别样本为数据库中目标字段的字段值; 所述方法还 包括: 根据所述待识别样本的目标类别, 确定所述目标字段的目标类别。 10.如权利要求1所述的方法, 其中, 所述待识别样本的数目为多个; 所述数据持有方接收所述第三方返回的所述类别识别结果, 包括: 所述数据持有方接收所述第三方返回的第一密文样本数据和所述类别识别结果;权 利 要 求 书 1/3 页 2 CN 114741728 A 2所述方法还 包括: 所述数据持有方对第一密文样本数据进行解密, 得到第一待识别样本的明文样本数 据; 确定所述第一待识别样本对应于所述目标类别。 11.一种保护隐私数据的第三方识别类别的方法, 所述方法包括: 数据持有方将其持有的多个待识别样本各自的明文样本数据利用保序加密算法进行 加密, 得到多个密文样本数据; 所述数据持有方将所述多个密文样本数据发送给所述第 三方, 以使所述第 三方利用所 述多个密 文样本数据的排序和无监督的统计学习算法, 确定所述多个待识别样本各自的目 标类别; 无监 督的统计学习算法用于根据样本之间的距离, 确定所属类别; 所述数据持有方接收所述第三方返回的所述多个密文样本数据和各自的目标类别。 12.如权利要求1 1所述的方法, 其中, 所述无监 督的统计学习算法包括, 聚类算法。 13.一种保护隐私数据的第三方识别类别的装置, 所述装置设置 于数据持有方, 包括: 加密单元, 用于将其持有的待识别样本的明文样本数据利用同态加密算法进行加密, 得到第一密文样本数据; 发送单元, 用于将所述加密单元得到的第一密文样本数据发送给所述第三方, 以使所 述第三方利用所述第一密 文样本数据和预先训练得到的统计学习模型, 确定所述待识别样 本的类别识别结果; 所述统计学习模型是利用训练样本的密文样本数据进行训练得到的; 所述训练样本的密文样本数据是对训练样本的明文样本数据利用所述同态加密算法进行 加密得到的; 接收单元, 用于接收所述第三方返回的所述类别识别结果, 并根据所述类别识别结果 确定所述待识别样本的目标类别。 14.如权利要求13所述的装置, 其中, 所述训练样本来自所述数据持有方。 15.如权利要求13所述的装置, 其中, 所述统计学习模型为命名实体识别NER模型, 所述 目标类别为隐私类别。 16.如权利要求13所述的装置, 其中, 所述加密单元, 还用于将其持有的各个训练样本 对应的各个明文样本数据利用所述同态加密算法分别进行加密, 得到各个第二密 文样本数 据; 所述发送单元, 还用于将所述加密单元得到的各个第 二密文样本数据发送给所述第 三 方, 以使所述第三方利用所述各个第二密文样本数据训练所述统计学习模型, 在模型训练 过程中通过同态计算的方式计算预测损失。 17.如权利要求16所述的装置, 其中, 所述各个明文样本数据属于不同样本对象的同一 样本特征的各个特 征值。 18.如权利要求16所述的装置, 其中, 所述各个明文样本数据属于数据库中的同一字段 的各个字段 取值。 19.如权利要求16所述的装置, 其中, 所述装置还 包括: 标签确定单元, 用于根据其维护的类别 明文与密文标签的对应关系, 确定其持有的各 个明文样本数据分别对应的密文标签; 所述发送单元, 具体用于将所述各个第 二密文样本数据和对应的所述标签确定单元确权 利 要 求 书 2/3 页 3 CN 114741728 A 3

PDF文档 专利 保护隐私数据的第三方识别类别的方法和装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 保护隐私数据的第三方识别类别的方法和装置 第 1 页 专利 保护隐私数据的第三方识别类别的方法和装置 第 2 页 专利 保护隐私数据的第三方识别类别的方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。