全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210425392.0 (22)申请日 2022.04.22 (65)同一申请的已公布的文献号 申请公布号 CN 114529108 A (43)申请公布日 2022.05.24 (73)专利权人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 李硕 张梦 王艺 岳洪达  尉乃升  (74)专利代理 机构 北京英赛 嘉华知识产权代理 有限责任公司 1 1204 专利代理师 王达佐 马晓亚 (51)Int.Cl. G06Q 10/04(2012.01)G06N 20/00(2019.01) G06K 9/62(2022.01) G06F 21/62(2013.01) G06F 16/2458(2019.01) (56)对比文件 WO 2021249086 A1,2021.12.16 审查员 欧晓丹 (54)发明名称 基于树模 型的预测方法、 装置、 设备、 介质及 程序产品 (57)摘要 本公开提供了一种基于树模 型的预测方法、 装置、 设备、 介质及程序产品, 涉及信息安全技术 领域和人工智能技术领域。 该方法的一实施方式 包括: 获取待预测业务特征; 根据待预测业务特 征和预先训练的树模型, 确定主动方的分裂点对 应的第一特征及第一特征分裂值, 以及根据树模 型的树结构向至少一个被动方 发送查询请求, 查 询请求用于指示被动方查询被动方的分裂点对 应的第二特征及第二特征分裂值; 接收至少一个 被动方返回的查询请求对应的查询结果; 根据主 动方的分裂点对应的第一特征及第一特征分裂 值, 以及查询结果, 确定预测路径; 根据预测路径 中分裂点的叶节点对应的权重, 确定目标预测结 果。 权利要求书4页 说明书14页 附图8页 CN 114529108 B 2022.07.22 CN 114529108 B 1.一种基于树模型的预测方法, 包括: 获取待预测业 务特征; 根据所述待预测业务特征和预先训练 的树模型, 确定主动方的分裂点对应的第 一特征 及第一特征分裂值, 以及根据所述树模 型的树结构向至少一个被动方发送查询请求, 包括: 将所述待 预测业务特征输入到预先训练的树模型中, 根据所述待 预测业务特征与预先训练 的树模型包括的特征进行匹配, 确定所述待预测特征中的位于预先训练的树模型的左子 树, 以及位于预先训练的树模型 的右子树, 所述查询请求用于指示被动方查询 被动方的分 裂点对应的第二特征及第二特征分裂值, 其中, 所述左子树和所述右子树互补, 所述左子树 包括主动方的分裂点对应的第一特征及第一特征分裂值, 所述右子树包括被动方的分裂点 对应的第二特 征及第二特 征分裂值; 接收所述至少一个 被动方返回的查询请求对应的查询结果; 根据主动方的分裂点对应的第一特征及第一特征分裂值, 以及所述查询结果, 确定预 测路径; 根据预测路径中分裂点的叶节点对应的权 重, 确定目标 预测结果。 2.根据权利要求1所述的方法, 其中, 所述根据主动方的分裂点对应的第 一特征及第 一 特征分裂值, 以及所述 查询结果, 确定预测路径, 包括: 比较所述第一特 征与所述第一特 征分裂值, 得到第一比较结果; 根据所述查询结果和所述第 一比较结果, 确定预测路径, 其中, 所述查询结果为被动方 对应的第二特 征与第二特 征分裂值之间的比较结果。 3.根据权利要求1所述的方法, 所述方法还 包括: 确定被动方的分裂点对预测路径的贡献信息; 将所述贡献信息作为可解释性信息 。 4.根据权利要求3所述的方法, 其中, 所述确定被动方的分裂点对预测路径的贡献信 息, 包括: 根据被动方的分裂点的第二特征分裂值, 确定被动方的分裂点对预测路径的贡献信 息。 5.根据权利要求3所述的方法, 其中, 所述确定被动方的分裂点对预测路径的贡献信 息, 包括: 根据被动方的分裂点的期望权重和被动方的分裂点的叶节点对应的权重, 确定被动方 的分裂点对预测路径的贡献信息 。 6.根据权利要求5所述的方法, 其中, 所述根据被动方的分裂点的期望权重和被动方的 分裂点的叶节点对应的权 重, 确定被动方的分裂点对预测路径的贡献信息, 包括: 根据被动方的分裂点的左叶节点的期望权重和被动方的分裂点的第 一预设数量, 以及 被动方的分裂点的右叶节点的期望权重和被动方的分裂点的第二预设数量, 确定被动方的 分裂点的期望权重, 其中, 所述第一预设数量为属于被动方的分裂点划分到左子树的数量, 所述第二预设数量 为属于所述被动方的分裂点划分到右子树的数量; 根据被动方的分裂点的期望权重和被动方的分裂点的叶节点对应的权重, 确定被动方 的分裂点对预测路径的贡献信息 。 7.根据权利要求3所述的方法, 其中, 所述确定被动方的分裂点对预测路径的贡献信权 利 要 求 书 1/4 页 2 CN 114529108 B 2息, 包括: 根据被动方的分裂点的第 一预设数量、 被动方的分裂点的第 二预设数量和所述待预测 业务特征在被动方的分裂点处的分裂次数, 确定被动方的分裂点对预测路径的贡献信息, 其中, 所述第一预设数量为属于被动方 的分裂点划分到左子树的数量, 所述第二预设数量 为属于所述被动方的分裂点划分到右子树的数量。 8.根据权利要求3所述的方法, 其中, 所述确定被动方的分裂点对预测路径的贡献信 息, 包括: 获取被动方的分裂点的分裂增益; 根据所述分裂增益, 确定被动方的分裂点对预测路径的贡献信息 。 9.根据权利要求1所述的方法, 所述方法还 包括: 记录预先训练 的树模型中的节点, 所述节点包括主动方对应的分裂点和被动方对应的 分裂点, 以及分裂点对应的叶节点; 以及 记录分裂点分别对应的训练方及在该训练方中的记录编号, 叶节点的叶节点权重, 其 中, 所述记录编号对应训练方中记录的特 征及对应的特 征分裂值。 10.一种树模型的生成方法, 包括: 获取主动方对第 一样本数据集中的特征数据进行分箱对应的分箱信 息, 以及至少一个 被动方对第二样本数据集中的特 征数据进行分箱对应的分箱信息; 确定所述第一样本数据集对应的一阶梯度、 二阶梯度; 根据所述第一样本数据集中特征数据的分箱信息对应的一阶梯度和, 以及二阶梯度 和, 确定分裂增益; 向所述至少一个被动方发送所述分裂增益, 以使所述至少一个被动方根据所述分裂增 益, 确定所述第二样本数据集中特征数据的分箱信息对应的一阶梯度和, 以及二阶梯度和; 根据所述第二样本数据集中特 征数据的分箱信息对应的一阶梯度和, 确定目标分裂点; 接收所述至少一个 被动方发送的所述目标分裂点, 确定最优分裂点; 将树分裂终止信号发送给所述至少一个被动方, 直至树模型的损失函数的变化值小于 终止阈值。 11.一种基于树模型的预测装置, 包括: 特征获取模块, 被 配置成获取待预测业 务特征; 第一确定模块, 被配置成根据所述待预测业务特征和预先训练的树模型, 确定主动方 的分裂点对应的第一特征及第一特征分裂值, 以及根据所述树模型的树结构向至少一个被 动方发送查询请求, 进一步被配置成: 将所述待 预测业务特征输入到预先训练的树模型中, 根据所述待预测业务特征与预先训练的树模型包括的特征进 行匹配, 确定所述待 预测特征 中的位于预先训练的树模型 的左子树, 以及位于预先训练的树模型 的右子树, 所述查询请 求用于指示被动方查询 被动方的分裂点对应的第二特征及第二特征分裂值, 其中, 所述左 子树和所述右子树互补, 所述左子树包括主动方的分裂点对应的第一特征及第一特征分裂 值, 所述右子树包括被动方的分裂点对应的第二特 征及第二特 征分裂值; 结果接收模块, 被 配置成接收所述至少一个 被动方返回的查询请求对应的查询结果; 第二确定模块, 被配置成根据主动方的分裂点对应的第一特征及第一特征分裂值, 以 及所述查询结果, 确定预测路径;权 利 要 求 书 2/4 页 3 CN 114529108 B 3

PDF文档 专利 基于树模型的预测方法、装置、设备、介质及程序产品

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于树模型的预测方法、装置、设备、介质及程序产品 第 1 页 专利 基于树模型的预测方法、装置、设备、介质及程序产品 第 2 页 专利 基于树模型的预测方法、装置、设备、介质及程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。