全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210953651.7 (22)申请日 2022.08.10 (71)申请人 数数信息科技 (上海) 有限公司 地址 200051 上海市长 宁区中山西路10 55 号SOHO广场A座121 1室 (72)发明人 孙泽宇 周津 王力 王健达  卢宇航  (74)专利代理 机构 上海华诚知识产权代理有限 公司 313 00 专利代理师 徐乐乐 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/23(2019.01) G06F 16/245(2019.01) G06F 16/25(2019.01)G06F 16/28(2019.01) G06F 16/951(2019.01) G06F 16/955(2019.01) G06Q 30/02(2012.01) (54)发明名称 数据处理方法、 系统、 设备、 介质和程序 产品 (57)摘要 本发明涉及计算机数据处理领域, 特别涉及 一种数据处理方法、 系统、 设备、 介质和程序产 品。 本发明适用于电子产品, 其特征在于: 获取数 据步骤, 获取来自至少一个数据平台的原始数 据; 留存数据步骤, 将所述原始数据存入ODS库中 的表中; 关联数据步骤, 将所述ODS库中的表中的 所述原始数据与预定格式的表的数据进行关联, 生成关联表; 更新数据步骤, 基于所述关联表的 数据, 更新所述预定格式的表的数据。 本发明可 以同时支持多个广告平台的数据同步, 并且 方便 与自有数据进行关联分析, 可以满足对广告归 因、 成本和回溯等数据进行统筹分析的需求, 是 一种可以对聚合数据进行实时更新和治理的技 术, 有效解决广告平台聚合数据应用的难点问 题。 权利要求书1页 说明书9页 附图4页 CN 115237924 A 2022.10.25 CN 115237924 A 1.一种数据处 理方法, 用于电子设备, 其特 征在于, 包括: 获取数据步骤, 获取来自至少一个数据平台的原 始数据; 留存数据步骤, 将所述原 始数据存 入ODS库中的表中; 关联数据步骤, 将所述ODS库中的表中的所述原始数据与预定格式的表 的数据进行关 联, 生成关联表; 更新数据步骤, 基于所述关联表的数据, 更新所述预定格式的表的数据。 2.根据权利要求1所述的一种数据处理方法, 其特征在于, 所述获取数据步骤包括, 将 所述原始数据转 化为json格式。 3.根据权利要求1所述的一种数据处理方法, 其特征在于, 所述留存数据步骤包括, 采 用分区存储方式将相同数据类型和格式的所述原始数据存入所述ODS库的同一个表中, 其 中, 所述OD S库的表的数量至少为 一个。 4.根据权利要求1所述的一种数据处理方法, 其特征在于, 所述关联数据步骤包括, 基 于用户体系将所述OD S库中的表中的所述原 始数据与预定格式的表的数据进行关联。 5.根据权利要求4所述的一种数据处理方法, 其特征在于, 所述关联数据步骤还包括基 于所述预定格式的表的字段类型对关联后的所述数据进行转换, 并基于关联后的所述数据 生成关联表。 6.根据权利要求1所述的一种数据处理方法, 其特征在于, 所述更新数据步骤包括, 更 新方式为分区覆盖旧数据的方式。 7.一种数据处 理系统, 其特 征在于, 包括: 获取数据模块, 获取来自至少一个数据平台的原 始数据; 留存数据模块, 将所述原 始数据存 入ODS库中的表中; 关联数据模块, 将所述ODS库中的表中的所述原始数据与预定格式的表 的数据进行关 联, 生成关联表; 更新数据模块, 基于所述关联表的数据, 更新所述预定格式的表的数据。 8.一种电子设备, 其特征在于, 所述设备包括存储有计算机可执行指令的存储器和处 理器, 所述处理器被配置为执行所述指令以实施根据权利要求1 ‑6中任一项所述的数据 处 理方法。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有至少一 条计算机指 令, 所述至少一条指 令由处理器加载并执行, 以实现如权利要求 1‑6中任一项 所 述的数据处 理方法。 10.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机指令, 所述计 算机指令被执 行时, 实现如权利要求1 ‑6中任一项所述的数据处 理方法。权 利 要 求 书 1/1 页 2 CN 115237924 A 2数据处理 方法、 系统、 设 备、 介质和程序产品 技术领域 [0001]本发明涉及计算机数据处理领域, 特别涉及一种数据处理方法、 系统、 设备、 介质 和程序产品。 背景技术 [0002]在实际业务场景中, 目前广告平台聚合数据分析的需求日益旺盛的情况下, 对多 平台的聚合数据进行实时更新和治理分析成为了目前行业急需解决的问题。 其中, 对多平 台数据源数据进 行同步和治理技术为整个广告平台聚合数据分析过程的核心 技术。 目前市 面上的广告平台数据同步仅提供了一些接口供获取数据, 但是, 数据格式无法定制, 与己方 数据也无法关联。 针对数据应用场景, 需要一种可对聚合数据进 行实时更新和治理的技术, 以确保数据的质量、 可用性、 可集成性、 安全性和易用性, 解决广告平台聚合数据应用的痛 点和难点。 本发明为多广告平台数据同步更新及治理技术, 支持多 数据源, 保证数据同步的 实时性、 复用性和可扩展性。 发明内容 [0003]本发明的目的在于提供一种数据处理方法、 系统、 设备、 介质和程序产品, 本发明 通过原始数据留存、 数据解析、 数据关联和分区数据复写等方法解决对多平台的聚合数据 进行实时更新和治理分析的过程中遇见的难点问题, 以支持多 数据源, 定制数据格式, 关联 己方数据, 有效保证数据的质量、 可用性、 复用性、 安全性和可扩展性。 [0004]本发明的实施方式公开了一种数据处 理, 所述方法包括: [0005]获取数据步骤, 获取来自至少一个数据平台的原 始数据; [0006]留存数据步骤, 将所述原 始数据存 入ODS库中的表中; [0007]关联数据步骤, 将所述ODS库 中的表中的所述原始数据与预定格式的表的数据进 行关联, 生成关联表; [0008]更新数据步骤, 基于所述关联表的数据, 更新所述预定格式的表的数据。 [0009]可选地, 所述获取 数据步骤 包括, 将所述原 始数据转 化为json格式。 [0010]可选地, 所述留存数据步骤包括, 采用分区存储方式将相同数据类型和格式的所 述原始数据存 入所述OD S库的同一个表中, 其中, 所述OD S库的表的数量至少为 一个。 [0011]可选地, 所述关联数据步骤包括, 基于用户体系将所述ODS库中的表中的所述原始 数据与预定格式的表的数据进行关联。 [0012]可选地, 所述关联数据步骤还包括基于所述预定格式的表的字段类型对关联后的 所述数据进行转换, 并基于关联后的所述数据生成关联表。 [0013]可选地, 所述更新数据步骤 包括, 更新方式为分区覆盖旧数据的方式。 [0014]本发明的实施方式公开了一种数据处 理系统, 所述系统包括: [0015]获取数据模块, 获取来自至少一个数据平台的原 始数据; [0016]留存数据模块, 将所述原 始数据存 入ODS库中的表中;说 明 书 1/9 页 3 CN 115237924 A 3

.PDF文档 专利 数据处理方法、系统、设备、介质和程序产品

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法、系统、设备、介质和程序产品 第 1 页 专利 数据处理方法、系统、设备、介质和程序产品 第 2 页 专利 数据处理方法、系统、设备、介质和程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生 于 2024-02-07 20:38:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。