数据丢失不用怕，火山引擎DataLeap 提供排查解决方案-环球快资讯

(资料图片)

当一家公司的日均处理的数据流量在PB级别时，巨大的任务量和数据量会对消息队列（MQ）dump的稳定性和准确性带来极大的挑战。

针对这一问题，火山引擎数智平台推出的大数据研发治理套件DataLeap，可以为企业提供完整解决方案，帮助解决MQ dump在极端场景中遇到的数据丢失问题。

例如，当HDFS（一种分布式文件系统）集群某个元数据节点由于硬件故障而宕机。那么在该元数据节点终止半小时后，运维工程师虽然可以通过手动运维操作将 HDFS 切到主 backup 节点，使得HDFS 恢复服务。但故障恢复后， MQ dump 在故障期间可能有数据丢失，产出的数据与 MQ 中的数据不一致的情况。

此时，技术人员可以在收到数据不一致的反馈后，立即借助火山引擎DataLeap进行故障排查。目前，火山引擎DataLeap基于开源Flink，已经实现了流批一体的数据集成服务。通过Flink Checkpoint的功能，Flink 在数据流中注入 barriers 将数据拆分为一段一段的数据，在不终止数据流处理的前提下，让每个节点可以独立创建 Checkpoint 保存自己的快照。

图：使用文件State 前后处理流程对比

溯源后，用户可以通过火山引擎DataLeap选择使用文件State（当前的 Checkpoint id 和 task id）解决该问题。据悉，使用文件 State 后，企业在 Notify 阶段与 HDFS 交互的 metrics（打点监控系统）的平均处理时间减少了一半。

目前，企业可以通过火山引擎DataLeap体验到上述Flink Checkpoint实践与优化方案，提升数据价值交付中的效率和质量。（作者：韩江）

推荐内容

华为P60系列首销&HUAWEI问界鸿蒙3体验官活动掀起线下消费热潮！-世界视点

数据丢失不用怕，火山引擎DataLeap 提供排查解决方案-环球快资讯

全球快消息！中国AIGC创新发展论坛亮点抢鲜看！万兴科技百度等将现场论道AIGC发展

世界时讯：【手慢无】无脑加购 4K大屏显示器到手仅需千元

热点新闻

锤子多次被传收购罗永浩盈利模式再临考验

谷歌推出新技巧：可通过链接直接创建文档国内用户暂时无

中国首个南极永久机场即将开建建设难度大

《王者荣耀》实名校验后腾讯全线游戏产品将启用健康系统

亚马逊或拟将第二总部“平分”设立在两个城市

推荐内容

华为P60系列首销&HUAWEI问界鸿蒙3体验官活动掀起线下消费热潮！-世界视点

数据丢失不用怕，火山引擎DataLeap 提供排查解决方案-环球快资讯

全球快消息！中国AIGC创新发展论坛亮点抢鲜看！万兴科技百度等将现场论道AIGC发展

世界时讯：【手慢无】无脑加购 4K大屏显示器到手仅需千元

热点新闻

锤子多次被传收购 罗永浩盈利模式再临考验

谷歌推出新技巧：可通过链接直接创建文档 国内用户暂时无

中国首个南极永久机场即将开建 建设难度大

《王者荣耀》实名校验后 腾讯全线游戏产品将启用健康系统

亚马逊或拟将第二总部“平分”设立在两个城市

锤子多次被传收购罗永浩盈利模式再临考验

谷歌推出新技巧：可通过链接直接创建文档国内用户暂时无

中国首个南极永久机场即将开建建设难度大

《王者荣耀》实名校验后腾讯全线游戏产品将启用健康系统