V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wang2222
V2EX  ›  程序员

数据同时写入 hdfs 和 es 的方案

  •  
  •   wang2222 · 2019-08-16 11:45:13 +08:00 · 1904 次点击
    这是一个创建于 1936 天前的主题,其中的信息可能已经有所发展或是发生改变。

    求教给位 V 友一个问题: 现在我们将一份数据写入了 ES,现在有需求将数据写一份进入写入到 hdfs,现在有两种方案

    1. 在处理数据时,同时写入 es 和 hdfs
    2. 在写入 es 之后,用 scroll 方法将 es 的数据读取写入到 hdfs

    哪种方法更好一点?

    3 条回复    2019-08-16 18:24:32 +08:00
    gaozhy
        1
    gaozhy  
       2019-08-16 12:05:05 +08:00
    处理数据时,利用 flume 多 sink,分别存 ES 和 HDFS
    kiddingU
        2
    kiddingU  
       2019-08-16 13:12:47 +08:00
    楼上正解,flume 多个 sink,或者用 kafka 两个 consumer group 广播,kafafa-connect-es -hdfs
    wsbnd9
        3
    wsbnd9  
       2019-08-16 18:24:32 +08:00
    自己写脚本 就选择 1 利用现有的开源组件 就按照 2 楼说的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3684 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 04:25 · PVG 12:25 · LAX 20:25 · JFK 23:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.