V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
aliyun123
V2EX  ›  推广

云数据库 HBase 如何助力物联网

  •  
  •   aliyun123 · 2017-05-16 13:53:16 +08:00 · 1928 次点击
    这是一个创建于 2756 天前的主题,其中的信息可能已经有所发展或是发生改变。

    免费申请云数据库 HBase 地址: https://cn.aliyun.com/product/hbase 引言 从有线互联网到无线互联网,本质是加强了人与人之间随时随地的关联。下一个互联的时代是万物互联,也就是物联网。有人说,这个是第三次信息革命,不管咋样,这都会产生大量的数据。 举一个例子,杭州市有 200w 辆汽车(具体肯定比这个多),我们给每辆车安装一个传感器,每隔 10s,上传 1k 的数据量,说明这个车的位置,一些情况。QPS 为 20w,1 年的数据量为:36536024200w1k=5.73P,如果不做任何的容灾,每个磁盘 4T 来算,则需要 5.73*1024/4T=1466 块磁盘,做一些容灾,则至少需要 2000+的磁盘。这些数据蕴含着巨大的价值,分析这些数据后,则会改变整个杭州的交通。

    架构 在我们传统架构下,一般会使用关系型数据库,关系型数据库索引结构基本上都是类 B+树,随着终端设备数增多,读写压力剧增,读写延迟增大,数据库面临崩溃;其次,关系型数据库也无法做到存储容量无限扩容,目前有一些分库分表的方案,实现起来比较复杂,往往有较多的限制。

    物联网最大的特点写入量大,要求延迟低,且数据存量巨大。HBase 基于 LSM,把磁盘的随机写改为顺序写,写吞吐高,不受 SSD 随机写入放大干扰,也不受空间放大的干扰。目前 HBase 非常满足物联网存储需求,存储数 T、数 P 甚至百 P 的空间,延迟稳定在数毫秒之内,跟 Hadoop 分析体系有较为深入的结合,满足分析类的需求。具体物理网的大致结构如下: screenshot 主要流程: 1、一部分实时,直接走 MQ,到流式系统,做一些实时的分析,后写入 HBase。 2、一部分写入 HBase,一般是全量数据,后接入 Hadoop/Spark,做一些离线分析,后续结果写入 HBase 中。 往往在使用 HBase 时,使用的 rowkey 设计是:设备 ID+地点+xxx+时间 xxx

    每个云公司,都在前端的一些环节做了很多事情,比如提供硬件支持、协议支持、ECS 可以使用一些弹性方案,当然也有不少公司是自己做方案。 针对数据从云 HBase 到 EMR Hadoop/Spark 中,目前有两种方案,其一是 Hadoop、Spark 直接连接云 HBase 分析;其二是云 HBase 提供一些导出数据的功能,在 EMR 中自动生成一张表(目前云 HBase 在实现中)。

    云 HBase 免费申请地址: https://cn.aliyun.com/product/hbase

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2616 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 11:00 · PVG 19:00 · LAX 03:00 · JFK 06:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.