V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
hadesy
V2EX  ›  程序员

求安慰,阿里 API 网关挂了!!导致整个 618 活动没了!!

  •  
  •   hadesy · 2018-06-16 00:00:49 +08:00 · 8748 次点击
    这是一个创建于 2363 天前的主题,其中的信息可能已经有所发展或是发生改变。

    吐槽一下!!整整半个小时!!半个小时!!说挂就挂,上海区域的 API 网关,导致准备了半个月的活动 GG 了,准备迁出阿里了!客服都没有一个!很气! 证据

    43 条回复    2018-06-17 16:59:40 +08:00
    hadesy
        1
    hadesy  
    OP
       2018-06-16 00:01:38 +08:00
    各位入坑需谨慎,再也不相信大公司的产品的了
    akw2312
        2
    akw2312  
       2018-06-16 00:12:09 +08:00 via Android
    没有大客户售后?
    hadesy
        3
    hadesy  
    OP
       2018-06-16 00:21:52 +08:00
    @akw2312 没有,可能在阿里眼里还算不上大客户
    EarthChild
        4
    EarthChild  
       2018-06-16 00:28:44 +08:00
    哈哈哈刚一波法院 预估一下损失。
    heww
        5
    heww  
       2018-06-16 00:37:09 +08:00
    618 活动应该不只一天吧?
    heww
        6
    heww  
       2018-06-16 00:41:59 +08:00   ❤️ 2
    如果自己不考虑到类似这种情况的发生时的应对方案,就算迁出阿里云换到别的什么云中,类似的事情还是会发生的,只是发生的原因可能由 API Gateway 换成 XXX Gateway 而已。
    notreami
        7
    notreami  
       2018-06-16 00:52:35 +08:00   ❤️ 1
    @heww 这话说的,阿里赚那么多钱,拿个几十亿出来做慈善呗,也就双十一一天的盈利,反正一年 300 多天呢。
    ryd994
        8
    ryd994  
       2018-06-16 00:52:43 +08:00 via Android
    再也不相信大公司的产品的了
    有意思,那你相信什么呢?小公司? one man hosting ?
    自己系统设计不合理
    notreami
        9
    notreami  
       2018-06-16 00:56:28 +08:00
    @hadesy 各类监控报警没有触发嘛?
    hadesy
        10
    hadesy  
    OP
       2018-06-16 01:41:00 +08:00
    @heww 对的,我们已经反思了,之前太相信阿里云的基础服务了,感觉基础服务啥的肯定稳定的
    hadesy
        11
    hadesy  
    OP
       2018-06-16 01:42:02 +08:00
    @ryd994 使用开源的解决方案,自己用机器部署,至少可控,有问题自己可查,出了问题只能干等,惨不惨
    hadesy
        12
    hadesy  
    OP
       2018-06-16 01:42:27 +08:00
    @notreami 这种活动是开着实时监控大屏的,出了问题第一时间联系阿里了
    sampeng
        13
    sampeng  
       2018-06-16 01:50:00 +08:00 via iPhone
    活动前一定要做好预案和环境…人家阿里说破天去都不会为这种 API 挂掉买单。包括亚马逊。就是 100 个 9 还是有一定概率失败。况且好像阿里是说的 5 还是 6 个 9 而已。
    df4VW
        14
    df4VW  
       2018-06-16 02:10:04 +08:00
    这不才 616 么?
    ryd994
        15
    ryd994  
       2018-06-16 05:49:57 +08:00 via Android   ❤️ 6
    三大错觉:
    自建不会出问题
    就算出问题也可以控制范围
    我能马上修好!
    opengps
        16
    opengps  
       2018-06-16 06:11:41 +08:00 via Android
    故障从来都有,题主不幸属于出故障那一部分
    用啥都得考虑容灾啊
    binghe3337
        17
    binghe3337  
       2018-06-16 07:11:31 +08:00
    安慰一下楼主。阿里 API 网关的可用性好像是 99.90%,你可以访问 SLA 页面用公式计算一下,如果低于可用性下限可申请赔偿。
    Dzer0
        18
    Dzer0  
       2018-06-16 07:19:01 +08:00
    @ryd994 这总结好专业。
    xiaoyaoking
        19
    xiaoyaoking  
       2018-06-16 07:45:44 +08:00 via Android
    昨天十一点半 腾讯云的客服还打电话过来,帮我解决问题。。之前撸的活动机器。
    KgM4gLtF0shViDH3
        20
    KgM4gLtF0shViDH3  
       2018-06-16 08:09:37 +08:00 via iPhone   ❤️ 1
    真以为自建就能解决嘛😈
    mofe
        21
    mofe  
       2018-06-16 08:52:31 +08:00 via iPhone
    @ryd994 大概是因为自建的人出故障不会来 V2EX 吐槽造成的错觉
    xavier007
        22
    xavier007  
       2018-06-16 09:13:06 +08:00
    之前我们服务器挂了三个小时,中间给客服打电话,客服电话好难打通啊!
    xavier007
        23
    xavier007  
       2018-06-16 09:13:13 +08:00
    之前我们服务器挂了三个小时,中间给客服打电话,客服电话好难打通啊!!
    Reficul
        24
    Reficul  
       2018-06-16 09:22:25 +08:00
    自建的时候,可能就是被老板喊到办公室怼了;外包可能还能甩锅。
    dic
        25
    dic  
       2018-06-16 10:46:58 +08:00 via Android
    要不要试试 ucloud,这边把客户当爷伺候
    iyaozhen
        26
    iyaozhen  
       2018-06-16 11:31:44 +08:00 via Android
    感觉基础服务啥的肯定稳定的
    ——小伙子还是年轻啊。挖掘机挖光缆了解下,区域间网络波动了解下,交换机、路由器故障很常见,DDOS 攻击就更不用说了。

    出了问题可以不干等啊,自己得有备用方案,得有演练预案。
    用第三方的至少还能甩锅,还能赔偿,自己弄只能辞职了。
    opengps
        27
    opengps  
       2018-06-16 11:37:43 +08:00 via Android
    要不用微软,目前微软提供付费支持服务,甚至有个服务级别,是 24 小时不断人的级别,国内云服务上似乎很有必要做这种高端客服支持业务
    rESHARP
        28
    rESHARP  
       2018-06-16 12:07:38 +08:00 via iPhone
    就是要挂你的 618,信不信?
    natforum
        29
    natforum  
       2018-06-16 12:12:34 +08:00
    可以考虑换亚马逊或者微软云
    wps353
        30
    wps353  
       2018-06-16 12:30:23 +08:00 via Android
    企业至尊服务了解一下😀😀
    millx
        31
    millx  
       2018-06-16 12:33:18 +08:00
    什么 API ?
    uptime
        32
    uptime  
       2018-06-16 13:57:09 +08:00
    这标题…… 就算你语文死得早,但也不怕语文老师咒你吗?
    Foolt
        33
    Foolt  
       2018-06-16 14:13:41 +08:00
    套路云工单速度是不行。但是这么重要的活动没有灾备主机。。。最大的问题出在你们自己身上,你自己自建就没事了吗,自建机房也有光缆被挖断的时候。

    无论是哪个云他们都不敢说自己的可用率是 100%,连套路云自己家的 alipay 都试过因为光缆被挖断部分重要服务停止几个小时才恢复。
    mritd
        34
    mritd  
       2018-06-16 15:01:33 +08:00 via iPhone
    坐等小号洗地,喷楼主方案不行😉
    raptor
        35
    raptor  
       2018-06-16 16:10:45 +08:00
    自建别说挂掉半小时了,挂掉半个月都是正常的,容灾是王道
    wsycqyz
        36
    wsycqyz  
       2018-06-16 21:35:32 +08:00 via iPhone
    套路云不靠谱是出了名的,论坛有太多生产环境在套路云上出大问题的先例。

    老早就有人劝不要把生产环境部署在套路云上。
    wwek
        37
    wwek  
       2018-06-16 21:50:32 +08:00
    三大错觉:
    自建不会出问题
    就算出问题也可以控制范围
    我能马上修好!
    panzhc
        38
    panzhc  
       2018-06-17 08:17:21 +08:00
    好奇阿里云的 api 网关挂了是怎么影响你们的服务的?
    pxw2002
        39
    pxw2002  
       2018-06-17 10:36:55 +08:00 via Android
    阿里云那么多地域
    做容灾
    azh7138m
        40
    azh7138m  
       2018-06-17 10:40:28 +08:00 via Android
    @opengps 要钱的,电话技术支持低级点的还按小时收费

    其实楼主可以加钱买技术支持的,至少响应速度会提高
    jccg90
        41
    jccg90  
       2018-06-17 11:11:38 +08:00
    很正常吧。。。人家卖的是闲置的计算资源,618 双十一这种正是人家的峰值时段,自然顾不上低优先级的用户。。。反正有 sla 的,高峰时段挂个个把个小时无所谓的,钱都不用赔
    cctv1005s927
        42
    cctv1005s927  
       2018-06-17 13:16:00 +08:00
    有问题阿里云还是要赔钱的,支持楼主申诉
    vmskipper
        43
    vmskipper  
       2018-06-17 16:59:40 +08:00
    加钱 升级套餐吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3426 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 11:52 · PVG 19:52 · LAX 03:52 · JFK 06:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.