V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
heat
V2EX  ›  云计算

ECS 无故被初始化... 阿里云到底想干嘛?!

  •  6
     
  •   heat · 2016-06-21 11:12:27 +08:00 · 18947 次点击
    这是一个创建于 3084 天前的主题,其中的信息可能已经有所发展或是发生改变。
    今早 10:05 左右我的 ECS 在我没做过任何操作的情况下无故当机( SSH 无法登录),当机 2-3 分钟之后我选择从管理控制台重启,之后的 15 分钟系统都没有能启动起来(总是处于已停止的状态,点击启动之后还是已停止),于是我提交了工单。

    接下来发生的事情真让人大跌眼镜,我的 ECS 启动起来了。当我登录的时候发现 SSH 指纹变了,我心想不好,结果 ECS 好像被初始化了一般,里边的所有文件,所有内容全部清空了,全!部!清!空!了!我问售后工程师,作何解释,然而没有人答复我。我不得不花了一些时间从新配置了一遍服务器让我的网站先可以运行起来。。。

    然而直到现在也没有人给我一个合理的解释,为什么我的 ECS 被无故初始化了?!谁让你们在未经客户允许的情况下这么做的?
    第 1 条附言  ·  2016-06-21 16:34:28 +08:00
    虽然给到的答复略晚,但是总算有个结果了:

    「您的本地磁盘服务器所在的宿主机由于硬件故障,短时间内无法修复,从而触发了宕机迁移以便云服务器能够快速恢复,因此出现了您反映的磁盘初始化的现象。」

    因为阿里云硬件问题导致了我的本地磁盘被初始化,阿里云也答应会给补偿。在此也给所有阿里云的用户提个醒:

    1.不要在本地磁盘(包括本地 SSD 磁盘)上存储任何有价值的东西,尽量放到云盘里去(虽然你要多花点钱)
    2.赶紧去看看后台开通快照 2.0 了没有,没开通赶紧开通每天自动备份,并马上做一个快照备份。
    3.备份方面,不要抱任何侥幸。
    第 2 条附言  ·  2016-06-22 15:12:50 +08:00
    赔偿的结果是 30 元代金券。
    计算方式是因为机房故障导致的 30 分钟当机 x 百倍赔偿 = 3000 分钟 ECS 使用时长,换算成天约等于 2.08 天,然后慷慨的进一位等于 3 天,再换算成代金券 = 30 元。
    至于被未预示的情况下清空 ECS 造成的损失,以及从新配置服务器所花的时间等等,全都不在赔偿考虑范围内。

    只能说,是我误读了「实例可用性达 99.95%」这句话(源自: https://www.aliyun.com/product/ecs ),或者是我就点儿背的在那 0.05%里... 总之是我大意了,这个锅我背了
    201 条回复    2017-07-06 10:25:44 +08:00
    1  2  3  
    mathgl
        101
    mathgl  
       2016-06-21 21:46:59 +08:00
    和 linode 比,还差了不少。
    iyaozhen
        102
    iyaozhen  
       2016-06-21 22:16:27 +08:00 via Android
    之前一直觉得服务器很强大,不会坏。但最近有个业务被人 DDoS 攻击了,临时加机器抗流量,奈何流量太大加一台挂一台,而且是硬件挂了,长见识了。
    Awoer
        103
    Awoer  
       2016-06-21 22:16:58 +08:00
    @jhdxr SSD 上线前也有分普通本地盘和普通云盘。
    Awoer
        104
    Awoer  
       2016-06-21 22:17:42 +08:00
    @iyaozhen DDOS 和宽带有关和硬件没啥太大关系。。。
    iyaozhen
        105
    iyaozhen  
       2016-06-21 22:22:49 +08:00 via Android
    @Awoer 我知道,但事实就是硬件坏了,数据都丢了,带宽到没啥问题(带宽有公司 tcp 接入层在抗),就是请求太多了,可能是巧合吧,不过这个和阿里云没啥关系,我们直接用的物理机,路过吐槽下而已。
    zonghua
        106
    zonghua  
       2016-06-21 23:06:53 +08:00
    今晚九点多访问我的网站正常,但是十一点访问发现链接不上!!!!

    运行在阿里云 ESC http://applehater.cn/
    alexzhan
        107
    alexzhan  
       2016-06-21 23:17:13 +08:00
    要用云盘,另外发现阿里云云盘略贵。
    普通云盘 0.3 元 /GB/月
    高效云盘 0.5 元 /GB/月
    SSD 云盘 1.0 元 /GB/月

    而我实测美团云云硬盘 IOPS 应该介于阿里云高效云盘和 SSD 云盘之间,而价格却只是 0.3 元 /GB/月,现在美团云还没有 SSD 云硬盘,我了解到美团云也准备上 SSD 云硬盘,比较期待上线后价格会是多少。

    这里有一篇美团云云硬盘介绍: http://chuansong.me/n/371750551048

    非广告,只陈述。
    zonghua
        108
    zonghua  
       2016-06-21 23:26:20 +08:00
    @zonghua 重启后恢复了,应该是其他问题。能不能撤了这条回复
    smallpath
        109
    smallpath  
       2016-06-22 00:14:06 +08:00
    吓得我赶紧拍了照
    gefranks
        110
    gefranks  
       2016-06-22 00:31:47 +08:00
    这种云跟用硬件服务器托管有啥区别?
    Techxiu
        111
    Techxiu  
       2016-06-22 00:37:02 +08:00
    Techxiu
        112
    Techxiu  
       2016-06-22 00:38:37 +08:00
    aprikyblue
        113
    aprikyblue  
       2016-06-22 00:48:15 +08:00 via Android   ❤️ 1
    @Techxiu 主题才支持 markdown ,回复只支持特定的图床 url 图片显示
    Techxiu
        114
    Techxiu  
       2016-06-22 00:51:00 +08:00
    @aprikyblue 怪不得呢。谢谢啦
    binux
        115
    binux  
       2016-06-22 00:58:11 +08:00
    @finian 看你楼上
    ayaseangle
        116
    ayaseangle  
       2016-06-22 01:07:37 +08:00
    垃圾云
    badcode
        117
    badcode  
       2016-06-22 02:03:49 +08:00
    备份只是无奈,只是不喜欢沉默处理,给用户发 mail 会 S !
    msg7086
        118
    msg7086  
       2016-06-22 03:19:15 +08:00
    @gefranks 云是指有大量计算资源可以随时取用按量付费,参考 AWS 的弹性实例。
    pynix
        119
    pynix  
       2016-06-22 07:43:08 +08:00
    我觉得是 官方说辞。。。。
    allenhu
        120
    allenhu  
       2016-06-22 08:41:47 +08:00 via Android
    竟然不开快照
    hoythan
        121
    hoythan  
       2016-06-22 08:47:47 +08:00
    @aliyunservice 懂了,阿里云的本地硬盘所有数据随时可能丢失,不可以使用
    SlipStupig
        122
    SlipStupig  
       2016-06-22 08:58:29 +08:00
    @heat 兄弟真心羡慕你,我跑了三个月磁盘坏道一把,丢了一堆数据.....
    finian
        123
    finian  
       2016-06-22 09:23:58 +08:00
    @binux 没看到有「系统盘本来就不是持久存储的,重启之后换个系统盘给你」这样的描述,只看到「由于存储空间来自服务器的本地 SSD 盘,因此存在单点故障风险」这样的说法
    npc0der
        124
    npc0der  
       2016-06-22 09:33:43 +08:00
    我一直以为 ecs 即便本地磁盘不是也有备份的么。。。。那这个 数据 99 。 9999 可靠性怎么保证。。。。
    crabRunning
        125
    crabRunning  
       2016-06-22 09:34:11 +08:00
    阿里爸爸脾气你又想怎样,难不成儿子要打老子
    zdkmygod
        126
    zdkmygod  
       2016-06-22 09:45:03 +08:00
    我怎么觉得这个没法洗呢?阿里云的快照通知我也收到了,这个洗洗地没啥。但是阿里云总得的有必要的风险提示呀,妈蛋谁知道重启一下就会变成这个情况呀。毕竟可能阿里云本地磁盘的数据比较重要!!!
    用阿里云的多留个心眼吧,无数次血泪证明必要的备份还是得有的。另外想问一下,其他的云服务商也会出现这样的情况么?
    barbery
        127
    barbery  
       2016-06-22 10:50:59 +08:00
    吓得我赶紧去开通备份
    kookxiang
        128
    kookxiang  
       2016-06-22 11:31:45 +08:00
    吓得我上线看了下,系统盘和数据盘都是普通云盘啊,新开也是只有普通云盘和高效云盘两种
    难道是早期用户没迁移什么的么
    ladyv2
        129
    ladyv2  
       2016-06-22 11:47:54 +08:00
    @9hills 你见过哪个云丫的还分本地盘数据盘的?全是虚拟难道不是扔存储上难道还真用本地硬盘?这玩意不说云了,就 vmware 或者 hyper v 也不会这么干啊
    ladyv2
        130
    ladyv2  
       2016-06-22 11:50:30 +08:00
    @silverymoon 你评论的这玩意就不是云。。。云的话会出现本地硬盘挂了然后服务器就挂了的情况?硬盘坏了?存储上坏个硬盘算个 P 大的事,我们存储一天坏过 12 个硬盘,不也毛事没有。。。
    9hills
        131
    9hills  
       2016-06-22 11:55:43 +08:00 via iPhone
    @ladyv2 呵呵
    gefranks
        132
    gefranks  
       2016-06-22 13:19:19 +08:00
    @msg7086 这种不能进行故障迁移的只是伪云,只能说是虚拟机或者是一堆虚拟机
    king110
        133
    king110  
       2016-06-22 13:46:18 +08:00
    因为阿里云硬件问题导致了我的本地磁盘被初始化,阿里云也答应会给补偿。

    我就不知道这种赔偿有啥用,不是业务断开,而是数据丢失。。。。。。
    odirus
        134
    odirus  
       2016-06-22 15:20:58 +08:00
    别相信广告术语,毕竟销售的目的是卖东西出去,把后台工程师的警告抛之脑后。

    -------------------------------------------------------------------

    开启定时备份很重要,运行环境至少两台服务器

    如果两台服务器都遇到这种问题,那没办法,算是天灾么?

    -------------------------------------------------------------------


    其实比这家更不靠谱的多了去了,但是谁叫他又能提供域名、备案、各种各样的服务呢。
    msg7086
        135
    msg7086  
       2016-06-22 20:01:16 +08:00
    @gefranks 是什么让你觉得「云」包含了故障迁移?
    以及是什么让你觉得「云」和「虚拟机」是不同的东西?
    goodryb
        136
    goodryb  
       2016-06-22 21:31:02 +08:00
    @XianZaiZhuCe
    @heat
    @dxwwym
    @qq316107934
    @eurry
    @irainsoft
    @zhuce
    @uxstone
    @lslqtz
    @houzhimeng
    @ytmsdy
    @irainsoft
    @DT27
    @heat
    @irainsoft
    @Felldeadbird
    @gdtv
    @irainsoft
    @king110
    @silverymoon

    麻烦开喷之前先搞清楚问题原因可以吗? 磁盘类型有没有搞清楚? 本地磁盘和云盘分的清楚吗?产品 SLA 不会看?不清楚就好好看下面
    https://help.aliyun.com/document_detail/25382.html

    别用恶意的嘲讽来暴露自己的无知
    goodryb
        137
    goodryb  
       2016-06-22 21:33:50 +08:00
    楼主麻烦也写清楚,硬件问题会导致宕机迁移。但是否会初始化系统和你使用的磁盘类型有关系。

    并不是所有的都是这样,云盘保证数据高可用性,和宕机无关。
    goodryb
        138
    goodryb  
       2016-06-22 21:38:08 +08:00
    @ladyv2 恶意满满啊,本地 SSD 盘是为了获取更高的非持久化 I/O 性能,用途不一样,要高可用,云盘随便用啊。
    goodryb
        139
    goodryb  
       2016-06-22 21:40:08 +08:00
    @gefranks
    @king110
    @odirus
    帖子都翻到第二页了还这样说话,明显是没仔细看上一页 aliyunservice 的,重复的话不想说,看 136 楼吧
    ragnaroks
        140
    ragnaroks  
       2016-06-22 21:44:49 +08:00
    还是搬瓦工稳,快 1000 天了
    odirus
        141
    odirus  
       2016-06-22 22:23:15 +08:00
    哟。。。特地来感谢题主的,实在受不了某楼的人,特意测试了一下 block 功能,感觉棒棒哒。
    zhuce
        142
    zhuce  
       2016-06-22 22:51:30 +08:00 via iPhone
    @goodryb 和的一手好泥,两边都不对,就你事后诸葛亮?傻博弈,滚
    JiaFeiX
        143
    JiaFeiX  
       2016-06-22 22:56:10 +08:00
    服务质量的确很差 此前遇到过另外一种情形
    tanteng
        144
    tanteng  
       2016-06-22 23:01:12 +08:00
    自带防 DDOS 能力也太差,购买服务太贵!
    itsme
        145
    itsme  
       2016-06-22 23:05:56 +08:00
    好像没人说那个快照是要收费的吗
    goodryb
        146
    goodryb  
       2016-06-22 23:18:37 +08:00
    @zhuce 你就这素质? 开口就骂人? 你爹妈没你教养?跑这里乱吠?



    @Livid 这算恶意人身攻击吗?
    ayaseangle
        147
    ayaseangle  
       2016-06-23 00:25:08 +08:00
    搞笑。。。
    strahe
        148
    strahe  
       2016-06-23 01:16:42 +08:00
    可能最有价值的是数据,阿里的百倍赔偿按时间算,原谅我说句脏话,有个屁用.
    gefranks
        149
    gefranks  
       2016-06-23 02:55:31 +08:00 via iPhone
    阿里“云” 学习了
    binux
        150
    binux  
       2016-06-23 03:23:54 +08:00
    @strahe 最有价值的数据,你自己不备份?有快照不开?更高可靠的云盘不买?你自己都不在乎,为什么要别人赔偿?
    publicAdmin
        151
    publicAdmin  
       2016-06-23 03:36:42 +08:00
    @goodryb 看小哥如此热心,小弟再请教下,阿里云 redis 数据无故被清空,又是何原因?临时工作死?
    zhujin
        152
    zhujin  
       2016-06-23 03:50:33 +08:00
    30 元代金券.跪了.
    lslqtz
        153
    lslqtz  
       2016-06-23 05:33:38 +08:00
    @goodryb 即使只有物理机可靠性, 100 倍赔偿还是要的。
    要不然故障了宕机不赔?
    heat
        154
    heat  
    OP
       2016-06-23 05:47:05 +08:00
    @binux @goodryb
    我购买阿里云的时候别说云盘,连 SSD 都还没有,后来上线了 SSD ,也只有两种选择:普通磁盘和 SSD 高速磁盘,云盘上线我并没有收到过任何相关提醒说本地 SSD 会导致严重的问题,让我更换云盘之类(难不成你们收到过?)我用了阿里云的一堆服务,包括 ECS OSS RDS CDN MEMC 等,难不成我会因为差那点钱而故意不买云盘?对,你们还可以说人家产品 SLA 更新了谁让你不天天趴着看,我不知道有多少人会这样做。

    快照我当然有,但是因为策略变更毫无保留的都被清理了。当然,这个你说怪我那时没有关注天天发小广告的阿里云短信,我认。

    有价值的数据我当然备份了,但这是重点么?我气愤的是,从宕机到磁盘被重置,我上午发的工单直到下午才给到我答案,这期间没有任何人联系解释相关问题,一直都是请稍等,请稍候。没人告诉我因为什么导致的重置?会不会短时间内再度重置?会不会恢复?上午就把电话给出去了,我唯独接的一个电话,是负责处理投诉的公关部下午打来的,告诉我给我 30 元代金券... 如果说我对阿里云的磁盘特性不够了解,那么连阿里云的售后工程师也不了解吗?还是说这么大的公司没有应急预案,出了问题只能让客户排号等待?

    zhuce
        155
    zhuce  
       2016-06-23 06:07:35 +08:00 via iPhone
    @goodryb 你回家对正在讲话的爹妈说“你们别喷了”,看看效果如何……自己嘴巴里夹零碎不干净还要求别人,道德婊,装什么大尾巴狼
    binux
        156
    binux  
       2016-06-23 06:09:59 +08:00
    @heat 「有价值的数据我当然备份了」,那么是否可以理解为丢失的部分不是「最有价值的数据」?
    我回复的是「可能最有价值的是数据,阿里的百倍赔偿按时间算」,那么你故障时间是不是 30 分钟?

    正经的运维,环境的配置也是备份,不,应该说是代码的一部分,能够从代码直接部署出一个全新的环境。即使「从新配置服务器所花的时间」,「然后慷慨的进一位等于 3 天」还不够吗?
    quietjosen
        157
    quietjosen  
       2016-06-23 06:23:45 +08:00 via iPhone
    同情楼主遭遇,谴责阿里这样的做法。

    不过,反过来冷思考下,这样的赔偿很难量化。而且一旦开了高价赔偿的先例,后续也怕别的用户效仿。所以宁可被骂也不赔。
    ladyv2
        158
    ladyv2  
       2016-06-23 06:36:35 +08:00
    @goodryb 然后 SSD 和本地还是“云端”没有没有任何关系。 SSD 是底层,而本地还是“云端”只是表现形式。
    就不拿这种炒作概念的什么云举例,咱就往简单了说。 ESXi/XenServer/HyperV/Xen 的存储分 2 种,本地和存储上的,本地和存储上都可以用 SSD 来获得高 IO 。。。
    heat
        159
    heat  
    OP
       2016-06-23 06:42:01 +08:00   ❤️ 1
    @binux 你的回复满满的槽点,说实话,我也是头一次听到数据被清怪客户不备份的神论。我是不是一个合格的运维那是我老板要操心的事情,如果数据丢了我老板质问我为何不备份,我肯定无话可说。但是请问这和阿里云的服务缺失有关系吗?原来阿里云的客户只能是正经的运维?不正经的连做客户的资格都没有了么?

    在产品同质化如此严重的今天,我坚持使用阿里云的唯一理由只能是「服务」。服务出了问题,客户连问责的权利都没有了么?

    阿里云自己都在工单里承认背锅的事情,我实在无意与你继续扯皮。你觉得服务的缺失和失信于客户这么慷慨的赔偿能弥补,那么请你继续辩下去,至于赔偿诚意如何,我心里有数,看的人自然也有数。

    PS :如果阁下是阿里云内部人士的话可以跟你们同事说一下,趁 30 元代金券还没申请下来,别申请了,写个申请单也怪麻烦的,我不要了。
    binux
        160
    binux  
       2016-06-23 06:51:52 +08:00
    @heat 阿里云给出的服务是故障百倍赔偿,而不是数据丢失赔偿。对,它「服务缺失」了,但是承诺的赔偿有没有给?
    「数据被清怪客户不备份」根本就反了,这帖子是你发的,又不是阿里云,到底谁在怪谁?问责可以,但是你问的是超出范围的责任。

    解决不了问题,就问责提出问题的人,是一种懦弱的表现:)
    jamiesun
        161
    jamiesun  
       2016-06-23 06:59:04 +08:00
    这站里,阿里云的狗太多了
    heat
        162
    heat  
    OP
       2016-06-23 07:03:40 +08:00
    @binux 「数据被清怪客户不备份」这句话是说给你的,我发这个帖子的时候写这句话了吗?

    阿里云服务缺失在哪我已经在上一个回复里说的很清楚,看不懂不怪你。你都能说「及时跟客户沟通和解决问题」是超出范围的责任。我还能说什么?

    我现在有点理解什么叫跟客户玩文字游戏了。如果阁下真是阿里云内部人士,请 at 你的领导来看看你的公关发言。如果不是,请 Block 我,然后离开这个帖子,谢谢
    jamiesun
        163
    jamiesun  
       2016-06-23 07:18:27 +08:00   ❤️ 1
    @heat 阿里云的人口基数大,无处不在,只要你发表不满阿里云的言论,立即会有一帮“正义人士”来“批评你”,反正现在云多,比阿里云做的好的多了去,我已经把自己的服务全部撤出阿里云,搬到青云了和 daocloud ,灵雀云等平台了。反正阿里云盘子大,不会在乎少几个。
    binux
        164
    binux  
       2016-06-23 07:33:41 +08:00
    @heat 你又不是我客户,我把「新配置服务器所花的时间」的责任「怪你」有什么不可以的?

    不讨论问题,而是讨论人和动机,我不喜欢这样的风气。所以我从来不会用自己的身份暗示什么,以及否认什么,就事论事,爱说什么说什么。至于质疑动机的言论,根本没有讨论的价值。

    如果你不想听,大可以自由地 block 我啊,你有什么权力让我离开这个帖子?
    lslqtz
        165
    lslqtz  
       2016-06-23 07:34:49 +08:00
    @jamiesun 我还有一个站,因为备案的问题没法迁出,其他的在用 ovh 。
    lslqtz
        166
    lslqtz  
       2016-06-23 07:38:34 +08:00
    @zonghua 您与 applehater.cn 之间的连接采用新型加密套件进行了加密。而且,此页中包含其他不安全的资源。
    顺便一提,微博图床是支持 https 的。
    @Techxiu
    V2EX 只支持两种图床。。
    FAQ:如何发图 https://v2ex.com/faq
    你可以把图片上传到 imgur ,然后就会显示为图片。目前我们同样也支持显示微博的图片( sinaimg.cn )。
    或者你可以考虑使用 V2EX Image Hosting 功能提供的永久图片存储。
    heat
        167
    heat  
    OP
       2016-06-23 07:45:33 +08:00
    @binux 那你又有什么权利一副事不关己随便扯淡的心态来「怪我」?一上来就一副屎盆子都往我脑袋上扣的嘴脸你告诉我你是在「讨论问题」?先承认自己的身份然后再扣屎盆子你觉得这样是不是可以更优雅一点?

    「新配置服务器所花的时间」这里我跟你说明白一点,是因为阿里云那边迟迟不给我答复,不告诉我为何被重置,是否还会短时间内遭遇同样的重置,是否会在短时间内恢复,还是应该立刻去购买新的云盘服务器。他们什么都没说,只说让我等,所以我让我一时间很难做出决定,只能一直先选择等他们答复,导致浪费了不少时间。我所谓的服务缺失很大一部分说的也是这里,而关于这部分阿里云已经在工单里承认了自己的失误并且道歉。

    我不理解你到现在都看不懂我在说什么然后哪儿来的信心在这里瞎 BB ,你可以继续下去,我不会再再费时间回复你任何话了。
    DT27
        168
    DT27  
       2016-06-23 08:08:38 +08:00
    @goodryb 你是不是不会说话
    irainsoft
        169
    irainsoft  
       2016-06-23 08:10:02 +08:00
    @goodryb 希望你仔细看看 楼主没用快照没备份是他的锅,但直接清除了用户数据阿里云这个最大的锅绝对跑不掉的!不能以用户的失误掩盖阿里云的错!
    binux
        170
    binux  
       2016-06-23 08:10:05 +08:00
    @heat 首先「一副事不关己随便扯淡的心态」带有实际上「事关己」的含义,我这里澄清一下,并不是这样的,这件事完全就「事不关己」。「随便扯淡」就不一定了,我现在部署都迁移 docker 了,包括环境在那都有备份,并不是「随便扯淡」。对于身份,我前面说过「我不喜欢这样的风气。所以我从来不会用自己的身份暗示什么,以及否认什么」,如果你脑补一个身份能让你好受些,我也并不会否认。

    OK ,「因为阿里云那边迟迟不给我答复,不告诉我为何被重置,是否还会短时间内遭遇同样的重置,是否会在短时间内恢复,还是应该立刻去购买新的云盘服务器」我是真没从主贴里读出来。我 @ 的回复是针对 「可能最有价值的是数据,阿里的百倍赔偿按时间算」,我反对的是补偿有价值的数据和「新配置服务器所花的时间」。

    如果是不知道服务器是否稳定「是否还会短时间内遭遇同样的重置」那么我完全支持你以「故障时间不是 30 分钟」为由追加赔偿。
    irainsoft
        171
    irainsoft  
       2016-06-23 08:11:05 +08:00
    @goodryb 你的硬盘坏了送去电脑店修,电脑店直接帮你全盘格式化后再换个硬盘你啥想法?
    dxwwym
        172
    dxwwym  
       2016-06-23 08:18:56 +08:00 via iPhone
    @goodryb 我就说我要备份自己的数据,我有说我用的阿里?还有,我这也算喷?冲动是魔鬼……
    Felldeadbird
        173
    Felldeadbird  
       2016-06-23 09:01:57 +08:00
    @goodryb 作为 IDC 商,这么底层的问题都靠不住,真心觉得技术太渣了。这么大的企业,一台母鸡挂了,母鸡中的数据全没了。还没备份。这到底是谁的过错呢? 我用国外的 VPS 几年来,从来没遇过母鸡挂了,数据丢失的情况。
    goodryb
        174
    goodryb  
       2016-06-23 10:10:17 +08:00
    @publicAdmin 如果确认非误操作导致清空,我支持你找他索赔
    goodryb
        175
    goodryb  
       2016-06-23 10:12:37 +08:00
    @lslqtz 当然,物理机故障导致 ECS 不可用必须要赔偿,但是楼主的问题是,本地 SSD 盘本身就不保证高可用,只是为了提供更好的 IO 性能,宕机后数据无法保证数据,所以才会重新初始化系统,恢复 ECS 的可用性。赔偿的是 ECS 不可用的损失,而不是磁盘数据的问题。
    goodryb
        176
    goodryb  
       2016-06-23 10:17:44 +08:00
    @heat 我理解楼主你的心情,工单响应慢的确是厂商的责任,这个你可以喷,可以要赔偿,我全力支持。
    但是我要说的是 楼主标题开头就是“ ECS 无故被初始化”, 那么这个初始化到底是有原因还是厂商的问题这个不应该武断的下结论。况且客服已经解释过了。
    凡事要讲道理,你对服务不满意,可以投诉,可以要求赔偿 ECS 不可用的损失。但是不能得出一个错误的结论,根据你的陈述,你也是个老用户了,磁盘类型这个问题还不清楚吗?
    goodryb
        177
    goodryb  
       2016-06-23 10:18:20 +08:00
    @zhuce 垃圾东西,懒得回复你了,闭嘴吧。
    lslqtz
        178
    lslqtz  
       2016-06-23 10:20:47 +08:00
    @goodryb ok ,明白了,有理有据,令人信服。
    goodryb
        179
    goodryb  
       2016-06-23 10:21:11 +08:00
    @ladyv2 是的,本地和云盘的确是两个不同的概念,具体可以看我前面回复的连接, 136 楼中。本地 SSD 和云盘 SSD 都是高性能。差别就在高可用性上面。楼主既然选择了本地 SSD ,那对高可用性应该有个清醒的认识。
    goodryb
        180
    goodryb  
       2016-06-23 10:24:27 +08:00
    @irainsoft 麻烦看下 136 楼的链接。楼主使用的是本地 SSD 磁盘,这种磁盘是为了获取更高的 I/O 性能,本身不保证高可用行。宕机后为了恢复 ECS 可用性,只能是重新初始化系统

    对于楼主的数据损失,我表示同情。但不认同楼主“无故被初始化的结论”
    goodryb
        181
    goodryb  
       2016-06-23 10:26:31 +08:00
    @irainsoft 这是不同的概念,请先看下 136 楼连接中不同磁盘类型的描述。

    云盘保证数据高可用性,本地磁盘不保证。
    本地 SSD 是为了提供更好的 I/O 性能。用途不通。
    finian
        182
    finian  
       2016-06-23 10:31:40 +08:00
    @goodryb 楼主的 ECS 被初始化了,但是楼主并不清楚为什么会被初始化(可能之前没遇到过这种情况),问客服也没有说出具体原因(注意这是重点好么),所以楼主得出「无故被初始化」的结论到底有什么问题?
    goodryb
        183
    goodryb  
       2016-06-23 10:32:00 +08:00
    @dxwwym 不好意思,本来是分两次回复的,把你 @错了, sorry

    数据备份是每个 IT 从业人员都应该做的事情,我非常同意。
    lslqtz
        184
    lslqtz  
       2016-06-23 10:34:54 +08:00
    @finian 没问题,不过后面加了客服表示是因为宕机了的说 = =
    得出这个结论的确没问题
    finian
        185
    finian  
       2016-06-23 10:37:00 +08:00
    @lslqtz 那是后面 append 的,所以他一开始得出这个结论完全是合理的
    goodryb
        186
    goodryb  
       2016-06-23 10:41:18 +08:00
    @finian 的确,刚开始我也以为是阿里云坑爹了,不过看样子,工单还没处理完,楼主就急急忙忙来这里发帖子了,蛮心急的嘛,后面才搞清楚原因

    我认真看完了这一百多个回复,所以才这样说,是基于整个事件来评论(我评论的时候楼主已经 append 了)
    zaishanfeng
        187
    zaishanfeng  
       2016-06-23 10:53:19 +08:00 via Android
    国内的服务你还想咋样 甩锅推诿是天朝特色。 我国外的独服小鸡一大把, 在我印象里一年从没有宕机, 除非我手动重启, 否则一直在 up 状态。 对了国外我也遇到了坑了, 尼玛最后一查竟然是国人开的, 国外主机远离饭桶及其母公司 psych..好像是这么拼的吧, 还有一个叫什么 globalfrag 还是什么的垃圾货色,也被他坑了, 尼玛最后一查还是天朝的跑国外祸害人去了,其实是武汉的一个小鸡吧公司
    irainsoft
        188
    irainsoft  
       2016-06-23 11:29:42 +08:00
    @goodryb 任何物理储存设备都不能保证永远正常,云盘可能自带了备份但它的物理储存设备也有可能在某一天忽然挂掉,家里用的机械硬盘和 SSD 都有挂掉的一天。阿里云的错并不是“没有让所有人都用上云盘”而是“在出现问题后直接采取初始化 ECS 这个措施”,我在阿里云的网站上确实看到了本地 SSD 有风险这点但是并没有看到阿里云会怎么处理风险的措施,也就是说出现了问题后阿里怎么操作有可能全凭工程师当时判断。

    错的不是硬盘,是措施

    上面吵起来的原因还是因为楼主和阿里云那个帐号在这贴里到现在没有明确讲楼主之前的数据究竟怎样了...
    heat
        189
    heat  
    OP
       2016-06-23 11:43:54 +08:00
    @goodryb 你说的那么多,前提是我知道云盘的存在,知道云盘和本地磁盘的区别,并且知晓其中的风险。但是我并不知道。

    我最早用阿里云的时候别说云盘,连 SSD 都还没有,后来上线了 SSD ,我把以前的 ECS 停掉了,专门买了一个带 SSD 的 ECS (就是现在用的这个),当时只有两种选择:普通磁盘和 SSD (那时候根本没有本地磁盘的概念,也自然没有你贴的那个磁盘差异化的产品文档,在当时我的眼里一切磁盘都是云盘),我购买 ECS 和 SSD 是在同一时间完成的,之后一直都是续费操作。接下来是重点:我购买的时候没有任何提醒说这个 SSD 磁盘有风险,后来所谓的云盘上线我也并没有收到过任何相关提醒说我使用的这个其实是本地 SSD 磁盘,会导致严重的问题。

    我特地去查了一下我的消息中心,确实有这么一封广告邮件:

    绿框你看清楚了吗?在当时,连阿里云自己都还在管这个所谓的「本地 SSD 磁盘」叫「本地 SSD 云盘」!

    标题的问题 182 楼已经解释的很清楚了。你别轻描淡写的说什么工单没处理完,我心急。生产环境初始化过了好几个小时了,还没人给一个答案,换你不心急?如果是我对阿里云的新磁盘概念不够了解,他们的工程师也不了解吗?
    goodryb
        190
    goodryb  
       2016-06-23 11:47:15 +08:00
    @irainsoft 我逐段回答

    第一段:
    链接我再发一下 https://help.aliyun.com/document_detail/25382.html
    ----
    本地 SSD 盘

    本地 SSD 盘来自实例所在物理机的本地存储。该类存储为实例提供块级别的数据访问能力,具有低时延、高随机 IOPS 、高吞吐量的 I/O 能力。

    使用本地 SSD 盘,注意以下问题:

    由于存储空间来自服务器的本地 SSD 盘,因此存在《单点故障》风险。建议在应用层做数据冗余,以保证数据的可用性。
    订购后不支持 CPU 、内存、及本地 SSD 盘的升降配置。
    -----


    第二段
    “也就是说出现了问题后阿里怎么操作有可能全凭工程师当时判断”,所有宕机迁移都是系统自动完成,并非工程师判断,要不然那么多 ECS ,光处理这个就需要多少工程师。。。。。

    第三段
    参考 186 楼我的回答


    最后,其实从整体来看这个事情还是比较清晰的,只是局部理解上有问题。
    goodryb
        191
    goodryb  
       2016-06-23 12:01:27 +08:00
    @heat 从文字描述上来说,这个通知的确是有纰漏,但是从语义上来看,这个通知已经明确的指明了 本地 SSD 盘和 SSD 云盘的根本区别,可靠性问题。

    ps :另外,产品更新消息不算是广告邮件吧,当然,这个分类不重要,你开心就好。


    既然你是老用户,对于产品的更新也是需要了解一下,毕竟是和自己紧密相关的事情, SSD 云盘去年 5 月公测,到现在一年多时间,楼主没有任何了解吗?如果是一样的东西,还有必要重复造轮子么

    对于 ECS 重新初始化时出现的不可用问题,这个的确是阿里云的责任,你心急我能理解。不过我前面回复说的心急意思是 在工单没有处理完的时候,你得出(无故被初始化的结论),而不是说你在等待工单处理过程中心急,理解上可能有点偏差,在这里声明一下

    最后,对于楼主数据丢失表示同情,同样作为 IT 从业者,能够理解这种事情的严重程度。但另一方面,数据备份的基本意识还是要加强,有备无患绝对是真理。
    publicAdmin
        192
    publicAdmin  
       2016-06-23 14:03:54 +08:00   ❤️ 1
    @goodryb

    redis 我们之所以没采用那 ecs 自行搭建的方式就是考虑到维护以及稳定性问题,然而现实始终是现实。

    毕竟我们是小厂,引发点 redis 故障也无伤大雅,然而从我们的角度来看,正因为信任阿里云才选择把整套系统放在阿里
    云。既然我们选择的是你厂所谓的云生态中提供的 redis 服务,而非自建服务,也是处于信任承诺,然后把整个系统核心组件交于你们,然而事实并非承诺中描述的如此美丽,赤裸裸的打脸。

    那是我们的线上生产环境,里面存有用户 token 及一些涉及到用户资金计算的热点数据等等。就被你们一个误操作清空了,导致用户无法正常登录以及系统核算用户资金异常,这个锅真心太大了。
    这对一个创业公司来说除了看得见的损失可以所谓的预估索赔,然而那些看不见的损失才是致命的,好吗?

    --------


    所谓的客户经理还是啥的 1v1 跟进,告知故障原因系工程师误操作,问了下存储的是什么数据,然后让我们核算下损失上 报,同时工程师还在尝试恢复(然而好像是徒劳?)

    上报我们预估的经济损失后,得来的回复也是搞笑。给我们”一张现场参加互联网大会的门票“。 2333333


    --------

    宣传承诺固然重要,但是宣传了,让用户选择了你,就是用户对你的一种信任,请不要这样如此随意的践踏,好吗?

    现在创业公司选择阿里云平台的数不胜数,或许就因为一场你们看似不起眼的生产事故,导致了别人公司全盘业务的

    覆灭,这锅真心很大。
    zhuce
        193
    zhuce  
       2016-06-23 14:06:23 +08:00 via iPhone
    @goodryb 呦,不告状啦?那么懒不还是回复了一条…… 玻璃心就别装有境界
    goodryb
        194
    goodryb  
       2016-06-23 14:11:41 +08:00
    @publicAdmin 首先声明,这里只讨论楼主帖子提到的问题,你所说的问题 redis 我不清楚,我也不了解,我前面一次回复已经说明,如果是阿里云的锅,我支持你找他索赔,甚至是通过法律手段都可以。但没有必要在这里继续下去,所以接下来也没必要在就 redis 的问题在这里讨论。

    用户和厂商是有合同缔约关系,谁的问题谁负责。我只是客观的看待这个 ECS 问题

    另外,我!=阿里云,所以请陈述的时候 避免使用你厂,你们等字眼,以免混淆产生歧义
    publicAdmin
        195
    publicAdmin  
       2016-06-23 14:17:43 +08:00
    @goodryb
    喔,抱歉。我看小哥如此热心肠,就顺带倒了点苦水出来,针对 #192 楼使用到一些产生误会的字眼表示抱歉。

    - -我的过,把楼主的帖子歪楼了。

    ( ps :话说回来为何每次阿里云和用户有关的生产事故发生都会一起围观,我觉得也该反思反思下的)
    wizardforcel
        196
    wizardforcel  
       2016-06-24 13:03:41 +08:00 via Android
    云主机还有“本地盘”,简直笑尿。
    strahe
        197
    strahe  
       2016-06-24 21:58:55 +08:00
    @binux 你这个理由成立,可以的,小伙子.
    king110
        198
    king110  
       2016-06-27 12:02:02 +08:00
    派来洗地的人果然强大
    realpg
        199
    realpg  
       2016-07-03 17:33:02 +08:00
    @gefranks
    这种云跟硬件托管的区别就是这种云会丢本地盘数据
    托管我都没丢过……
    基本托管机至少是 RAID10 的本地盘,单点故障马上就替换了
    gefranks
        200
    gefranks  
       2016-07-03 18:45:20 +08:00
    @realpg 反正我觉得打着云旗号提供商用的还丢全部数据的是属于设计上的缺陷。我自己家里用的机器都会考虑这一点
    1  2  3  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2588 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 04:38 · PVG 12:38 · LAX 20:38 · JFK 23:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.