像亚马逊这样的超大型数据中心运营商,在市场上已经找不到适合他们自身用的数据中心,或者他们认为自己建设数据中心会比使用市场上的更为便宜的时候,他们会考虑自己建设数据中心。建设期间会将一项技术内置在工程建设中,避免工程承包商描述为在电气开关设备供应商在对其产品设计中错误的定义优先级而准备。

亚马逊

正是这个问题导致去年夏天台达数据中心宕机,最终支付航空公司1.5亿美元的损失,还有2013年在超级碗期间的臭名昭著的停电事件。 亚马逊网络服务副总裁兼工程师约翰。汉密尔顿(John Hamilton)在其职业生涯中,同样遇到过这类问题。

他在个人博客的中写道:“这种大规模数据中心运营中,我自己经历过过两次。” 当这些失败发生的时候,那时候,他并不清楚这种是由于这种原因导致故障发生,这是发生在在他加入亚马逊之前,在微软工作期间发生的。

汉密尔顿并没有在他的博客文章中引用台达,但去年夏天只有一家主要的航空公司数据中心中断,随后航空公司后公布了赔偿达到九位数。

亚马逊处于这种考虑的设计避免这种停电的技术是固件,它决定了当数据中心电源中断时电气开关应该做什么。汉密尔顿说,典型的供应商固件优先考虑防止损坏费用昂贵的备用发电机,从而避免完全的数据中心中断。 亚马逊(也许大多数其他大型数据中心运营商)都倾向于冒着失去100万美元设备的风险,而不会去冒大面积停电宕机风险。

当公共设施停电(大多数时候都是这种情况)发生时,开关柜等待几秒钟,以防公用事业电力回来(也是最常见的情况),如果没有,开关柜将会启动发电机,而数据中心开始运行UPS系统存储的能量。 一旦发电机稳定下来,开关设备就成为IT系统的主要来源。

去年的台达数据中心停电归因于开关柜“锁定”在亚特兰大航空公司的发电机。 这是大多数开关柜在数据中心输入电力供电中感测到主要电压异常时设计的。 发电机短路通常会导致发电机炸飞,因此开关柜通常将发电机开关处于锁定状态,避免发生这类事故。

在大多数情况下,这个错误发生数据中心外部,因此这这类事故除了造成数据中心业务中断之外,没有其他英雄,Hamilton写道。 (他目睹的两件事是由于汽车撞倒了传输电缆导致公共电源中断所造成的)。在极少数情况下,数据中心内部短路,断路器断开,服务器切换到二次电源,或(如果配电系统中的故障较高或断路器未能打开),发电机未锁定时可能会损坏发电机。

“我宁愿投入低于100万美元的风险,而不是保证负荷将下降。 他说:如果只有一个客户可能会亏损1亿美元,那么储存发电机就不会像是正确的优先事项。”

当亚马逊工程师要求他们的开关柜供应商从其固件中消除锁定状况真个固件时,是他们应了解到取消后带来的潜在的设备故障 – 但供应商却拒绝取消,亚马逊只能自行生产固件。

汉密尔顿写道:“我很幸运能够在一个大规模的运营商公司工作,因为定制的缘故,我们早在几年前就解决这种特定的故障模式。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-19 10:05:00
国内资讯 IDC预测:2021年100 GbE将会成为数据中心主流交换机!
根据研究公司IDC数据显示,自2000年代中期首次亮相以来,今年10G以太网交换机将首次损失市场份额,这是因为服务提供商和超大规模客户逐渐开始部署更快的带宽40G和100 G交换 <详情>
2017-07-19 09:52:52
机房建设 变频离心冷水机组在数据中心的应用优势
数据中心建设规模日益增大,采用大型的制冷解决方案,系统虽然复杂,但是能效高、节能效果明显,日益成为主流。 <详情>
2017-07-19 09:46:53
国际资讯 谷歌FB等巨头越做越大,专家:政府该不该管管呢
南加州大学传播学院创新实验室荣誉退休教授乔纳森。塔普林(Jonathan Taplin)在华尔街日报发表题为“科技巨头能阻挡吗?”的文章。文章称,谷歌、Facebook、亚马逊等科技 <详情>
2017-07-18 17:42:22
云资讯 对战云服务市场两大强敌 谷歌步步为营谋霸业
自2016年以来,围绕云计算与大数据的市场竞争日益激烈。面对愈发复杂的市场格局,以及日益强劲的竞争对手,谷歌显然无法再“故作镇定”。为与亚马逊和微软相抗衡,谷歌近期 <详情>
2017-07-18 17:14:00
国际资讯 卢森堡政府:不管费多大劲都要留住谷歌!
近日,卢森堡政府在当地广播FM100.7上发布的一份报告称:卢森堡政府已经重新找到了一块土地供Google建设数据中心。 <详情>