近日,某IDC服务商机房宕机直接导致某商业银行业务中断,此事引起了银监会的高度重视,并发布了《中国银监会办公厅关于银行业金融机构数据中心基础设施外包风险提示的通知》。通知指出,银行业金融机构要开展自查,从加强外包风险管理,加强对基础设施主动管理,提高业务连续性管理水平等三方面采取防范和应对措施。

中国银监会

据了解,此次宕机事故的原因是:机房内电力负载过高,造成配电柜开关跳闸,供电中断,空调停止运行,生产机房温度升高导致的设备宕机。

其实,类似的事件不是第一次发生了,之前中国信息通信研究院的专家就针对数据中心机房故障的原因做出过总结,专家们表示,数据中心机房故障多发的原因关键还是在运维管理上,所谓“三分技术,七分管理”,数据中心的故障大多来自人祸。

结合事件原因及之前案例,我们不难分析,导致此次事故的很大一部分原因也是“运维管理不到位”。

首先在建设数据中心之前没有对负载做出充分的预估,导致电闸配置不能满足负载的需要;其次,在发生事故之后,应急处置能力不足,导致不能及时的解决突发事件;另外,机房制冷方面仅依赖空调制冷,没有设置高温应急措施,导致机房持续高温。

频繁的数据中心故障和宕机事故表明,某些数据中心在一味满足客户个性化需求的同时,忽略了自身运维管理能力的提升,导致数据中心可靠性降低,从而发生此类事件。而客户在选择数据中心的时候则存在着,不知道该如何选择优秀的服务商,如何去评估一个数据中心的管理能力,如何规避风险,以及如何审查服务商对合同的执行力度。

在客户自身无法评估数据中心服务能力的时候,来自政府或权威第三方的权威评估就显得尤为重要。

工信部

自2014年以来,工信部一直关注着数据中心的服务能力。其下属组织数据中心联盟,也一直致力于推动数据中心产业的健康发展。为了更好的规范数据中心服务体系,提高数据中心的服务能力水平,保证数据中心客户在选择数据中心服务商及相应服务有充分的参考依据。同时,为了将主管单位政策落到实处,在工信部的指导下组织相关领导,技术专家以及行业用户,完成了数据中心服务能力评价标准的编撰工作。

数据中心服务能力评价标准是从用户视角出发的评估体系,是目前国内最科学的一套评估体系,它能够全面体现一个数据中心的整体服务能力。

通过对数据中心进行评估,不但可以很好的帮助客户解决痛点。同时,也可以帮助数据中心服务商了解自身现状,增强自身的市场竞争力,留住现有客户并发展新的客户,规避运维过程中的各类风险,为客户提供更加优质的服务。

总而言之,通过科学规范的评估,可以帮助客户认清服务商,也可以使服务商看清自己,从而减少宕机事件的发生,促进数据中心行业健康有序的发展。

【本文由中国IDC圈原创,转载需注明出处】

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-11-16 09:24:00
国内资讯 京东11·11:撬动数据中心的支点——京东阿基米德
今年11.11,京东数据中心操作系统(JDOS)阿基米德已经全面接管了应用资源调度。每日调度百万台容器实例运转,每日为离线计算提供了多达3000万核。小时的计算资源,SLA履约 <详情>
2017-11-15 09:59:00
交换存储 什么是数据中心的双层存储系统?
大多数数据中心至少拥有五到六个不同供应商的不同存储系统,这既提高了存储成本,又加大了管理复杂性。而一个潜在的解决方案是全闪存数据中心,其中所有数据都移动到一个单 <详情>
2017-11-15 09:40:37
机房建设 数据中心从芯出发
数据中心是信息处理的集中场所,是由大量服务器、网络和存储等设备搭建起来的强大数据处理系统。虽然现在云计算、大数据、人工智能等这些软件虚拟化的技术在数据中心里大行 <详情>
2017-11-15 09:33:00
国内资讯 阿里云+思科,构建下一代数据中心
中国最大的公有云服务提供商阿里云的目标是在2019年之前达到或超越AWS的公有云市场规模,为此阿里云即将在北京建立的数据中心将会采用思科的技术来实现。 <详情>
2017-11-15 09:22:00
国际资讯 由于光缆被盗 即将开通的数据中心被迫延期
据国外媒体报道,位于南非约翰内斯堡市布莱姆芳登社区的数据中心价值200万南非兰特的铜缆11月11日被盗。这个数据中心设施将于12月开通,但由于发生盗窃案件,其运营将被 <详情>