首先,我不得不说,我很少看到人们如此自觉的参加会议。匆忙的早餐之后,大家纷纷出席会议,午餐和主题聚会的讨论也相当热烈。在晚上的解决方案中心讨论时刻,人们贪婪地吸收各种参展商的信息。即使白天在走廊里,也有相当多的人在不停的交流意见和信息。与会人员都十分认真的在向演讲者、供应商、以及他们的同行学习。
最重要的是:避免停电,加快恢复
现在,让我们来看看与会者们心中最重要的问题是什么吧。我有点惊讶地发现,这一主题并非通常情况下CIO们/或者IT专业人员们所最为关注的十大问题之列。与会者们反复表示感兴趣的话题是如何避免停电和增加在断电后快速恢复服务的速度、以及如何更好的监测,以帮助实现上述这两个目标等相关话题。
诚然,这是一次关于数据中心运营的具体会议,因此很自然的,避免停电和恢复操作失误是至关重要的。但与此同时,我们也听到很多其他的关于数据中心运营方面的倡议,如虚拟化、云迁移和数据中心整合。这些引人注目的主题都是相当重要的。然而,关于如何避免停电,并加快断电恢复的这个问题则是至关重要的,其影响到数据中心业务领导们的日常工作和事业。
基础仍然相当重要
为什么?很简单。其中的一些倡议看上去很新。但监测已经成为了永远的话题。另外,从某种程度上,断电是不可避免的。同时,零故障的确是不可能的,但显著提高的可靠性则是可以达到的。从电信服务供应商方面的历史来看,“五个九”级可靠性是预期的服务水平。当期望很高时,自会进行相应的投资,更高水平的可靠性便指日可待。
至于监控解决方案本身,现在你不必局限于老派系统。有诸如Circonus这样年轻的公司,可以采取新的方法,上下突破过去独立的工具集。
现在让我们退后一步,想象一下断电对于一家数据中心来说到底意味着什么呢,即到底什么事情会“引爆”一家数据中心。其实,大部分时候,并非外部诸如客户等因素直接影响数据中心。外部的客户所接触到的一般都是业务联系部门,然后由业务部门与数据中心的领导们联系。
而关于服务水平协议(SLA)则保持业务部门通报他们的利益?在Gartner的大会上,我明确的听到关于企业内部的SLA大部分是无用的的言论。为什么呢?因为他们对企业的业务部门没有太大意义,业务部门所感兴趣只有“你何时对我的服务进行备份?!”换句话说便是“你最近为我做了什么?”
让我们看看一个备选的解决方案选项。如果问题发生在一台虚拟机,你可以组建一个新的实例,对吗?错,但通常人们就是这样处理的。当吊货架上的一个锤子晃来晃去打中你的头,你会用另一个挂锤来替代,并认为你已经解决了这个问题了吗?显然,我们在数据中心所需要做的工作就是要避免重复的问题再次出现。我们必须进行根本原因分析,否则你会反复遭遇到相同的火灾。
一个好的监测系统将在多个方面提供帮助。首先,它协助找出潜在的问题,包括这些问题的位置:是在应用程序中、数据库、还是服务器中。这样,你不必要进行盲目的测试,其可以帮助你创建表格,方便快速地做好相关指标。
好的,这样的补救问题随着降低的机会,它再次发生。但是你还想要做的预期行为能力计划避免瓶颈垄断。为此,你还需要一个易于使用的工具,所以你不用耍弄电子表格。你会希望能有一个“播放”功能,当你在处理比如codepush时,你就可以实时看到这些变化的影响。这样,如果codepush的效果是负的,你可以迅速扭转操作,而不会影响您的内部或外部客户。
好消息是,所有这些功能的新的解决方案在市场上有。-当然,在你购买一台,一定要坚持在试验测试的解决方案如何执行,在您的当前和预期(阅读:物理和虚拟混合/云)环境。这包括看到的解决方案是如何处理你的规模,无论后端,从UI的角度来看。这样的评价,将需要你投资时间,但这样做的结果将是非常值得的,其将帮助您避免停电的增加,并加快恢复时间。

首先,我不得不说,我很少看到人们如此自觉的参加会议。匆忙的早餐之后,大家纷纷出席会议,午餐和主题聚会的讨论也相当热烈。在晚上的解决方案中心讨论时刻,人们贪婪地吸收各种参展商的信息。即使白天在走廊里,也有相当多的人在不停的交流意见和信息。与会人员都十分认真的在向演讲者、供应商、以及他们的同行学习。

最重要的是:避免停电,加快恢复

现在,让我们来看看与会者们心中最重要的问题是什么吧。我有点惊讶地发现,这一主题并非通常情况下CIO们/或者IT专业人员们所最为关注的十大问题之列。与会者们反复表示感兴趣的话题是如何避免停电和增加在断电后快速恢复服务的速度、以及如何更好的监测,以帮助实现上述这两个目标等相关话题。

诚然,这是一次关于数据中心运营的具体会议,因此很自然的,避免停电和恢复操作失误是至关重要的。但与此同时,我们也听到很多其他的关于数据中心运营方面的倡议,如虚拟化、云迁移和数据中心整合。这些引人注目的主题都是相当重要的。然而,关于如何避免停电,并加快断电恢复的这个问题则是至关重要的,其影响到数据中心业务领导们的日常工作和事业。
基础仍然相当重要

为什么?很简单。其中的一些倡议看上去很新。但监测已经成为了永远的话题。另外,从某种程度上,断电是不可避免的。同时,零故障的确是不可能的,但显著提高的可靠性则是可以达到的。从电信服务供应商方面的历史来看,“五个九”级可靠性是预期的服务水平。当期望很高时,自会进行相应的投资,更高水平的可靠性便指日可待。

至于监控解决方案本身,现在你不必局限于老派系统。有诸如Circonus这样年轻的公司,可以采取新的方法,上下突破过去独立的工具集。

现在让我们退后一步,想象一下断电对于一家数据中心来说到底意味着什么呢,即到底什么事情会“引爆”一家数据中心。其实,大部分时候,并非外部诸如客户等因素直接影响数据中心。外部的客户所接触到的一般都是业务联系部门,然后由业务部门与数据中心的领导们联系。

而关于服务水平协议(SLA)则保持业务部门通报他们的利益?在Gartner的大会上,我明确的听到关于企业内部的SLA大部分是无用的的言论。为什么呢?因为他们对企业的业务部门没有太大意义,业务部门所感兴趣只有“你何时对我的服务进行备份?!”换句话说便是“你最近为我做了什么?”

让我们看看一个备选的解决方案选项。如果问题发生在一台虚拟机,你可以组建一个新的实例,对吗?错,但通常人们就是这样处理的。当吊货架上的一个锤子晃来晃去打中你的头,你会用另一个挂锤来替代,并认为你已经解决了这个问题了吗?显然,我们在数据中心所需要做的工作就是要避免重复的问题再次出现。我们必须进行根本原因分析,否则你会反复遭遇到相同的火灾。

一个好的监测系统将在多个方面提供帮助。首先,它协助找出潜在的问题,包括这些问题的位置:是在应用程序中、数据库、还是服务器中。这样,你不必要进行盲目的测试,其可以帮助你创建表格,方便快速地做好相关指标。

好的,这样的补救问题随着降低的机会,它再次发生。但是你还想要做的预期行为能力计划避免瓶颈垄断。为此,你还需要一个易于使用的工具,所以你不用耍弄电子表格。你会希望能有一个“播放”功能,当你在处理比如codepush时,你就可以实时看到这些变化的影响。这样,如果codepush的效果是负的,你可以迅速扭转操作,而不会影响您的内部或外部客户。

好消息是,所有这些功能的新的解决方案在市场上有。-当然,在你购买一台,一定要坚持在试验测试的解决方案如何执行,在您的当前和预期(阅读:物理和虚拟混合/云)环境。这包括看到的解决方案是如何处理你的规模,无论后端,从UI的角度来看。这样的评价,将需要你投资时间,但这样做的结果将是非常值得的,其将帮助您避免停电的增加,并加快恢复时间。

 

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-09-25 17:36:03
互联网 1—8月份,我国电信业务收入累计达11417亿元
截至8月末,5G基站总数达313.8万个,占移动基站总数的27.5%。 <详情>
2023-09-25 14:27:47
机房建设 “信力量 新可能”走进中企通信云数据中心(上海站)暨“算力中国行”上海站 活动圆满结束
在全球范围内拥有强大ICT资源的中企通信,也得到了众多如上海联合产权交易所等国内外知名企业的“青睐”。 <详情>
2023-09-25 10:19:13
国内资讯 数能相融 品牌新生|合盈数据发布绿色数能品牌—GED³
伴随着产业实践的深入,合盈数据将产业融合创新、生态可持续发展的认识总结提炼为GED³。 <详情>
2023-08-28 14:29:03
机房建设 从技术框架到建设与服务 数据中心如何向智算中心演进?
企业类智算中心数量还将增加,但规模较小,未来区域智算中心将是智算中心的主流。 <详情>