微模块北向接口为什么叫首次公开发布?因为这个协议之前一直是腾讯自己内部的协议,我们用来做微模块的数据接入的,所以今天也是第一次在ODCC峰会上,我们在会后会把它上传到ODCC官网上,大家如果需要的话可以下载。当然有一些同事可能对这个协议不是特别了解,所以今天演讲的主要议题也是介绍一下这个协议主要是做什么的。

颜小云

我们首先从腾讯云的布局说起来,这是我在腾讯云官网上下载的我们现在在全球数据中心的布点图,当然这里面没有全部画全,很多是通过区域的方式来画的。简单来讲现在腾讯云超过1000架以上的数据中心已经超过了50个,这个量是非常大的。在这种时候,我们管理数据中心的时候面临很多挑战,来自多个方面。以前,基础设施这侧监管还没报警的时候,业务中心找到我们,说我们的数据中心超温了,这种情况我们是想避免的,我们想达到的理想情况是基础设施出了问题,我们可以知会业务。这么多数据中心不可能全部是腾讯自建的,大部分是租建的,委托给第三方。这种情况下我们怎么去管理第三方?我们怎么知道跟他签了SLA协议,他有没有满足我们的协议?数据有超温、漏水的情况他有没有知会我们?另外很多数据中心都会配数据中心经理管理数据中心,他们是跟第三方去合作的,架起第三方和我们腾讯之间的桥梁。这些都是我们在面临这么多海量数据中心的时候面临到的问题。   

怎么解决这个问题?大家能直接想到的就是把数据中心的状态接到服务台里面,把所有数据中心的数据都收容到一起,发到数据中心去管理,很大程度上可以解决这个问题。现在很多数据中心接入都是采用左边这种模式,数据中心A也好、数据中心B也好,我们基本上都会有一个动环的监控系统,会给我们开一个接口,腾讯上面的管理平台我们叫腾讯星云会把它再接上去,看上去好像是很简单的事。但是右边大家可以看到我们其实遇到了很多很多问题,首先第一个接入允许的问题,像我们的数据中心如果是租用第三方,可能是运营商投资的,他们是不是允许我们把数据接上去?   

第二个我们就面临一些协议适配的问题,现在各家做动环的也好,做DCM的也好,其实有很多很多协议,有各种各样的协议,我们到底选哪一种?因为我们的研发人员也有限,不可能所有协议全部都去支持和适配。信号点的选择这也是一个问题。   

下面接下来面临的一个问题是比如说一个电表或者一个UPS,这么多监控点位到底哪些对我来讲是有用的?因为这么多数据中心,1000个机架以上的超过50个,海量的数据上来,我们要去选哪些点位对我们最有用?我们要把最佳实践固定下来。这些所有点位我需要选择,这是我们要做的第三个事情。   

最后还有一个点位标准化的问题,回到刚才说的如果我们对UPS选定了5这条信号是我想要的,这条信号各家给出来的内容、单位、小数点后的精度都不一样,标准命名也都不是标准的。所以为了解决这些问题,腾讯在大概三年多以前,我们就定义了一个标准化SNMP协议,这个协议是用于腾讯微模块的一个监控数据传输的标准协议,首先它是以微模块为颗粒度,因为腾讯布了很多很多微模块,每一个微模块里面大部分的设备有一些什么样的设备这是标准的,我们首先以微模块为颗粒度定义了它的标准,这个协议规定了每一个微模块要传递什么东西。   

另外一个,它说的语言是走SNMP,也规定了这个微模块里面有哪些设备我需要监控?每一个要监控的设备到底要去什么点位也是有规定的,UPS多少条、电表多少条等等。另外一个,每一个信号点位的ID是多少?换句话说,只要在微模块里面给我一个ID,我就知道这代表哪一个设备的电压和电表,我们把每一个ID定义死。基于这样一套协议,到目前为止我们已经接入了超过1700个微模块。   

为了便于大家理解我举了一个例子,是从北向接口协议里面扣出来的。这其实是一个类似电表的,左边这一列是它的标准信号点,也就是说我要去检测它的点位。有A向电压、B向电压、电流、状态是闭合还是断开、功率等等,每一个信号有一个OID上传。所以当厂家跟我们对接好的时候,他传一个ID,我就知道这个在哪一个点?所以所有设备我们都规定了这样一个ID,是不重复的,就像每一个信号的身份证一样。另外我们也规定了每一个信号小数点后面的精度是多少,另外它的名字规定有什么好处?简单讲说腾讯在数据中心A和数据中心B里面看到的告警描述是一样的,这样来讲只要是接入这样的设备都是标准的,所以这是每项接口的举例。   

它有什么样的好处?现在因为我们微模块的部署越来越多,所以基本上到目前为止我们所有这些微模块数据的接入都可以交给第三方来进行。在腾讯的官网上面厂家可以自己去下载,我看到今天也有一些腾讯在做微模块监控的供应商,他们也很清楚我们在微模块验收之前,他们可以在腾讯官网上直接下载验收工具,用这个工具先自测,看满不满足腾讯每项接口的测试标准。如果测试通过了,再通过腾讯的人到现场验收。所以这个相对于以前,我们一个一个去对接接口,节约了很多的时间。所以我们在短期内把1000多个将近2000个微模块的数据都接上了。   

标准化之后除了带来部署这块的好处,我们也做到了软件部署模块化,包括像电池,因为电池节数和点位都是一样的,只要把这些功能做好了布上去就可以。简单讲这就是腾讯北向接口所带来的好处,大家如果感兴趣可以会后在ODCC的官网上去下载,这个协议慢慢地我们也看到在向其他行业去拓展。之前我们也看到一些标书,其他行业在招标的时候说要满足腾讯的北向接口,这对行业也是一个好处,我的分享就到这里,谢谢大家!

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2020-09-16 10:24:24
国内资讯 ODCC智能监控与管理工作组组长、腾讯数据中心高级架构师颜小云:开幕致辞
在9月16日智能监控与管理分论坛上,ODCC智能监控与管理工作组组长、腾讯数据中心高级架构师颜小云发表了开幕致辞。 <详情>
2018-10-19 09:52:02
国内资讯 2018开放数据中心峰会盛大开幕:二十二项成果精彩亮相 技术创新推动产业升级
10月16-17日,由开放数据中心标准推进委员会(ODCC)主办,百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息通信研究院和英特尔承办的“2018开放数据中心峰会”在北京 <详情>
2018-10-19 09:33:37
国内资讯 现场直播|3M数据中心首席专家蓝滨:3M浸没冷却技术回顾与展望
浸没冷却就是将计算机的器件浸没到绝缘的液体中,通过液体的相变或运动作用将热量带走。第二,它主要的优点是有很高的制冷效率,所以可以把系统设计得更加紧密,同时起到节 <详情>
2018-10-19 09:26:32
国内资讯 现场直播|GRC绿色革命冷却大中华区总负责人李艾德华:浸没式冷却技术的全球性发展
其实中国很多的数据中心制冷还运行在PUE2.2以上。原因是,我们还是用在50年前的技术。而现在浸没式液冷在市场上以运行有十年的时间了。它的PUE值能达到近1的水平。 <详情>
2018-10-18 09:58:18
国内资讯 现场直播|中国电信云计算研究员吴林泽:基于SDN/NFV的DC网络关键技术研究与实践
驱动层所提供的SDN、VNF的协同可以提供更好的方案,可以使我们极大的利用产业竞争带来红利。整个产品极大的提升了中国电信的运维效率和业务开通速率,以及节省成本。 <详情>