9月27日,由开放数据中心委员会主办,百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息通信研究院、英特尔承办的“2016ODCC开放数据中心峰会”在京隆重召开。在下午的ODCC数据中心解决方案分会场上,中兴力维首席技术官CTO曹友盛发表题为“ZNV中兴力维在DCIM中的大数据布局”的演讲。以下是演讲全文:

曹友盛

中兴力维首席技术官CTO 曹友盛

谢谢组委会给我这个机会,我觉得南北向标准委员会搞的非常好,讲之前我先澄清四件事情,第一件事情你们有没有注意到数据,我们有两种数据,我们讲到IDC数据,和南北向的数据是两种不同的数据,因为IDC我们称为数据中心,里面存储了大量的数据,百度、腾讯、阿里,每天有大量的数据都存在DIC里面,咱们南北向规范的并不是那个数据,那个数据是从网络上来的,咱们南北向规范的是咱们这些设备,那些磁盘,那些路由器,那些空调动力环境,他们本身在运行为了存储这些数据而让那些网络走得更快、更安全,这些设备本身会产生大量的数据,表示它在正常的运行,咱们南北向规范的是这一类数据,不要讲在一起。所以这个此数据非彼数据。

第二个,大家都在谈LOT,去年有一些国际大佬正式宣布互联网时代已经消失了,接下来的是物联网时代,也就是LOT的时代,大家怎么正确的理解互联网时代消失了,这个东西也跟南北向规范有关的,当互联网的每一个终端连接的是一次被动的电脑、手机要人去按的,信息要来来回回,那么物联网后面连接的,我们前面张总他们已经都讲了,就是他们公司产生那些智能的设备,当互联网的终端全部被那些智能设备连接以后,这张网就是物联网,很简单的。那么回过头想讲为什么数据这么重要,记得有一次听了一个讲座,他说假定今天是世界末日,有一个诺亚方舟等着你去乘,但是每个人只能留下两个字,给下一个人类传递我们这个人类的知识,那么斯坦福有一个教授说第一个等于1=MC平方这是很出名的爱因斯坦定理,质量和能量的转换,第二个是留下桑平衡,很多学化学热力学都知道桑定理,现在桑定理在MBA的课程是必修的,做MBA的一定要学,那么桑定理是什么?就是这个世界整个宇宙是往均匀的方向走,或者往更混乱的步骤去走。第三个讲的是普朗克定理,当你非常精确的要定义一件事的时候,你就会非常不精确的定义和这个事情有关的事情。

其实这三样东西都揭示了我们今天在这边干吗,这个世界就是慢慢的朝着非常均匀,非常混乱的角度上走,也就是大量的数据会产生,我们也谈到,物联网产生以后有大量的数据会产生,而此数据非那个阿里、腾讯的数据,大量的数据都是LOT设备本身产生的,这有点信我们经常说一声看我们的病而医生本身的病没有人去看。IDC存储了很多的数据,但是DIC本身的数据谁来关注呢?它产生的华为、施耐德都有很多这样的设备,每天IDC的标准委员会定义怎么采集这些数据上来。所以这些数据上来的目的就是今天我要谈的。

看上去目录挺多,实际上就是11页,我前面已经讲了高速增长的IDC数据是因为我们要留给下一代三个定理,测不准定理,桑函数定理,早已经定义的这个宇宙的规律,就是数据会越来越多,如何把数据转换为核心竞争力,第三,我们谈一谈IDC现在存在的问题,我们自己的想法和大家共享一下,还有解决方案。在整个当我们涉及各种各样的空调、感应器、模块以后我们有没有考虑过数据流能力的设计,我们谈了很多POE的设计。我们是怎么解决这些数据的能力的设计,最后我们举例子。

DCIM通常是指数据衷心的基础设施管理,这边的定义也不是我讲的,这是网上的,对一个数据中心,DCIM所关心的源源不止是基础设施,所以今年年初我们在另一个ODCC的标准委员会展会上我们提出把I改为综合管理,这样就会在基础设施管理增加了一层综合管理,就管数据中心怎么样能够更高效的、更安全的、更省心的去运行,所以这里面引入的很多除了基础设施管理之外的一些概念,比如说FRP,就是基础设施的资源管理,ERP,企业的资源管理概念,我们引入了很多新的概念,今天我们又引入了一个新的概念,我们认为当因特网的末端设备被智能化以后,数据中心已经被物联网化了,这个时候每天产生的数据是以指数形式的高速增长,等会儿我给你们看一些数据,大家会觉得这么大的数据。

所以我们当设计一个数据中心的时候,我们除了设计基础设施,包括它设施扩展过程,我们更好的应该应用全方位的解决方案,其中数据采集量和多样性是我们很要考虑的,预测性的价值和真实性,分析能力和速度,这些都变得非常非常重要。所以这就是我们经常讲的DCIM对大数据的五个定义。

第一个是大量,第二是高速,大量的数据快速的传递,第三,各种各样的数据,第四,这些数据对我们带来的价值,第五,就是真实性。

很多人谈到数据,现在谈到大数据就觉得瞎吹,都是开玩笑的,我这边要强调我们今天有很多人,我们的标准委员会制订的怎么样,从采集设备区把数据采集起来,我们知道每天怎么产生数据,但是我们却要懂得如何保存利用数据,这是我们所做得不够的。谷歌刚才我们讲了是CT,实际上这家公司从一开始根本没有想到要做什么产品,它只想到一件事,数据,我只要拿到足够的数据我就赢了,包括今天开的滴滴打车,你们真的觉得它要给你们提供价廉物美的驾乘系统,其实它要拿的是大数据,拿数据的一个途径。可以判断滴滴打车以后会产生非常多的和它无关的产品,这也就是谷歌当初只想拿到数据,拿到数据以后衍生出来太多革命性的产品。所以我们对谷歌的定义,它是一个非常懂得使用数据,非常懂得怎么样把数据成为它的核心竞争力的公司。

所以,我们要学会如何保存数据,如何使用数据,数据太多了,所以我们在这种情况下怎么理解IDC的认识,从基础设施管理到综合管理我们又进了一步,推到基于大数据概念的IDC综合解决方案。IDC存在很多的数据,我们的感知设备确实不多,一般五千个机柜IDC有一百万个感知设备,不够,我们有很多地方有害没有去采集观察那些设备正常工作量,很简单,新加坡一家公司叫(英文),是监控整个新加坡所有电器的,每一部电器是27个检测点,所以我们检测设备还不够,我们还要更多的,一个机架里FID的测头就有很多,要测量你的温度多少等等,我们是不够多的。

第二,咱们的速度也不够快,咱们数据上来以后我们谈了很多数据标准上来,我们要认识这个数据,做一个简单的查询,没三个三五天一两个月数据是不会出来的,我们过去做的数据报表进去打一个搜索出来,怎么不出来,一看服务器不行,重启,这些都是很有经验很有体验的,所以报表的深度、统计的维度、在线分析的缺乏都是很不够的。

第三,咱们的多样性,我们采集的各种数据基本上呈现成一种信息孤岛,对空调的设备采商来说,它的电压、电流、温度,和对我们机柜的热度之间的联系我们都没有做这方面的联系,所以这种多样性都是很难去做到的。

比如说一个路由器烧掉了是什么引起的?过载引起的,说不定就是那个空调坏了,那个地方热了,所以路由器烧掉了,这是有关联性的。

最后,我们的价值,我们这些数据为什么要做南北向,我们采集那个设备数据上来对IDC经营者的好处在什么地方?我们要去知道这个问题,然后到底你做出来的建议是真实应,要知道谷歌两年前买的(英文),经过两年才最后证实了它会为谷歌数据中心带来40%的省电,刚才张总讲了,每度电省一分就是一个IDC,这是真实性。所以在这上面我们都有我们的一些应用,简单来说基本上就是增加感知设备,全生命周期监控所有设备,设备一进去我就监控了,每五秒钟一监控,通过第二代大数据引擎对你分析,五高速的查询分析,对于历史的积累多维度的分析,这些大家都谈话德国,我在这边也就不多谈了。这些是我们整个数据能力的设计,一般我们一个FSU就是刚才讲的南北向定义,我们最快可以达到20万个测点每秒钟一台,我们的会聚平台每秒钟达到300万个数据,这边是我们两台大数据引擎,读书能力每秒钟50SVT可以达到700多的存储数据,我们一百亿条数据的搜寻是远远少于一秒,就几十个毫秒,一些复杂的报表统计都是小于两秒,这个概念是我们讲的ODCC标准委员会的TCM的标准,下面是咱们自控,像施耐德那些产品,中间我们加了一层数据的处理,两边有两个例子,我们一百万个测点在五千个机柜,每分钟采集一次,一条测点我们标准委员会定下来是两百个大V,每天可以采集到14亿条数据,这14亿条是小数据,每天才产生288个G币,每五秒钟采集一次每天可以达到3到4个G币,五千个IDC一年下来是一个PB的数据,早上百度说它有十个PB,我们五千个机柜一年就是10个PB,这么大的数据,谁来处理呢?我们这边做了一个实时的,我们把大数据引擎我们称为小V,某电信公司,这是真实的,我们公司已经做了二十年的监控,这个电信公司2013年到16年,3您历史数据27亿条,要我们做一个告警统计表,一个是按月统计,一个是按年统计,一个是全生命周期的东西,过去都是无法实现的,按月统计五分钟勉强可以出来一个数据,这边是五百毫秒,现在经过大数据(英文)来处理,我们可以达到均小于一秒,这个是监控历史查询数据,提出一亿个条件,只要把那个符合一亿条的条件结果找出来我们只用了30秒,我们有信心小于一秒把它做出来。

这个是我们的总体响应,这是用一个诊断性周期趋势分析出来的,这是另外一个电信公司BE,它是有五年的数据50亿条,三万种不同的报警类型,我们按这个条件查到了400万条报警数据做出这样的统计报表,我们讲的大数据分成四层,第一层高速查询,我们称为相应性分析,高速的出报表,地个是诊断型分析,趋势分析,温度到了你才报警太晚了,温度上升以后有面函数的,抛物线的,什么时候该运行,什么时候不该运行。第三,我们称为预测型,这是大数据分析的顶尖层次,需要很多人工智能,我们有了云计算,有了几台机器在后面运算,我们有将近一个PB的中国各种运营商,BAT的数据在我们手里,我们可以进行分析,做出预测模型,把预测模型放下,在里面提供在线分析,让预测预警、事件判断变得更精确。

最后一层也是BMPT提出的,我们希望在数据中间找到我们还不明白的事情,就像阿法狗当初下的棋子,大家都不明白,这就是认知计算,它会帮我们找出一些我们所不认识的东西,这是高的武功。我们一直没有做到这么好,我们今天已经克服了第一层和第二层,我们正在做第三层,刚才第一层第二层两个报表已经给大家看过了,我们希望能够做到第四层,为大家揭示一下怎么样把IDC经营的更好、更高效、更安全、更省电、更省心,赚更多的钱,所以认知计算也是一种认知转换,在数据经营找出IDC。

我简单介绍中兴力维,1994年成立,我们在4年前被外资收购,成为一个独立经营公司,我们做IDC有三百多个研发团队,在深圳、南京、广州,谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-09-25 17:36:03
互联网 1—8月份,我国电信业务收入累计达11417亿元
截至8月末,5G基站总数达313.8万个,占移动基站总数的27.5%。 <详情>
2023-09-25 14:27:47
机房建设 “信力量 新可能”走进中企通信云数据中心(上海站)暨“算力中国行”上海站 活动圆满结束
在全球范围内拥有强大ICT资源的中企通信,也得到了众多如上海联合产权交易所等国内外知名企业的“青睐”。 <详情>
2023-09-25 10:19:13
国内资讯 数能相融 品牌新生|合盈数据发布绿色数能品牌—GED³
伴随着产业实践的深入,合盈数据将产业融合创新、生态可持续发展的认识总结提炼为GED³。 <详情>
2023-09-11 18:37:24
云资讯 吴泳铭接替张勇出任阿里云代理董事长与CEO
阿里巴巴公司将继续执行之前宣布的计划,对阿里云智能集团进行分拆。 <详情>