9月27日,由云计算发展与政策论坛、数据中心联盟指导,开放数据中心委员会主办,百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息通信研究院、英特尔承办的“2016ODCC开放数据中心峰会”在京隆重召开。在下午“行业数据中心技术发展及最佳实践”的分论坛上北京航空航天大学计算机学院教授、博士生导师熊璋发表了题为“数据中心发展的几个观察点”的演讲。以下为演讲全文:

熊璋

北京航空航天大学计算机学院教授、博士生导师 熊璋

非常感谢。听了前面几个报告,看了整个会刊,发现今天这个会议是一个非常务实的会议,每个分会场都在讨论非常具体的工业问题。在座的各位我看也都是行业的精英。这个是数据中心的一个特色。对数据中心的关注,行业远超过研究领域,或者说工业界远超过学术界,那既然会议的组织者还请我来想说几句,那我也得把研究界、科学界对数据中心的一些思考、一些观察来表达一下。君子务本,本立而道生。数据中心的发展到今天,是一个非常自然的规律,有了云计算,有了大数据,有了互联网,它数据中心就来了。数据中心要干什么?我觉得是我们应该要研究的东西。所以我想今天从几个观察点来给大家表达一下,我们从另外一个角度怎么去看数据中心的。

我想从两个方面跟大家讲,一个是整个数据中心,它的背景、为什么会呈现了这个样子,未来应该朝哪个方向发展,另外我会从四个点去讲我们的观察。首先说背景。其实今天谈数据中心,我们不得不感谢香农这个老科学家,是他在计算机有之前就提出来了一个所谓的采样定律,不管你是什么信号,我们今天的语音、今天的视频可以变成数据,放在在座的数据中心里面,是因为有这个采样定理,所以我们称它为信息论的创始人。请大家注意,今天的数据中心,不管你放的什么东西它是数字化的,而这些数字化本来的面貌,可能90%不是数字化,我们每天拿起音频、拿起视频来随便用,是因为数据化,和在座各位所研究的数据中心。

苗部长去年在《人民日报》有一个讲话,是又一个国家竞争力的关键资源。我来诠释一下它的这个。你说大数据是二十一世纪石油和金矿,石油贮藏在哪儿?金矿贮藏在哪儿?就是贮藏在今天会议讨论的数据中心里面。数据中心其实就是解决了怎么样把大数据汇聚在这个地方,然后开放给大家使用,传输、编码各种各样的过程。这就是数据中心的最基本的来源。我们说大数据,其实你说到大数据,它如果是石油和金矿的话,它就是我们现在工作的原材料,请大家注意,相当于你的数据中心,就在贮藏这些原材料,是未来赚钱的基本的东西。

好,如果说数据中心是贮藏这些东西的,那它就相当于一个国家的高速公路,高速铁路,机场这样的基础设施。因此我们说在座的各位研究的数据中心,今天这个会要研究的东西,是我们最基础的东西,是原材料,是我们的基础设施,有了这样一个定位以后,我们再来看数据中心。

数据中心的基础,包括互联网+,讲的很响的,包括云计算,刚刚还有电力系统的专家讲的,包括大数据,现在也是叫得很响的东西。有这样的三样知识,大数据、云计算,还有互联网+,支持了这样一个数据中心,干什么?数据中心是要给人家提供服务,数据中心不仅仅是把数据存起来,你把数据架构好,把中心架构好了,把数据收集来了,这是最基本的工作,如果没有服务,什么都没有。

因此我们一定要想清楚,作为一个数据中心,怎么样把数据变成钱,变成经济,你就一定要考虑好,你能够提供什么样的服务。当然前面说的人员控制也好,云计算的操作系统也好,绿色也好都是非常重要的,但是所有的这一切都是为数据服务来做准备的。由此我来说说我的几个观察点,四个点,我个人认为是现在我们应该给予足够重视的:

一.多元数据与数据的活化;

二.动态数据与实时性;

三.平台化与开放性;

四.绿色与可持续发展。

我一个一个给大家讲我的观点。

如果我们现在谈数据,你谈数据中心也好,谈数据汇聚也好,如果仍然是单一数据,基本没有价值,它一定是多元的,一定是来源于不同地方的。它一定是多模态的,你得到的数据有可能是结构化的,有可能是半结构化的,还有可能是非结构化的。你怎么样能够从非结构化的中间去快速的拿到你想要的东西?现在对我们是很大的挑战。

所以数据中心,同时要解决这样的问题。所有的这些数据之间,尽管它是多元的,可是它中间是有联系的,是有关联的,我们就要解决数据活化的问题。现在的数据某种意义上是死的,我从A这个元拿到的数据摆到这儿,我从B这个源拿到数据摆到这儿,我从C这个源拿到数据摆到这儿,你横向不打通,它能起什么作用呢?在座可能做过公安的系统,每一个局每一个行业都有自己独立的数据中心,这个作用会受到特别特别大的抑制。第一个解决活化的问题,要让数据有生命。第二个就是一定要解决数据的动态性跟实时性,2009年我给中央领导写信说,要在中国开展数据中心,我们叫DC,一定是动态的数据。如果你纯粹是静态的数据,可以保存没问题,但是它的服务,我们回到刚才讲的,它的服务就受到很大的抑制。

我们随便从国际会议中心,我现在要开车去机场,可能可以走北三环、北四环北五环,你可要看到有引导系统,有红色表示拥堵,黄色表示繁忙,绿色表示通畅,你去走绿色,等你走到哪儿哪儿就是红色,原因是什么?那个数据不是实时的,那个数据是变化的。这是很多城市目前的客观情况,数据的时事性,数据中心也是挑战。第三个应该关注的是平台化和开放性,现在的数据如果我们要支持,你不是一个平台的思路,不是一个开放性的思路,你怎么支持它有更高的效率呢?我总是想举两个例子,一个例子是谷歌,谷歌在最初建立谷歌的时候,只是为了搜索,在美国加州建一个数据中心,说美国人搜索很快,发现有很多从亚洲来得需求,那都到美国去海底电缆通讯量太大,然后在日本东京建一个数据中心,第二个数据中心来了,在那个地方汇聚数据中心,所以在汉城、在新加坡都建中心,有了这样一个中心以后,各个地方的搜索访问请求很快了,它同时发现,我有了数据中心,我有了数据,我突然有这么大的作用,什么作用呢?这些数据全部都有价值。在美国很多,像在座这样的年轻人,搞计算机的,大的梦想是什么呢?在谷歌的总部旁边租一间办公室,两三个兴趣一致的好友写一个程序,写一个应用,利用谷歌的数据提供社会服务,然后只要等到他的服务有一百万的客户成为他的会员,或者访问他,他就可以在办公室坐着等,第二天谷歌就有一个高层过来,卖不卖?五百万美金,一千万美金,这些年轻人第一桶金就有了。利用谷歌数据中心保存的数据,然后实现了对社会的服务。

另外一个例子是苹果。尽管Iphone7卖得不太好,但是它有一个活动,所有全世界的人,只要你愿意写苹果的软件,只要你愿意写LOS的软件,都可以写,但是首先你要交六十英镑加盟,卖出去一个得60%,它得40%,你可以卖一块人民币,卖一块英镑,随便你,完全开放的一个模式。这种平台化的效益,是应该我们建数据中心的时候,一定要思考的,让它怎么样提供更多的社会服务。最后一个关注点,我们刚才有人讲绿色,其实它的绿色跟我的绿色还有点不一样,我们的数据现在多到了什么程度?现在的数据在最近一两年这么涨上去的,尽管我们的储存期越来越便宜,尽管通信网络贷款越来越大,费用越来越低,可是你抗不过数据这么涨。大城市每一个人,有超过一个摄像头,比方说纽约,平均一个人有1.06个摄像头,这个摄像头在哪儿照,不断在采集信息,这个信息在不断的填满那些所谓的云储存的地方,所以机房会越来越大,大家知道,全世界消耗能源高的地方中间有一个是信息行业,我们不要以为是挖矿、炼钢,信息行业一样在消耗能源。我们怎么样一方面清洁数据,一方面要让数据也有新陈代谢?怎么应该保存我们需要的数据,同时我们应该摈弃那些可能不需要的数据,在座的各位都有这样的经验,如果你一天到晚照相,不停的往电脑里面放,过几天电脑里面就满了。那你现在想,我原来是不是应该挑一挑?

所以我认为,数据中心的建设,如果你要看准了数据中心未来应该提供的服务的话,一定要考虑多元数据,多模态数据和这些个数据的活化。一定要考虑你能够把你的数据中心变成一个动态的数据中心,保证数据的实时性,你能够按照一个开发式的建立你的数据中心,才可以保证你的数据中心是可以持续发展的,讲得不对的地方请大家批评。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-09-25 17:36:03
互联网 1—8月份,我国电信业务收入累计达11417亿元
截至8月末,5G基站总数达313.8万个,占移动基站总数的27.5%。 <详情>
2023-09-25 14:27:47
机房建设 “信力量 新可能”走进中企通信云数据中心(上海站)暨“算力中国行”上海站 活动圆满结束
在全球范围内拥有强大ICT资源的中企通信,也得到了众多如上海联合产权交易所等国内外知名企业的“青睐”。 <详情>
2023-09-25 10:19:13
国内资讯 数能相融 品牌新生|合盈数据发布绿色数能品牌—GED³
伴随着产业实践的深入,合盈数据将产业融合创新、生态可持续发展的认识总结提炼为GED³。 <详情>
2023-09-11 18:37:24
云资讯 吴泳铭接替张勇出任阿里云代理董事长与CEO
阿里巴巴公司将继续执行之前宣布的计划,对阿里云智能集团进行分拆。 <详情>