9月27日,由云计算发展与政策论坛、数据中心联盟指导,开放数据中心委员会主办,百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息通信研究院、英特尔承办的“2016ODCC开放数据中心峰会”在京隆重召开。在下午“行业数据中心技术发展及最佳实践”的分论坛上国电通业务策划部资深架构师翟满召发表了题为“电力云操作系统的关键技术研究与应用”的演讲。以下为演讲全文:

翟满召

国电通业务策划部资深架构师 翟满召

各位大家好。我是第一次参加咱们这个峰会,其实从我的角度来看,我是对咱们数据中心,其实我应该是个非专家,我今天下午演讲的主题就是云平台数据架构,实际上更是偏软件的,云操系统纯软件的方式,也让大家换一个口味。那我们继续。首先先说一下从三个方面考虑,第一个就是概念,然后第二个就是产品,可能会说一些相关的技术,首先可能说一下概念。概念的话可能一提到云计算,提到两家最牛的公司,一个是谷歌,一个是AWS。从十年来看,包括去年,去年AWS年收入应该是在八十亿美金,其实大家可以看,从十年到现在,云计算还是非常爆发增长的。我另外再提两个技术,第一个就是从2010年OpenStack,对标的一个开源产品,然后在2013年,也就是3年前容器出现,相当于又一个新的领域出现,所以说可能,这个片子有点像,在这个会场上有点不太适合,更多是云操系统,或者云计算的一个东西,不过没关系,大家可以了解一下。再看一下国电通,国电通定位是国家电网的一个子公司,它做一些能源项的服务,我们也服务内部的客户,这相当于我们一个定位。简单看一下资源。

其实从电力来看,跟云操也有一些类似,可以把资源分装一些,作为资源的调度,可能再提供统一的接口,对于用户来说就可以使用。基本上我们抽象出来把所有的电力资源都变成一种抽象。下面再看云操的系统,我们简单说一下,这个片子可能对咱们这个会场还稍微有点异议,云操的系统概念来看,一个就是云,一个就是操作系统,操作系统我就不多说,咱们经常用操作系统,传统操作系统里面可能会有各种各样的组件,比如说任务调度,包括文件系统,包括一些RPC。但是从传统操作系统来看,它对上就是一个普通的系统,咱们可能一个Word,一个进程或者一个QQ,可能就是一个标准的进程应用,对下是什么?对下可能就是CPU网络磁盘,云操作系统无非就是在传统操作系统上加了一个云,一提到云可能各种各样的分布式,比如说在云操作系统里面,可能也会跟传统操作有些对应,比如像任务调度,云操里面也有任务调度,所以说任务调度跟传统任务调度道理是一样的,比如可能有文件系统,只不过文件系统变成一个分布式文件系统,对下的话看一下,这个地方对下基本上是跨数据中心的,我云操对下是数据中心,对上也变成一个系统应用。基本上概念还是大家稍微了解一下。

再看产品。产品是这样,就是说我们也是基于OpenStack,一个领域是开源领域,另外一个可能就是自研的领域。相当于我们这边还是机遇一个开源平台,我们加了一些容器的技术,有点像跨数据中心的一个资源调度,我们数据中心有点像逻辑的数据中心,可能跟各位专家讲的物理数据中心还是有一点点区别的。再看一下功能架构。这个功能架构里面,底层的话还是数据中心,数据中心里面有这样的计算储存网络,这我就不多说了,可能这都是各位的领域。

对上我们做了一个资源分装,可能会有一个物理资源分装,可能对我们,你的物理服务器,你的容机,都可以作为资源分装。那再看一下分布式储存,相当于我们这个云平台,肯定会有一些分布式储存的一些东西,刚才也提了,云计算离不开储存,储存也必须要分布式,我们现在也是用开源的产品,做了一个分布式储存的实现。

再看一下集中式储存。有些关键应用它需要高IO的储存,它对LPS相当高,它需要一些传统储存来对接,我们也可以对接传统的储存。另外就是网络分装,网络分装的话基本上属于SDN了,基本上在OpenStack生态里面,我们可以简单看为一个南北向的网络分装。然后软件的话比如说像东西流量,大家可以理解OpenStack来实现。资源编排上面来看就是网络编排跟储存,刚才我跟各位也介绍了,我们把底层的资源看为一个资源,相当于把物理资源,虚拟机都看成一个统一的资源,网络编排刚才也说了,比如我们,可能现在都提倡软件定义,相当于我们在数据中心里面也一样,创建一些路由、网络和防火墙等等,就是变成软件方式了。

储存的话刚才也说了,比如咱们可以创建一些高速,或者低速等等,相当于一个编排。进项我需要的是Windows的系统,Lunix,相当于这个就是进项仓库,做一层所有的进项。再往上的话就是资源调度,相当于比如说我一个关键应用,我要起一个应用,这个应用到底是跑在这个数据中心的物理服务器上,还是跑到另外一个数据中心上面虚拟机上面,或者容器上面都可以,或者有一个统一的资源调度,这个提防我们也是选择开源这个平台。还有一个就是动态的任务调度,首先第一级调度是资源,资源满不满足,另外一个调度就是任务调度,所以说这个地方可能会是做一个任务,它可能会有些弹性伸缩,大家用云计算也比较熟悉了。

后面我可能稍微介绍,因为我们现在做一个公共服务云,正好我今天参会对我有一些启发。再看一下应用,应用上面的话可能就是一些部署,或者一些服务发现,产品伸缩等等的,有偏应用了,这个提防我们做一些安全管理,这就是我们的整体架构,还是纯软件的方式。行,那就继续。再看一下我们这个产品,产品的话我们分了几个层次,跟刚才是类似的,只不过我们把相应的一些实现放在这里面,比如说像底层的话,底层分装我们是Iaas,我们肯定现在现在是OpenStack,我们用了它的计算、网络还有对象储存等等的,可能还有一些其他的组件,像资源编排这块,资源调度可能是我们用了M,其实就相当于咱们Lunix,在这里可能做一些资源的集中管理,相当于做一致性。再往上就是容器,或者一些相应的进项,简单了解一下吧,这就是我们的一个分层架构。

再看关键技术。咱们抛开这个片子,大家可以想想,比如咱们在企业内部要用云计算,比如一个应用跑在虚拟机上面,整个这个虚拟机宕掉,咱们怎么办呢?相当于这里面可能会有两个难点,第一个我怎么判断,这是一个难点,另外一个难点就是说数据云宕起来,我怎么涨另外一个虚拟机。还有一些更有趣的事情,比如我的整个机柜宕了,那我所有的虚拟机怎么办?我飘不飘?或者用不用在别的机柜上找回来?这都是问题。所以说可能会有一些小的定制,定一些阀值,可能还有一个问题,你自己的小程序,或者自己的这个东西宕了,我们也是用它做了一个,相当于我们自己程序宕机了,还有另外一个把我们服务拉起来,可能就是这么一个技术方案。

还有一个就是中大规模部署。这个上面有阿里、百度,或者各种平台,对于他们来说,我们数据中心的体量就非常小,我的经验里面可能还真没说到几千级别的数据,服务器,我的意思是说单中心内,几千台服务中心这么一个体量,我经历大概一千台左右服务器,我要把一千台服务器做成资源池,这就需要一些相应的技巧。这个地方可能咱们不太熟悉,所以说我就简单说一下,我们可能分了几个数据库,分了几个功能分发的意思,同一个功能我可能有两个集群或者三个集群来管理,有点像这么一个含义。比如像这个图里面,比如我由五个控制节点组成一个集群,我有两个消息队列集群,底下可能会分不同的AZ,如果大家用AWS,包括用阿里都会有这样的概念,AZ一般是跨数据中心的,但是是同城的。比如像这个例子,对于中大规模的部署,可能有一个难点就是我要收集所有的监控数据,我要把所有物理服务器,虚拟机数据中心收集起来,这个量还是非常大的,我们大概用了两个消息对垒集群,把所有的数据从两个集群里面拖到中央管控平台里面,基本上是一个分而治之的概念,所以这个咱们简单了解一下就好了。

这就是储存了,储存我们可能碰到了很多坑,但是在咱们这个会场就不再展开了,我简单说一下就行了。可能我们碰到系统抖动,比如你的系统可能会有一点点抖动,如果储存有一点抖动,对下面的应用还是很有影响的。所以可能我们要做一些小的调整,小的优化,比如说我对于CPU做一些隔离,做一些定期清理,可能会做一些小的调优。还有一个场景就是,基本上是一个朴实的规则,就我的数据必须放在D盘里面,如果用Windows来看,数据放在D盘里面,操作系统可以放在C盘里面,我真正的核心数据必须放在D盘里面,不允许你放在系统盘里面,可能还会有一些LO场景,最近我也在看阿里的东西,相当于阿里云上面,或者AWS云上面,可能会有一些高速盘,我可能跑一些数据库,可能跑一些其他的,所以说可能会有一个场景,相当于一种技术不是解决所有问题,可能比如说一朵云也不是解决所有的业务应用,道理是一样的,所以说还是一样,有些技术解决相应的业务场景。

还有一个就是运维,运维可能就是我们要对于这个储存要扩容,可能这也是我们经常碰到的一个坑。这个地方我就不多介绍了。这个是容器,容器简单提一下,可能这个概念有点偏技术,咱们也抛掉它,在会场里面给大家就说几个概念,比如虚拟化跟容器的区别。资源池化在数据中心里面非常常见了,但是三年前容器出现以后,大家都在容器上面做一些深度定制,包括行业上面对于容器来说可能还是比较关注的。那简单说一下容器跟虚拟机的区别吧,大家可以想想,我的虚拟机是不是得装操作系统,我的虚拟机是不是也得装一个操作系统?装操作系统上面我再跑我相应的业务,这就是虚拟机,容器可能就是,比如我是不是直接就是速度机的操作系统,跑一个小的程序,我就可以跑一个相应的容器了?它省掉了操作系统,这就是大的区别。你的虚拟化里面不需要再装一层操作系统了,这就是大的区别。反而我现在有个问题,比如说我在一个Windows操作系统上面,我能跑Lunix操作系统容器吗?这还是一个基本概念,肯定不行。因为容器本身的核心技术还是基于内核的,你内核变了当然就不行,所以还是有个基本原理,我不能在Lunix系统上再跑一个Windows,它肯定不会是跨操作系统的,我不能在Lunix系统上跑出来一个Windows容器。

行,我简单说一下应用场景。比如说我们会有一些简单的应用场景,比如做一些异构资源的整合,我们可以把内部虚拟化的平台做一个管理,还有就是做一些高并发,这个图上比较明显,比如说我的一个企业,一个应用达到一定阀值之后,我可以把所有的,全部在另外一个节点上找出来,这就是容器大的好处。比如说我的一个业务阀值,我有五千个并发,达到一万个并发的时候,我可以动态扩展相应的资源。

还有一个灰度发布我就不多说,这肯定是典型的场景,同一套版本,我可能在多个系统上进行部署,所以可能会有一个灰度发布,不影响在线业务。再看一下企业管理,我也不多说,我简单再耽误大家一分钟时间说一下公共服务云,“十三五”规划要做三朵云,公共服务云肯定是面向公众服务的,肯定就会跨数据中心了,我们现在规划当中是在北京、上海、广州做中心,我们部署在这三个栽培中心上面,网络现在是一个专线打通,所以这就是我来参加这次峰会,可以从咱们数据中心这个级别,可能更底层的级别了解到,数据中心到底是什么,所以在这里只是给大家简单介绍一下。就是我数据中心以上的,是怎么服务业务的。

我这边就这么多,谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-09-25 17:36:03
互联网 1—8月份,我国电信业务收入累计达11417亿元
截至8月末,5G基站总数达313.8万个,占移动基站总数的27.5%。 <详情>
2023-09-25 14:27:47
机房建设 “信力量 新可能”走进中企通信云数据中心(上海站)暨“算力中国行”上海站 活动圆满结束
在全球范围内拥有强大ICT资源的中企通信,也得到了众多如上海联合产权交易所等国内外知名企业的“青睐”。 <详情>
2023-09-25 10:19:13
国内资讯 数能相融 品牌新生|合盈数据发布绿色数能品牌—GED³
伴随着产业实践的深入,合盈数据将产业融合创新、生态可持续发展的认识总结提炼为GED³。 <详情>
2023-09-11 18:37:24
云资讯 吴泳铭接替张勇出任阿里云代理董事长与CEO
阿里巴巴公司将继续执行之前宣布的计划,对阿里云智能集团进行分拆。 <详情>