2018年3月21-22日,由中国信息通信研究院主办、中国通信标准化协会支持的"OSCAR云计算开源产业大会"在国家会议中心举行。

随着云计算技术的日益发展,并开始进入“深水区”,开源技术与云计算融合的程度进一步加深,并开始成为产业发展的重要支撑。"OSCAR云计算开源产业大会"将邀请行业内多位大咖与权重人物共同探讨、交流云计算开源技术、研发、治理、产业化方面的经验,探索开源与云计算的创新发展新路径。

 联通沃云云计算与大数据研发部总监刘中参加此次会议,并发表《基于开源技术构建沃云自愈服务能力》的主题演讲。

刘中


以下为演讲实录:

刘中:大家上午好!非常荣幸来到本次大会,我来自联通公司。我今天分享的题目是基于开源技术构建沃云自愈服务能力。

在展开探讨之前,有必要回顾一下联通沃云的发展。在“联通混改”国家政策驱动下,沃云进入新的发展时期,沃云是从2013年成立,发展到现在。在联通混改的政策下,出现一些新的思路调整。右边,在联通做自建云,提供的公有云、私有云、混合云,这个阶段我们提供出来的服务是以IaaS为主的,现在在我们合作的大背景下,我们要丰富我们的产品,不断丰富我们的业务,我们现在的发展思路是以云为核心,整合政企专线、应用类相关产品。在这之上,我们丰富新增了云网络,其中有代表性的,包括网络云化的云宽带、云互联、云专线、云祖网,从我们沃云开发角度看,给我们促进广阔云的发展提供了原理支撑。很典型的,比如我们用DCI技术,混合云两端私有网络互联我们通过DCI实现。另外,联通沃云的一个发展方向是部署行业云,更多行业应用要运营在沃云云主机之上,现在我们在开展医疗云和教育云,教育云里面我们主要推广的是教育云桌面系统。

下面介绍一下沃云体系之下沃云产品全体系视图,三方面来看,公有云、私有云、混合云。公有云已经不是新闻了,与阿里、腾讯都有合作,这是我们联通在思路上的转变,现在沃云的公有云上可以开通阿里、腾讯的一些产品,主要包括计算类、网络类、存储类、安全类和PaaS类。中间是私有云,这也是我本人这几年做的主要方向,我们联通私有云客户主要是政企客户,比如大型省级电子政务云,比如辽宁政务云、河北政务云、青海政务云,大型企业的私有云,比如最高人民法院和铁塔公司,沃云给这些客户服务的时候积累了很多经验,表现出来的是私有云的应用业务系统负载比较重,这些是我们沃云在建设公有云时未曾面临的问题。现在随着时代的变化,比如说我们在私有云里面,沃云也会和其他云服务商合作。一个省级政务云往往现在是由几家云服务商共同来做,由一个云服务商单独承包省级政务云的时代过去了。私有云上,我们和阿里、腾讯、华三华为会有一些合作。混合云,我们引入多云管理平台,以联通多云管理平台为入口,实现混合云的方式。

联通沃云2018年的方向主要是云网一体化,包括集团级专线、省级专线和安全类。下面介绍沃云整体技术架构。我们从底层来看,沃云定义操作系统,基于openstack和KVM实现我们的底层能力,在这之上,沃云尝试很多技术提供存储能力,目前主要是超融合的方式,如果遇到条件比较苛刻,性能比较高的场景,会引入其他存储后端。在网络组件方面,开源openstack提供出来的原生方案有较多实验色彩,沃云在这方面做了优化。在这些底层能力之上,我们封装定义出沃云产品。云平台是复杂度很高的系统,它承载租户业务,和我们云平台本身的组件,这些我们需要给它进行一个呵护和监控,这里面我们做了分布式的健康检查。

下面是今年的主要思路,在云网一体背景下的沃云平台。这里沃云的建设思路,主要是我们在全国有7个大型沃云基地,在每个省份有一个局部的节点,围绕这些数据中心建设边缘节点。这个我们建设的是合作背景下沃云公有云合作平台能力,有一个集中云管理平台,包括自服务系统,运维系统,运维监控系统,云接入及调度枢纽,可以把我们的业务分散到全国不同的节点上,这样的话我们就实现了在32个省份布局的资源池,统一的运营,统一的调度管理,通过同步复制技术实现资源池间的互通互备。

这个是我题目里面比较核心的部分,我们在建设一个复杂的平台的时候,里面各组件服务的自愈实现,在春节的时候,Google云曾经发生过客户拓机,从故障分析来看,里面有个网络组件卡死,Google本身的自愈系统没有能力处理它,还是由人工完成kill进程重启服务。这个给我们的启示比较大,一个是我们在大型的系统里面,自愈组件的必要性和它的使用范畴。所以我们经过考量和实际使用之后,我们对云平台公共组件着重进行了自愈方面的加强,和openstack里面比较重要的组件。自愈和监控是密不可分的,我们对资源池里面的资源和云平台本身的组件进行了监控。

下面是我们怎么提高沃云资源池的能力,这是我们部署的大概架构,我们首选部署架构是超融合的,一个故障域的节点数量不会像分离架构那么多,我们按照存储池的故障域划分沃云故障域,我们有3-4个cell,cell下面再分故障域,每cell划分3个AZ,适合一般的私有云、公有云部署需求。下面一个是更深入一些的内容,开源openstack实践的优化,这个是我们neutron-dhcp-agent高可用,为每一个network设置两个dhcp-agent,两个dhcp-agent位于不同节点。另外一个优化,原生的openstack一般是三类节点部署,独立的网络节点实现L3网络功能,南北流量集中,易造成性能瓶颈。我们给它做了优化,我的沃云部署没有网络节点,我是把网络节点dhcp服务和其他自定义都放到计算节点上,左边服务我把它都分配到中间的计算节点上。这个是我们对L3 agent的改造,我们采用VRRP协议,我们在两个节点上产生实例,共同提供虚拟路由器服务。

这个是沃云在存储高可用的实践,实现cinder-volume是开源社区里比较困难的一个点,但去年也有方式来做,用分布式锁来实现,沃云的办法更直接一些,我们是在每一个AZ部署多个volume,定期做检测。如果我发现有一个故障volume的话,我们会把它迁移到系统存储后端上来进行管理。总结一下我们开源实现的高可靠系统架构的加强,首先是增加冗余的硬件或软件,采用灾难恢复的手段。另外,通常情况下,我们优先选择原生内在的技术,我们不会为了高可用引用其他外部的软件,基本上采用openstack内部的东西来实现。高可用具体有管理节点的高可用,前面提到的dhcp/L3高可用,volume高可用,沃云管理节点的高可用。我们所有openstack无状态都可以高可用,进行负载均衡,管理无状态服务的VIP. warm算是联通沃云对openstack的一个贡献,warm本身不在openstack里面的,但这个是沃云原创的warm,初衷是它关注的是我如何管理虚拟机承载的应用,虚拟机承载的应用如何合理暴露出来,应用如何介入到租户网络里面。我们基于warm服务集成组件,我们开发出了云缓存、云备份服务。这是warm基本架构,通过消息队列,访问真正做事情的agent服务,就是下面那一排服务,这个对应我们不同的服务类型。

很多业界搞openstack的朋友,都说联通沃云openstack什么时候升级,这个问题我是这么看的。我们的态度是,openstack只是一个服务于沃云的框架,我们对它的定制是深度的,沃云现在所做的定制,可能我们在经历到下一轮K版本的时候都没有。我的态度是这样的。

最后我想引用伟大诗人泰戈尔《飞鸟集》中的诗篇结束我的分享。“云谦逊地站在天之一隅,晨光给它戴上彩霞。云把河之水杯注满,自己却隐逸在远处的山中”。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-03-26 09:11:02
运营商 重磅:联通宣布,关闭2G网络,17年了,2G功成身退!
前不久,就有关于联通即将关闭2G网络的消息,今天终于得到验证了,联通拟从2018年4月1号起,新办理的联通卡将不再支持2G网络,2019年彻底关闭所有联通用户的2G网络。 <详情>
2018-03-23 08:56:00
运营商 中国联通副总裁韩志刚离职 跳槽新华三出任联席总裁
3月23日报道,近日,运营商世界网获悉,中国联通副总裁、网络发展部总经理韩志刚离职,将赴新华三履职,出任新华三联席总裁,中国区常务副总裁,兼运营商事业部总经理。 <详情>
2018-03-22 16:35:19
云资讯 重磅:联通副总裁韩志刚离职,加盟新华三担任联席总裁
3月22日,中国联通副总裁、网络发展部总经理韩志刚已正式从联通离职。3月22日,中国联通副总裁、网络发展部总经理韩志刚已正式从联通离职。下一步,韩志刚将加盟新华三,出 <详情>
2018-03-22 15:47:00
国内资讯 习辉:如何构建现代化的金融云服务体系
金融市场双向开放带来哪些问题?双向开放之后整个云服务市场格局会有哪些新的变化?科技监管方面如何应用新技术?怎么用?怎么管?用到什么程度是充分发挥了技术对行业核心 <详情>
2018-03-22 11:35:00
云资讯 OSCAR尖峰开源技术和人物名单发布暨颁奖仪式
近两年,我国开源氛围日益浓厚,无论是企业自主开源,还是个人推动开源技术发展的明显提升。22日上午,OSCAR尖峰开源技术研发创新奖、自主开源技术创新奖、开源人物奖、开 <详情>