2018年3月21-22日,由中国信息通信研究院主办、中国通信标准化协会支持的"OSCAR云计算开源产业大会"在国家会议中心举行。

随着云计算技术的日益发展,并开始进入“深水区”,开源技术与云计算融合的程度进一步加深,并开始成为产业发展的重要支撑。"OSCAR云计算开源产业大会"将邀请行业内多位大咖与权重人物共同探讨、交流云计算开源技术、研发、治理、产业化方面的经验,探索开源与云计算的创新发展新路径。

 联通沃云云计算与大数据研发部总监刘中参加此次会议,并发表《基于开源技术构建沃云自愈服务能力》的主题演讲。

刘中


以下为演讲实录:

刘中:大家上午好!非常荣幸来到本次大会,我来自联通公司。我今天分享的题目是基于开源技术构建沃云自愈服务能力。

在展开探讨之前,有必要回顾一下联通沃云的发展。在“联通混改”国家政策驱动下,沃云进入新的发展时期,沃云是从2013年成立,发展到现在。在联通混改的政策下,出现一些新的思路调整。右边,在联通做自建云,提供的公有云、私有云、混合云,这个阶段我们提供出来的服务是以IaaS为主的,现在在我们合作的大背景下,我们要丰富我们的产品,不断丰富我们的业务,我们现在的发展思路是以云为核心,整合政企专线、应用类相关产品。在这之上,我们丰富新增了云网络,其中有代表性的,包括网络云化的云宽带、云互联、云专线、云祖网,从我们沃云开发角度看,给我们促进广阔云的发展提供了原理支撑。很典型的,比如我们用DCI技术,混合云两端私有网络互联我们通过DCI实现。另外,联通沃云的一个发展方向是部署行业云,更多行业应用要运营在沃云云主机之上,现在我们在开展医疗云和教育云,教育云里面我们主要推广的是教育云桌面系统。

下面介绍一下沃云体系之下沃云产品全体系视图,三方面来看,公有云、私有云、混合云。公有云已经不是新闻了,与阿里、腾讯都有合作,这是我们联通在思路上的转变,现在沃云的公有云上可以开通阿里、腾讯的一些产品,主要包括计算类、网络类、存储类、安全类和PaaS类。中间是私有云,这也是我本人这几年做的主要方向,我们联通私有云客户主要是政企客户,比如大型省级电子政务云,比如辽宁政务云、河北政务云、青海政务云,大型企业的私有云,比如高人民法院和铁塔公司,沃云给这些客户服务的时候积累了很多经验,表现出来的是私有云的应用业务系统负载比较重,这些是我们沃云在建设公有云时未曾面临的问题。现在随着时代的变化,比如说我们在私有云里面,沃云也会和其他云服务商合作。一个省级政务云往往现在是由几家云服务商共同来做,由一个云服务商单独承包省级政务云的时代过去了。私有云上,我们和阿里、腾讯、华三华为会有一些合作。混合云,我们引入多云管理平台,以联通多云管理平台为入口,实现混合云的方式。

联通沃云2018年的方向主要是云网一体化,包括集团级专线、省级专线和安全类。下面介绍沃云整体技术架构。我们从底层来看,沃云定义操作系统,基于openstack和KVM实现我们的底层能力,在这之上,沃云尝试很多技术提供存储能力,目前主要是超融合的方式,如果遇到条件比较苛刻,性能比较高的场景,会引入其他存储后端。在网络组件方面,开源openstack提供出来的原生方案有较多实验色彩,沃云在这方面做了优化。在这些底层能力之上,我们封装定义出沃云产品。云平台是复杂度很高的系统,它承载租户业务,和我们云平台本身的组件,这些我们需要给它进行一个呵护和监控,这里面我们做了分布式的健康检查。

下面是今年的主要思路,在云网一体背景下的沃云平台。这里沃云的建设思路,主要是我们在全国有7个大型沃云基地,在每个省份有一个局部的节点,围绕这些数据中心建设边缘节点。这个我们建设的是合作背景下沃云公有云合作平台能力,有一个集中云管理平台,包括自服务系统,运维系统,运维监控系统,云接入及调度枢纽,可以把我们的业务分散到全国不同的节点上,这样的话我们就实现了在32个省份布局的资源池,统一的运营,统一的调度管理,通过同步复制技术实现资源池间的互通互备。

这个是我题目里面比较核心的部分,我们在建设一个复杂的平台的时候,里面各组件服务的自愈实现,在春节的时候,Google云曾经发生过客户拓机,从故障分析来看,里面有个网络组件卡死,Google本身的自愈系统没有能力处理它,还是由人工完成kill进程重启服务。这个给我们的启示比较大,一个是我们在大型的系统里面,自愈组件的必要性和它的使用范畴。所以我们经过考量和实际使用之后,我们对云平台公共组件着重进行了自愈方面的加强,和openstack里面比较重要的组件。自愈和监控是密不可分的,我们对资源池里面的资源和云平台本身的组件进行了监控。

下面是我们怎么提高沃云资源池的能力,这是我们部署的大概架构,我们首选部署架构是超融合的,一个故障域的节点数量不会像分离架构那么多,我们按照存储池的故障域划分沃云故障域,我们有3-4个cell,cell下面再分故障域,每cell划分3个AZ,适合一般的私有云、公有云部署需求。下面一个是更深入一些的内容,开源openstack实践的优化,这个是我们neutron-dhcp-agent高可用,为每一个network设置两个dhcp-agent,两个dhcp-agent位于不同节点。另外一个优化,原生的openstack一般是三类节点部署,独立的网络节点实现L3网络功能,南北流量集中,易造成性能瓶颈。我们给它做了优化,我的沃云部署没有网络节点,我是把网络节点dhcp服务和其他自定义都放到计算节点上,左边服务我把它都分配到中间的计算节点上。这个是我们对L3 agent的改造,我们采用VRRP协议,我们在两个节点上产生实例,共同提供虚拟路由器服务。

这个是沃云在存储高可用的实践,实现cinder-volume是开源社区里比较困难的一个点,但去年也有方式来做,用分布式锁来实现,沃云的办法更直接一些,我们是在每一个AZ部署多个volume,定期做检测。如果我发现有一个故障volume的话,我们会把它迁移到系统存储后端上来进行管理。总结一下我们开源实现的高可靠系统架构的加强,首先是增加冗余的硬件或软件,采用灾难恢复的手段。另外,通常情况下,我们优先选择原生内在的技术,我们不会为了高可用引用其他外部的软件,基本上采用openstack内部的东西来实现。高可用具体有管理节点的高可用,前面提到的dhcp/L3高可用,volume高可用,沃云管理节点的高可用。我们所有openstack无状态都可以高可用,进行负载均衡,管理无状态服务的VIP. warm算是联通沃云对openstack的一个贡献,warm本身不在openstack里面的,但这个是沃云原创的warm,初衷是它关注的是我如何管理虚拟机承载的应用,虚拟机承载的应用如何合理暴露出来,应用如何介入到租户网络里面。我们基于warm服务集成组件,我们开发出了云缓存、云备份服务。这是warm基本架构,通过消息队列,访问真正做事情的agent服务,就是下面那一排服务,这个对应我们不同的服务类型。

很多业界搞openstack的朋友,都说联通沃云openstack什么时候升级,这个问题我是这么看的。我们的态度是,openstack只是一个服务于沃云的框架,我们对它的定制是深度的,沃云现在所做的定制,可能我们在经历到下一轮K版本的时候都没有。我的态度是这样的。

最后我想引用伟大诗人泰戈尔《飞鸟集》中的诗篇结束我的分享。“云谦逊地站在天之一隅,晨光给它戴上彩霞。云把河之水杯注满,自己却隐逸在远处的山中”。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-02-24 18:59:10
市场情报 新思科技发布《2023年开源安全和风险分析》报告
企业只有拥有了完整的清单,才能制定战略以应对Log4Shell 等新的安全漏洞带来的风险。 <详情>
2022-12-15 10:11:31
运营商 广东电信携手联通开通全国首个共建共享低频5G基站
该基站充分利用低频900M、800M等频段强穿透、远传输、成本低等特性,进一步完善覆盖广度和深度,为用户提供更优质的5G网络服务。 <详情>
2022-12-08 08:23:33
运营商 联通智网科技分拆上市,有望实现多元化发展
分拆上市能够给予股东更大的回报,但公司也将就此步入复杂凶险的资本市场,而公司管理层需要更强的运作能力。 <详情>
2021-07-14 16:58:00
国内资讯 2021 OSCAR 开源产业大会来了!八大亮点先睹为快
中国信息通信研究院将主办“2021 OSCAR 开源产业大会”,邀请百位开源领域技术专家共同探讨开源的未来。 <详情>