2021年4月29日,首届湾区数字经济产业发展论坛--暨“技术定义数字基础设施”第十六届中国IDC产业年度大典(深圳站)在深圳隆重召开。
本次会议由深圳市工业和信息化局指导,中国通信工业协会数据中心委员会、广东省数据中心产业联盟、深圳市数字经济产业促进会联合主办,中国IDC产业年度大典组委会、中国IDC圈承办。大会吸引了众多数字经济、数据中心产业的主管领导、专家学者,以及众多从业人士参加。同时,大会开通多个线上直播渠道,供无法到达现场的网友同步观看。
由华为数字能源总工程师张广河主持,平安银行科技运营中心负责人张晓强 、太平洋保险架构专家张文若 、万国数据高级副总裁陈亮 、易捷行云首席布道师袍叙凡共同就“技术定义数据中心”展开圆桌对话 。
(左起:华为数字能源总工程师张广河,平安银行科技运营中心负责人张晓强 、太平洋保险架构专家张文若 、易捷行云首席布道师袍叙凡、万国数据高级副总裁陈亮)
张广河:今天我们的《技术定义数据中心》圆桌请到了重量级的嘉宾,可以说是梦之队,组合非常有机,有数据中心的使用方,也有数据中心的服务商,从两个不同的角度帮大家把科技怎么赋能数据中心的话题讲一讲。
首先从这个行业来说,我感觉这个行业现在既欣欣向荣,又内忧外患。欣欣向荣是数据中心的投资在增长,金融行业也在大发展。内忧外患是我们要考虑自己的发展,另外受到外部的挑战,包括互联网金融,甚至全球的政治气候的打压,还有面临技术在锁死,但是市场在往前发展,我们该往哪里走,这是我们需要讨论的,从业务的需求到技术的支持角度来谈谈。首先从金融的用户这边来谈一下,作为用户,咱们的数据中心当前的现状是什么样的,什么时候要进行自建,什么时候要进行租赁,这背后的原始需求和驱动力是什么?
张晓强:我们是一家股份制银行,现在市值规模也已经蛮大了,四五千亿的规模,从监管层面来讲,任何一家这样的银行必须有两地三中心的数据中心布局,所以我们在深圳有两个主数据中心,在上海有一个灾备的数据中心。因为我们是一家集团性的公司,大家没有感受到我们平安银行在外面寻求数据中心的资源,因为我们所有的数据中心都是平安科技给我们提供的。我们的数据中心现在的规模大概有几千个,主数据中心1000多台机柜,加起来现在有两三千台机柜。这两三年增长的非常快。整个金融行业,从国家层面都已经提出了这样的口号,数字经济、数字化转型,平安在这方面走得比较靠前。如果大家翻一下新闻就知道,平安从2016年底就喊出了科技引领的战略转型。
从数据中心来讲,我们这几年资源需求是很大的,包括服务器的采购,以每年翻番的速度在往前进。这里面的原因是我们过去的所有应用架构都是靠大型的集中式的系统,转向分布式、开放式的系统,所以它的数量是指数和倍数增长的。
张文若:我来自太平洋保险,是负责技术架构的团队,我们在数据中心的角度来看就是一个需求方,从太保的规划布局来看,在我们每一期的规划里,数据中心的布局都是我们的重中之重,是一个基础。我们现在已经完成了两地三中心的布局,这是主要的数据中心。也有一些特殊的业务会租用部分的数据中心。
这么多年来随着数据中心的建设,每代数据中心都是在更新换代、迭代升级,比如说我们建的三个数据中心里面有两个采用了水冷的技术,一个采用了蓄冷的技术,我们现在打算继续扩建的数据中心模块还在寻求更新、更节能、更符合碳中和这样要求的技术。今天来到这里也是想学习到一些新的技术。
刚才讲到我们有个别场景会租用数据中心,基本上就是我们的资管业务,他们是希望能够获得离交易所更近的场地,或者是更近的网络,他们会租用交易所的数据中心,数据上的共享或者业务上的沟通会更加迅速。
张广河:两位金融的用户都讲了自己的情况,都建成了两地三中心,进行了数字化转型,这里面大家会发现一个问题,金融行业的数据中心正在由成本中心变成价值中心,它是产生价值的最核心的发动机,这只是我们两家用户。从服务提供商的角度,你们遇到了哪些需求,你们是怎么满足的?
陈亮:万国数据是一家第三方数据中心服务商,我们之前是做金融灾备出身的,所以特别了解金融行业的需求,开始提供数据中心的服务。行业里面可能都会认为金融行业都是自建数据中心为主,我们今天有32%,共200多家金融机构入驻在万国数据,在面积上占到了万国数据的9.2%,这是一个相当大的规模。现在万国数据有51个在运营的数据中心,同时还有16个在建,今天已经有45万平米左右的数据中心的面积。在这里面9.2%是来自于金融。刚刚张总也提到,我们会有很多的资管业务采用租用的方式,万国数据的客户里面也有很多金融的交易机构,从万国过去的历史和我们服务的能力、服务的经验,这是我们走到今天的原因,同时我们也看到有那么多家金融机构是采用第三方租用服务的。
我们也看到金融客户作为第三方数据中心,我们叫金融客户,可能我们看到的已经是第二层的需求了,第一层的需求是在企业内部的科技部。对第二层的需求,我们看到的是金融行业的扩展性是非常大的,而且经常是会需要在数据中心集群内扩展,比如说我们有外高桥的数据中心集群,有些客户已经入驻在外高桥了,他希望在2公里以内扩展,不希望在更远的地方扩展。另外是他的金融发展非常快,可是不确定性也很强,前期想预留一些资源,但是后期的调整也比较大,这是第二个需求。
第三个需求就是金融行业对合规性的要求非常高,我们有200多家金融机构,平均一家金融机构一年要提供三次审计服务,各种各样的审计,这给我们的服务能力、建设、设计运营都提出了挑战和要求,在这样的挑战和要求下,也对我们的前期做数据中心建设和选址的时候,也倒逼提出了一些更高的要求。
袍叙凡:非常高兴参加这个论坛,我们公司是很年轻的,2014年2月份才成立,但是在2019年年底我们获得了中国电子D轮的战略投资,我们是卖私有云的,跟公有云的公司有些区别。2018年到2020年连续三年获得IDC在中国的私有云软件的第一品牌。如果说到金融云,在2019年中国电子给我们战投之后,我们2020年的营收就是帮地市级建政务云数据中心,这个业务量增长了两倍,金融的占比一直比较稳定,金融在我们公司目前的业务比重超过20%,银行数量多一些,超过50家,券商有30家,保险相对少一点。如果说典型的客户,在金融里面,数据中心私有云的建设现在是非常热的。从科技金融每年的投入来看,2020年投入了1980亿,其中私有云的建设比例大概50%,区块链加上流程的优化大概20%左右,这是去年金融科技投入的数据。
从客户来看,从大型的国有银行到大型的农信社、城商行,比如说邮储,我们在2016年还是一个非常普通的产品,邮储跟我们签订了一个合同,我们为他们服务,到去年年底我们在邮储部署了3000以上个节点。今年一季度我们针对邮储的廊坊数据中心做扩容,一次扩容384个节点,去年我们第二季度在邮储的合肥数据中心一次部署500多以上的节点,这是邮储,比较大。
江苏农信2017年开始搞生产云,以及为它的下级的地级社提供金融云服务,到2020年差不多就是300个物理节点,去年到了11月份跟我们又签了连续三年的框架合作协议。
从这几个案例来看,就在我们公司目前的范围内,金融企业对私有云的需求还是蛮大的,至于头部的券商就很多了,我们做了30家,双A级的券商就有3家,双A级的券商在国内只有10个,包括国泰、海通从2016年就跟我们建立了合作。今年发力信创,东方证券、东吴证券都在做纯国产化产品的试点,我们也在这方面有合作。
张广河:我听到几个细节,第一是有20%几的私有云变成一个普遍性的需求,后面又讲了很多案例,应用很广,我想问一下,到底私有云在金融领域是一种趋势吗?
张晓强:它肯定不是趋势,它已经是现实了。我个人接触云的概念是在十几年前,当时我还在硅谷的外企工作,现在平安银行跑在私有云上的虚拟机是10万台,它的物理节点应该在五六千台的规模,平均每一台是十几台到20台左右的部署,基本上大家默认的私有云应该在PC服务器上,但是传统的金融行业还会有一些非开放式的系统,所以我说的是放在开放式的X86服务器上的数量。我们的私有云其实就是这两年建起来的。我们的私有云还是来自我们集团的平安科技,大家也看到平安科技在过去几年推广它的云技术,其实我们是作为非常重要的用户,根本点就是我们本身就需要私有云来帮助我们快速地实现银行的转型。私有云和虚拟化有什么区别?我来讲一下我的理解,其实私有云就是在虚拟化的基础上更高级的抽象和封装,增加了一些对于业务发展非常重要的功能,像租户、服务自助等等,不要看这些小小的抽象,它居然可以为现有的运营带来很大的价值,我们甚至可以在它抽象的基础上,再结合我们实际的部署和流程进行深度的整合,实现全自动化的资源交付。我们现在一天交付几千台机器是很轻松的事情。
张文若:我也非常同意平安银行张总的意见,私有云已经成为金融企业的必备组件。我们是从2015年开始建设私有云,经过两代技术升级,到今年年底我们所有的应用都会在私有云上,为什么还有一部分没有呢?就是为了配合我们新数据中心的建设是在逐渐迁移的过程中,因为要配合新数据中心的投产,来应用迁移的时候逐渐把它迁到云上来。在开发测试环境和分支机构方面,我们在2017年就全面实现了私有云的支持,我也非常同意云是对虚拟化的升级的观点,对太平洋保险来说,在2009年我们就已经实现了应用服务器的全部虚拟化,2012年开始我们就把跑在小型机上的应用逐渐退出,今年我们最后一台小型机就已经下线了,我们最近三年不再新购任何一台小型机。虚拟化是一个基础,还有两个关键的基础,一个是标准化,还有一个是自动化,这三个组件就为我们构建私有云奠定了基础。刚才张总也提到,云是高阶的运维模式,上云之后对用户来说最重要的转变,不是技术的转变,应该是一个云运维观念的转变,就是租户的管理、运营的管理,才能把云的技术优势发挥出来。对于我们来说,历经这么几年的建设之后也有好几片私有云,所以我们下一个阶段的关键内容就是考虑混合云的建设,就是怎么把多云的资源能够更好地整合起来,发挥更大的优势。
张广河:金融科技这些年的发展非常快,几年前一个海外的金融协会到国内开会,讨论的是互联网互联网对传统互联网的挑战。从今天的对话来看,我觉得发展的速度已经超出我们的认知,因为我的认知还停留在几年前。刚才说到内忧外患,内忧方面,互联网的挑战肯定还在,我也跟很多金融的客户沟通过,如何保障业务稳定,又要兼顾弹性?对互联网金融来说,你的特有的竞争力是什么?这方面有没有考虑?还有一个外患,在自主可控这一块我们是怎么考虑的?
张晓强:如何实现既运行稳定又具有非常好的弹性,这是运维大的挑战之一。过去我们知道传统的金融和它的解决方案只解决了一个问题,就是运行稳定,它谈不上弹性或者是伸缩。本质上是什么呢?它把软硬件全部给你绑定,它的软件只能运行在它的硬件平台上,它的硬件有它专门的版权,数据库、Java的中间件等等都是非常昂贵的。有些硬件也是如此,使用了一些非常高端的存储,所以它只解决了一个问题。
怎么解决第二个问题?因为解决第一个问题的本质你就解决不了第二个问题,所以解决这两个问题,就是把第一个问题的解决方案彻底抛开,必须走这样的路。具体一点来讲,金融行业今天正在大规模的对软件进行重构。因为核心是软件,硬件只是软件的一个支撑。过去是把软硬件死死的绑定,硬件是软件的必备条件。但是一旦我们在应用架构上,在应用软件的研发上走向一条开放式的道路,硬件其实就没有关系,所以无论你是什么厂商,只要你有算力就可以。
今天,包括平安银行喊出的转型,其实就是加大对软件研发的投入。大家可以查到数据,我们现在软件研发人员8000,从2017年的1000不到增加到现在的8000,也就是说我们大量的核心系统是我们自己研发的,只要是新的需求必须是自己研发,才能实现自主可控。
我们自主研发的系统有非常严格的标准,过去有一套非常完整的体系保证软件的质量,这套方法论非常好用,过去大家做软件只是说我怎么封闭,我尽量不要让别人知道我的逻辑,今天你可以用这套体系同样研发另外一种模式的软件,就是它够开放。我讲的开放是它都是使用标准的,不是使用任何一家所谓厂商定义的,它使用互联网的更开放的标准的协议去构建。
过去如果是买传统的解决方案,它不会替你修改,你只有自己去研发,你才能把那些你必须强绑定的逻辑去掉。比如说你用一个甲骨文的存储,你只能用它,没有任何的选项。所以解决方案是什么?不要使用存储过程,它需要一个一个把这些东西解开,解开后的软件可以使用任何标准的,只要是具有基本能力的数据库,它就可以运行了。这就解决了我们的弹性问题。因为这样的架构,它可以使用大量的不需要很昂贵的设备来跑,今天互联网企业都是这样来运行的。
怎么保证它的高度可用?解决方案是说,因为具有这样的弹性和能够快速部署,我只要在多个数据中心部署这样的系统,而且可以让这些系统同时运行,我们所谓的双活、多活的模式,你可以一次性做到数据中心级的容灾。过去我们金融机构担心的是设备故障怎么办,如果你的应用架构可以做到数据中心级的容灾,整个数据中心都挂了也没有关系,因为我正在运行的那套系统在另外一边,所以不会有任何影响。这就是解决这个问题的路径,当然没有那么简单。
简单补充两句,既要兼顾安全稳定,又要满足业务的灵活高弹性,在这一点上我们的规划就明确了一个道路,就是大平台小应用。我们会把原来按竖井式建设的业务系统逐渐演化成分层的平台化的建设,从基础设施的提供上来讲,云基础设施来提供一个稳定的运行环境,数据中台、应用中台来为业务提供一些共性的组件。前面的应用就可以更好地满足业务的需求,它就变成了一个轻应用。在私有云方面,我们来平衡稳定和弹性,也要把它分层来解决,越底层的,我们采用更稳定、更高可用的解决方案,越上层的,我们提供越灵活、越能够秒级弹性的技术解决方案。比如说我们在IaaS层,提供的是资源池化的模式,私有云一般都会这么做,在PaaS层我们提供主要的弹性的能力。这就需要我们上面的应用要进行微服务化的改造,分布式的改造,我们在这个过程中就实现了应用的转型。在这个转型的过程中,我们也要不断地改变原来多外包的模式,逐渐地提高自主研发的比例,目前我们的开发人员还没有平安银行这么多,但是也在急速的增长中,对每个业务系统我们都提出了一个自主可控的指标。要求到每一个年度要达到一定的外包和内部人力的比例。
陈亮:万国作为第三方数据中心最底层的服务商,提到刚刚说的运行稳定和弹性,我们是深有感触。因为对我们底层的数据中心的提供商来讲,对运行稳定的要求非常高。在以前如果说我们只拥有几个数据中心,它要保证运行稳定性的容易度相对略高,今天万国数据已经有51个在运行的数据中心,对我们来讲任何一个数据中心都不能出现灾难。虽然签的合同可能说99.99%,但是对我们来讲要求就是百分之百,一个也不能出故障。因为我们是在底层的,您刚才谈到的能力可能都用不上,但我们必须保证它百分之百稳定,所以这对我们的要求是非常高的。
同时也要求弹性,因为在我们对自己的需求里面,弹性也在一个非常高的高度,因为业务是不确定性,如果说一个数据中心建完,它就是只针对金融服务,相对来讲对我们的可实现度、难度都会比较低。但是往往客户需求是变化的,在数据中心规划的时候,可能说这是一个金融的数据中心,可是还没有建到一半,互联网又来了,还没做到一半,有些又要调整了,有些金融的数据中心又要去到互联网的场地。所以在万国今天的数据中心做设计规划的时候,面临的一个巨大的挑战就是弹性,怎么让这么硬的数据中心具备弹性的能力,这对我们来讲也是一个很大的挑战。但同时我们还有另外一个挑战,就是我们成本的压力也非常大。因为数据中心是一个重资产的行业,随着新基建的到来,千军万马都在进军数据中心行业,成本压力也非常大。
面对运行稳定、弹性、成本这三大压力,我们也不停地在寻找解决方案,刚才听到金融行业在应用级已经开始在做数据中心级的容灾,这是我们可以互相借力,或者说互相做超融合的。所谓超融合就是把最底层的基础设施一起来做超融合,共同实现资源的调配。当你的资源不仅仅是在你的服务器认为是你的资源的时候,你可以把底层的空间、电力也变成你的资源的时候,可能大家会得到双赢,大家会得到更高的弹性。
今天万国数据有近70个数据中心,我们也在试图建立平台化能力,我们也有区域级的平台化,也有集群集的平台化。作为数据中心底层的供应商,跟客户的应用可能是可以建立大家的纵向的超融合,共同实现更好的可靠性和更好的弹性,这个弹性可能会扩大边界之后,有更大的弹性。这是我们期待在未来这个纵向的合作能够产生火花,为这个这个行业做出更大的贡献。
袍叙凡:我谈一下关于自主可控的问题。从全国的金融企业来看,大型的金融企业有12家,有自己的金融科技公司。举个例子,平安科技就算是一家金融科技公司,还有兴业数金科技公司、招商金科金融科技公司等等。大型的金融企业都有自己庞大的团队开发自己所需要的信息化系统,包括业务系统,同时也把自己的能力配套进行输出,比如说平安银行有壹帐通,这就是很明确的金融能力输出的二级企业。
另外一个情况就是反过来的,除了前面说的12家公司,其它的金融企业怎么办?它可能也没有那个人力和物力创建自己的金融科技公司,刚才晓强总谈到有8000个研发人员,这不是每个企业都能做到的,这就需要更多的企业选择产品化的方案。
给大家汇报一些信息,2019年5月16日华为被美国制裁,所以中国电子下面的长城飞腾也感受到了深深的危机,所以才有了2020年30家金融企业开始做数据中心的信创试点,今年198家金融单位要做信创试点,这个信创试点指的是从国产的芯片到服务器、操作系统,到上层的云,到上面的中间件应用,全部要纯国产化,这该怎么做呢?从我们目前的实践情况来看,应用系统,办公类的,官网门户的,行情分发的,投资估值的、风控系统、OA、国产的安全软件,这些是我们在参与信创建设里面参与的较多的,这是从外围非核心系统进行适配,同时基础的架构软件开始快速跟国产的芯片级别的服务器、存储进行适配。举个例子,我们刚对长城飞腾新发布的S2500(这是长城发布的双路服务器,纯ARM的,而且是自主知识产权的),在邮储对S2500芯片进行了适配。国泰君安适配了华为鲲鹏、海光等等,进行一个融合的架构。中国人寿只适配了海光的,它是基于X86的,不需要做任何的改动,基于ARM有一定的难度。这是我们所看到的关于自主可控目前的情况。文思海辉已经被中国软件全资收购了,它有自己的分布式的核心,目前正在跟我们适配银行的分布式系统,而且要急于纯国产,所以看到整个产业都在极力地往前做准备,这是关于自主可控方面的。
张广河:今天这个圆桌话题特别好,这是对我们的产业发展有非常大帮助的,谢谢几位给我们给出的很好的建议。我们这个产业未来的应用场景也在不断变化,技术不断地前进,外部的挑战也不停地在来,最后请大家做一点展望。
张文若:其实现在随着业务的发展,市场竞争的加剧,现在业务对IT的需求变得越来越强、越来越紧密,IT已经从原来的支撑地位变成了融合和引领的地位,这些新的技术,大数据、人工智能、物联网、边缘计算,都促成各种业务场景和业务形态、业务新产品的诞生,同时也对我们的私有云、数据中心的运行提出了新的要求,我觉得无论是私有云还是公有云,它的发展空间大有可为,未来几年内都会有很多的新技术提出,我们也一直希望能够跟随市场的技术进步,不断地选取适合我们的产品。
张晓强:今天这个论坛主要是讨论数据中心,我站在数据中心用户的角度来谈一谈,我们平常都在用数据中心,我觉得有几个痛点或者说展望。第一是因为监管的要求,金融行业对数据中心的巡检,它必须是一个强制的东西,所谓强制是说,必须每隔一天大概几个小时,要有人去数据中心看一下,这是金融行业的特点。无人化的底层基础设施,还需要人巡检吗?我不认为今天人巡检有什么价值,但是规定还在那里,我需要产业界给出真正靠谱的方案,去说服监管部门。因为今天人巡检是没有任何价值的,我们通过更智能化的设备完全做得比人好,质量也比人工做的高,而且它不是几个小时巡检一次,它是近乎实时的,它是以分钟和秒级为单位的巡检,难道比人隔几个小时的巡检还差吗?我们数据中心运维有十几个人,这是极大的浪费。
第二,结合现在的AI或者是机器人技术,我刚才讲的巡检可能那些还不需要有操作类的东西,还有操作类的东西,比如说服务器坏了一块硬盘,那个地方电源掉了,这些有没有自动化的解决方案?如果有一个硬盘我监测到了,给它一个定位信息,机器人能不能跑过去把那个硬盘拔出来?我有指挥中心,直接给它下指令就好了,那台机器我可以把服务和流量都调走,机器人就可以过去把硬盘换了。在座的都是研究数据中心的,能不能再做得高大上一点?这才是我们最需要的。
陈亮:我们想法一致。因为在数据中心,至少从万国数据的体会来讲,当我们5年前一年只建一两个数据中心,现在我们同时有16个数据中心在建。我们对行业里说的标准化、智能化和自动化的渴望和探寻,驱动力是非常大的——你可以想象16个项目同时在建,如果很多地方出问题的状态。我们完全是自驱的,业务驱动必须走向标准化、自动化和智能化。在一两个月前的一个论坛上,万国数据的梁总提出数据中心的无人驾驶,在这里面我们大的痛点是行业上下是比较割裂的,我们期待上下知识的打通,还有一些业务驱动上的打通。刚刚谈到无人巡检,我们在数据中心底层都有技术,都已经实现了,但是在流程上又不被允许,或者说在知识上不知道,所以我们期待着在上下的贯通、融合,从知识上、业务上形成一个倒逼,这是我们的第一个期待。
第二个期待是智能化,数据中心虽然是承载着所有的IT,可是在今天互联网改变世界的旅程上,数据中心还相对比较落后,现在餐厅里都已经实现自助点餐了,在数据中心从底层到应用全系列贯通,整个的智能化,包括互联网介入、软件定义硬件上面,整个行业和互联网行业比还有很大的一段空间要走。万国数据是业务倒逼不得不做,我们也期待更多的供应商、客户,跟我们一起把数据中心能够走向真正的智能化,在这条路上大家共同往前迈一步。
袍叙凡:数据中心这几十年发展,从70年代美国开始建,80年代中国开始建,到了2008年开始第一代的私有云数据中心,2015年开始第二代,现在已经开始第三代了。总体来看就是这样一个目标,就是软件吞噬硬件,软件定义硬件。干了这件事的好处是什么?屏蔽了硬件的复杂度,上层的应用建设就会相对容易,不然上面的应用软件总是要去适配底层的硬件,这对程序的实现不友好的,所以我们希望能够用软件定义硬件的方式,这样让整体的运维、软件的设计都会更加的方便。刚才我们讲到,大部分的金融企业都是采用产品化的方式来建,它不可能有自己的科技公司来帮助他们建设,所以软件定义硬件,这个软件也会变得无比的复杂,不是说什么事情都用软件来搞定,有时候硬件反而更简单、更纯粹,所以这是双刃剑。
如果我们要发展一个云,今天已经发展到无比复杂的程度,只能用两种形式来迎接这个云发展这么复杂的挑战,第一个是普通企业就只能托管,什么叫托管?用公有云就是托管,让别人帮你做运维。第二种形式是自己建,不仅可以节约费用,还可以培养一些科技人才。要自己建数据中心也会有很多的麻烦,因为即便你建了一个云,它也是有版本的,以后那个版本升级了,旧的版本怎么办。
软件定义数据中心这条路对于私有云来讲要解决碎片化、版本化的问题,将来的软件定义数据中心,私有云的建设将会变得像公有云一样,没有人去关心它的版本,也就是市面上的商业公司所卖的软件不应该强调这个软件是哪个版本的,这样大家就真的自由了。
张广河:未来软件会大发展,软件定义硬件,让业务自由地发展。本场圆桌讨论就此结束,谢谢大家。