国内云计算和数据中心领域具规模和影响力的标志性盛会,第十二届中国IDC产业年度大典将于12.21-22日在国家会议中心举行。在昨天的主会场上,多位领导及嘉宾对目前数据中心整体市场进行了分析与点评,在今日的数据中心技术创新分论坛上,多位嘉宾将会对数据中心的技术创新进行分析与解读,让我们共同迎接今天的数据中心技术创新分论坛。
中国IDC产业年度大典作为国内云计算和数据中心领域规模大、具影响力的标志性盛会,中国工商银行股份有限公司数据中心(上海)副总经理:李六旬出席此次会议,并发表《推进IT机房基础设施建设创新,助力信息化银行发展》主题演讲。
中国工商银行股份有限公司数据中心(上海)副总经理:李六旬
以下为演讲实录:
我从三方面做一个汇报。 第一方面工行的基础设施为什么要转型。第二方面目前做的成效,就是我的一体化机柜的试行情况。第三方面汇报一下工商银行未来数据中心和整体基础建设的思路。
第一,大家知道工商银行9991工程,在座大家比较清楚,我们从1999年9月1日开始在引领数据大集中的工程,数据大集中是两个路径,通过9991工程的实施,我们经过小二十年的建设和创新的发展,目前已经实现了两地三中心的整体系统架构,两地是上海、北京,我们的异地灾备,同城上海,两个中心是五十五公里。我们异地灾备RPO是两分钟,实际上这是我们最初的设计目标,实际上现在基本上是十秒,我们的RTO小于两小时。我们的同城悲愤是2014年实施的,现在已经经过运行考验了及我们的RPO小于五秒,我们的系统恢复时间RTO是小于两分钟,我们每年进行多次的切换演练。在系统运行的过程里,我们决策要切换的话,两分钟左右做一个实时的切换。
但是我们集中式处理的系统,我们很有自信。我们在集中式处理方面力争要做到极致,实际上我们在主机方面还在逐步地研究、发展,我们在推进一个叫北极星的计划,就是要在未来实现主机方面的三活、多活,向这方面去努力。
我们目前整体的进展还是比较顺利的,我们的同城悲愤中心,RPO小于五秒,就是有五秒的数据丢失,这还是不太完美,我们怎么办呢?我们工商银行经过这一年多的创新与实践,实现RPO等于0,基本上实现数据上的同步,我们已经做了一个验证测试,计划在今年年底明年初要实现这样0丢失的目标。同时我们系统的恢复时间是两分钟,我们要缩短到三十秒,也就是说我们来回的切换,基本上对业务没有造成影响。
实际上工商银行不只在集中式处理方面要做到极致,面对互联网金融一些新技术的发展机遇和挑战,我们也在加紧二期架构的转型,我们主机的非核心的业务也在下平台,我们的分布式处理架构,我们的云计算,我们现在用的是(英文),已经推了好几年了,我们从2014年联合创建到现在,这个效果目前看还是很好的,包括大数据方面都比较好。我们全行也在推进智慧化银行的建设,我们现在推进e-ICBC3.0的工程,这些工程背后面临很多的压力挑战,就是对基础设施方面提出了很高的要求,因此也需要进行基础设施的转型发展。
这是一个层面,我们既有集中式又有分布式,分布式是双轮驱动的态势。我们的目标也是要实现几个目标:安全可靠、高容量、易扩展、敏捷研发、控制成本,主要是开放。
工行的业务量在银行系统是比较大的。2017年我们的日军业务量是4.2亿笔,业务缝制4.843亿笔,这个数据我们预计在今年春节前后要突破5亿,高的交易率每苗达到净1.4万笔,这些数据背后的反映我们的设备量确实在快速的增加,我们的业务量每年都是在20、30的负荷增长。我们的设备前几年也是这样的增长趋势,但是在这一年有加速增长的趋势,在目前数据中心维护里,我们的供电、制冷在局部到整体都面临着挑战,所以我们要在支撑业务方面去加快转型,有些新的技术要应用。
另外我们也可以看一下,从渠道看我们的业务量,我们的供应链是7.16%,离柜业务达到10%以上,实际上在十年前,包括五年前我们的主要业务还在柜台,所以这个转变也说明我们工商银行的整体架构里面的基础设施涉及到网点和二级行的基础设施方面,也要面临着调整。
我们看一下工行的机房建设。我跟阿里的沈烨烨说过,你们阿里有多少数据中心,他说有30多家,工行可不止30多家,工行一级分行有35家分行,每个分行一个同城机房,我们二级分行有280多个,并且都有一个比较可观的机房,而且我们的网点也算是一个小数据中心,我们有18000,这个量是我们的实力。
我觉得未来互联网的发展是我们的资源,是我们的财富,这方面我们一定要利用好。怎么利用?实际上现在在我们的一级分行、二级分行到网点的基础设施都比较传统,可以说比较落后,因为都是二十多年前建设的,那时候很传统,没有好的技术,不像这几年技术发展这么,但是现在我们迎来了机遇。我们有了比较好的技术,我们的建设周期也到了更新换代的时候,这是一个比较好的时机,所以我们要加紧工商银行这么庞大的资源体系的基础设施的转型,为适应我们未来的发展做更好的支撑。
这是一个整体的情况。我们看了一下新技术,我个人来说这几年的一些技术发展,确实是突飞猛进,所以在这儿我还是要代表工行感谢在座的一些公司、企业,在这几年创新发展方面取得的成效,祝贺你们。
第二方面汇报一个案例,实际上就是我们工行在转型过程当中一个小项目,就是我们模块化机房与一体化机柜建设情况。
工商银行的管理规范很严格,我们在机房的标准化建设这一块,实际上我们2014年之前整体的管理是从制度、流程规范去控制,通过应急演练,确保生产落地的稳定运行,但是2014年以后我们在加快我们的转型,我们有新技术,我们好多数据中心到了更新换代的时候,所以我们要转型。从2014年开始,我们总行科技部,几大中心一块在做这样的工作。2014年建立一些标准规范,分行的建设要有一套规范,不然下面想怎么做怎么做,这是不行的。
2015年我们通过调研设立了一个未来基础设施建设的基础架构。2016年我们制定了一个标准方案,我们通过招标采购确定入围的厂商。2017年开始试点,启动了整个基础设施转型的步伐。
我们看看模块化机房及一体化机柜的建设方案,模块化很方便,我们这样一个机架什么都有,供电、电池、空调以及各种各样的设备、综合布线、接入方方面面都纳入到这里面管理。看一下效果图,很整洁,也很漂亮,维护起来也很便利。
我们工行接入比较多,所以我们一定要做到规范化,让下面这么多机柜按照一个成本可控的标准去实施。所以我们在制定这样一个规范的时候,我们针对模块机房有四种配置方案。下面的二级分行规模不一样,不能浪费,也不能不考虑发展,所以我们按照标准去配置。我们的五种方案就是按照负载去配置。
我看一下案子。这是我们湖南的衡阳分行,是个二级分行,地市行。这个机房使用了二十年,机房面积比较大,十年前我们二级分行特别关键,所以我们的服务器还是比较多的,负载情况特别小4.8KW,我们的PUE能耗也是比较高的。这是改造以后的效果图,我们机房面积用了86平米,这86平米还考虑到未来发展和扩展的空间,所以这个面积大大地减少,从负载情况没有变,通过冷通道封闭、行级制冷,我们的能耗大大地降低。
我们二级分行的改造已经做完了三个,我们通过改造和整体的数据分析,我们大概可以看一看,机房面积起码节省了30%-70%,机房面积节省出来可以做很多的作用。建设周期起码缩短一半,将来成本降低30%,机房的能耗下降20%,我们整体的运维水平大大提升。
再看异地化灾备,我们现在做了四家,后续这块的量也很大,这是一个对比情况。房间面积不是特别大,这里面都是分散的,分布,从占地面积到可维护性还是比较差的。改造以后就是一个小机柜,我们可以有机房,也可以没机房,我们可以摆到大厅,只要满足条件就可以运转,特别便利,也特别灵活。
这个能耗、面积、效率都非常的可观。实际上我们可以算一下账,我们工商银行这么庞大的机房资源,我们不说数据中心整体情况,我们就说一级分行,一级分行35家,包括还有海外有很多数据中心。35家分行的面积大概达到2万多平米,使用面积不是建筑面积。二级行要达到4万多平米,网点1万多个,1个网点10平米,那我的面积确实很乐观,这是我们比互联网公司有优势的地方,我们有这么多的资源,通过改造以后,我们的成本控制到运维水平的提升是可想而知的。
第三方面说一下后续的发展思路。我们的目标是要打造全行基础设施的机房群,我们有资源优势,我们通过数年的创新与转型,把工商银行各类机房建设成为物理上分离、逻辑上一体的智能化、综合华数据中心机房群,实现数据中心、一、二级分行基础设施资源的统一管理和弹性调度。充分发挥工商银行不同基层机房的特点与作用,避免重复投资,更好地利用硬件、软件、网络资源,更好地支撑数字化时代工商银行各项业务的长远发展。
物联网以后是不是只有几个数据中心就可以了?现在数据量这么大,也许在未来,在不久的将来,我们一、二级分行的机房就有用武之地,我们的网点会有用武之地,这是我们比较丰富的资源。这是我们的目标。
那么目标还是要靠我们一步一步地去落地,去实施。所以我们现在在推二级分行的优化转型,前面我们也看到了渠道,柜面业务在萎缩,机房大量的浪费,怎么做呢?好的办法就是把地市行的机房撤掉,网点有两条线路,我们直连省行,我们现在整个应用是支持的,没有问题,但是这里面考虑到通信费用,李总你们移动费用太高,所以我们还是不能这么全,一刀切,怎么办呢?有些小的成本核算的就撤掉,基础设施比较差的就撤掉,我们要做一个网络节点,做一个转型。
现在我们有好的办法,就是通过网络节点,一条线直接到网络节点,一条线直接到省行,我们的机房瘫掉以后我们通过4G线路直接通到省行,业务不受影响,5G以后这个落实更可靠。我们现在在转型,通过转型把我们整体二级行的机房的级别降低,运维成本方方面面进行节省。
第二是标准化建设全面落地。二级分行现在在稳步地推进,一级分行下一步也要按这个思路去做,包括后续的实施方案的制定,一有机会就要抓紧转型。最终实现大的目标。
再看我们基础设施监控系统,这是我们明年要做的,我们这两年也在做,我们刚刚采购完,全行的基础设施监控系统做起来及UPS全部监控,但是我们在通调制度还是比较分散,利用前面的转型契机,结合目前新的技术,我们明年重点把这块做好,未来传统的、非传统的,要通过这个系统最终达到未来无人职守,智能化管理运维站的目标。
再汇报一下我们对技术跟踪应用的情况,我们工商银行成立了七大创新实验室,有五大创新实验在软件开发中心,其中有两大创新实验室在数据中心。其中有一个实验室是机房设备及基础设施的创新实验室,我们现在整个创新实验室人员计划在明年要达到四百左右,我们现在感觉到,有一些新的技术发展,对整体业务支撑、转型的时机是至关重要所以工行非常重视,我们会在这方面深切地跟踪,引进一些新技术,降低我们的运维成本。
新技术应用方面,我们也在高压直流调研,我们现在也已经在试点了,就在北京的数据中心推进。我们的采购、方案都已经结束,现在要落实实施,预计在明年。我们不是全高压直流,我们是部分先试点,后续陆续地去演进。还有一个是光伏发电,这是新能源,我们也在用,我们也计划起用,我们做一些可行性研究,工商银行的北京数据中心是2002年投入的,当年是亚洲大的数据中心,现在老了,我们的外电也是不足,面临的挑战也很大,所以我们要采用一些新的技术,把外电这块也要解决。还有定制服务器,我们现在创新实验室也在加紧地研究,我们要在未来定制服务器,来降低能耗,提高效率。
最后也是个呼吁,也是对国内的一些企业在环境、动力、设备、机房、基础设施方面希望有更大的创新。我们希望通过你们的努力能创造出更可靠、更智能、更高效、更便携的产品。我们环境动力这方面,技术发展很快,但是确实有些方面还是比较慢的,我们现在机房类的设备占地面积太大,空调室内机、室外机,庞然大物,浪费我们的资源,这块能不能再做大的提升,或者同样的面积能不能提升供销,二倍、三倍行不行?这方面我们还是寄予厚望。我们的架构冗余与效率的矛盾,数据中心是绝对不能出问题的基础设施,我们现在从外电,从UPS,我们的冗余度一层加一层,确实下来以后还是比较浪费,这方面能不能做些突破,我们的用电效率能不能做进一步的提升,包括智能化数据中心的管理方面,我觉得提升空间挺大的,就是传统数据中心改造这块,实际上风险都比较大,大家还比较担心。我们现在考虑的特别是一级分行,我们的机房还是比较关键,在后续的一些改造过程中有密谋一些新的,能够控制住风险的管理措施的技术,能够让我们安心地去做这件事,这也是需要大家共同去考虑,去推动的事。
由于时间关系,就汇报这些,谢谢大家!