20191218-19日,第十四届中国IDC产业年度大典在北京国家会议中心正式召开。作为数据中心云计算产业内知名的盛会以及IDC企业、电信运营­­商、互联网、金融、政府和厂商等产业上下游的高效沟通平台,与会嘉宾包括政府领导,行业专家和企业代表数千人。 以“智能运维与安全”为主题的分论坛于19日下午举行,中国建设银行运维数据中心业务经理侯岳出席本次会议,并发表了《企业级IT架构视图可视化与运维领域应用》主题演讲。

WX20191219-165630

中国建设银行运维数据中心业务经理侯岳

侯岳:大家好我是来自中国建设银行运营数据中心的侯岳,今天给大家分享的主题是“企业级IT架构视图可视化及运维领域的应用”,这个课题是我们今年重点研究的课题,而且我们在这方面取得了突破性的进展,在这里给大家做一个详细的介绍,我的介绍分三个部分:   

首先介绍整个架构视图的研究背景和意义。中国建设银行是一家中国领先的大型股份制商业银行,对于我们这样大型的业务比较复杂的企业来说,企业级的IT架构管控起到非常重要的作用,它能够有效的引领信息系统的建设和管理,同时能够支撑业务的不断发展和变化。早在2017年建行就通过企业级IT架构管理的方法成功完成了新一代核心系统的建设。我们行在整个企业级IT架构管控过程当中也形成了一套企业级的IT架构资产,它是建行的核心资产和技术优势,是建行保持科技领先的重要特质。在传统的架构管控过程当中,其实是存在很多问题的,主要表现在三个能力和一个应用上的问题。1、缺少架构的在线数字化能力,传统的架构视图一般是用线下的文档进行管理的,缺少标准化以及数字化的能力;2、缺少架构的闭环管控能力,设计实施一般是两波人,架构设计完之后很容易出现落地困难或者落地出现偏差的问题,容易产生架构失控风险。3、展示交互能力不足,现在的架构资产很难从业务视角、场景视角、交易视角进行多维度的展示。正是以上3个能力的不足导致现在架构视图在各个领域的应用存在非常大的不足。    

正是基于以上问题,我们开展了架构视图的建设,架构视图是利用可视化的技术展示IT架构资产以及运行态数据的全景视图,通过架构视图串联从业务规划、开发设计、测试投产、生产运维的全领域应用。可以说架构视图在整个IT建设当中起到非常重要的作用,它是整个业务和技术的基础框架,它重点体现了整个IT建设的数字化基础能力。所以它具有非常大的建设意义,在这里主要总结了四点:1、它提升了数字化的能力。2、助推IT系统高质量可持续性的发展。3、促进了运维模式的改进、效率的提升。4、打造了金融服务的新格局。    

下面对整个架构视图的方法及原理做一个详细介绍    

架构视图的建设分为三步:第一步整个架构视图本身的建设,这一块主要包括1、架构视图元模型建设,架构视图数据的梳理。2、架构视图的展现,这一块要把架构信息进行线上化,同时以可视化的方法进行全景展现。同时架构视图还要与交易信息、监控信息、告警信息等相关的运行数据进行对接。3、在架构视图基础上要在多个应用场景进行使用。    

下面介绍一下架构视图的设计原理。架构视图在建设过程当中首先是梳理了一套架构视图的元模型,这套模型包含两部分信息,一个是基础架构信息,一块是运维架构信息,基础架构信息其实是把建行的业务领域分成了场景,每个场景分成功能菜单,每个功能又是由不同物理子系统上面的服务通过交易的形式进行串接实现的。通过服务与运维架构信息进行了串联,这样就可以知道,我们的服务是部署在哪个系统的哪个部署单元上、哪个部署实例上,这个部署实例又属于哪个资源池、机柜U位及机房。通过这套模型可以从最上层的业务到最下层的物理部署进行了串接形成全景模型。针对这套模型进行了抽象,抽象出了两套视图:业务场景图和交易路径图。业务场景图其实是对业务进行了分类,是一组业务功能的集合。交易路径图是业务场景图细化而来的,对应到业务功能菜单的颗粒度。    

架构视图支持多维度、多层级、多时间的展现,支持通过视图和表格模式进行数据展现,同时支持通过关键信息进行快速搜索定位。通过搜索可以定位到具体的业务场景图,场景图上可以看到一个业务场景由多个物理子系统通过交易线串接组成。每个系统会动态展示告警信息,同时在上面可以察看告警信息的详情。同时我们还可以查看具体物理系统的交易情况。通过搜索可以进行单笔的交易跟踪,展示单笔交易的交易线。    

如图是业务场景图的展示效果。从图上可以看出,业务场景通过发起渠道,串接了不同的逻辑子系统中的物理子系统。下面是交易路径图,交易路径图是在整个业务场景图的基础上进行的细化,从放大的图上可以看到,将交易线细化到了服务维度,每个服务有相应部署单元的展示。    

在我们项目当中为了保证架构视图的数据形成常态化的管理,我们建立了一整套闭环管理机制,确保架构视图能够在设计、开发、测试、投产等全生命周期内形成完整的闭环管理.通过版本控制、职责权限的明确架构视图能够有效的进行常态化的运转。建行在业务架构上把业务分成一百多个应用领域,每个应用领域里面有几十个场景,每个场景有几十到上百个功能,所以它的数据量非常大关系复杂,如果还采用原来的架构设计的模式进行管理的话,是非常困难的,所以这也是整个课题研究的最关键也是最难的地方,下面我针对这些问题介绍一下我们整个课题主要的技术创新点。    

首先交易路径生成技术;大家知道原来架构师在设计的时候是把各个系统之间服务之间的串接关系通过人工的方式进行绘制。这样会带来很多问题,首先,在现有的组件式架构下,工作量非常大;第二,画出来的信息不一定准,因为信息随着系统的建设会发生变化,同时单靠个人的力量是很难把一个系统或者多个系统之间的关系描绘出来的,所以我们研究了交易路径生成技术,这个技术是通过从各个系统采集交易明细数据,首先生成单笔交易路径,再针对交易路径进行整合、抽取、加工之后形成业务功能之间的交易路径。通过这个技术在架构师进行设计之前就给它提供了一份包括业务场景、交易路径的的架构视图数据,架构师和运维人员是不需要再人工绘制,只需要在已经生成的数据之上查漏补缺进行审核,就能够快速的形成架构视图。    

第二个创新点是IT架构数字化全景视图的展示方法;架构师原有的手工绘图模式很难适应现在的架构视图的成图展示。我们采用自动成图的技术,以设计态应用场景图为基础逐层细化形成全景视图,这个视图是从多个维度进行展示的,首先横向是由基础架构信息延伸到本层的运维架构信息,由设计态和运行态进行对接,展示横向的架构信息。纵向是由设计态由粗到细逐步深入挖掘的架构信息。同时我们还有一个纵深维度的轴,是时间轴,也就是说除了能够展示现在的架构情况还可以对过去的架构信息进行回溯,选历史上的一个时间点,它会展示历史上的架构信息。同时还可以对未来进行预测,这就是整个架构视图数字化的全景视图的展示方法。    

第三个创新点是IT架构数据全生命周期的检核方法。大家知道每个系统建设之前都会进行架构设计,设计完之后随着系统的不断建设和变化,不会及时有效的更新架构设计的结果,会导致架构设计慢慢失效。这套IT架构数据全生命周期的检核方法是通过应用监控,采集应用系统交易日志明细数据,自动生成运行态的交易路径,通过算法对运行态交易路径图和设计态的架构视图进行比对,实时分析出两者之间的差异,通过这种方法可以使设计成果不断更新、越来越准确,同时它也可以比对设计和实际系统的差异,通过它提高整个系统的实施质量。    

刚才介绍的是整个架构视图的原理,下面介绍一下它在运维领域的应用,架构视图对于我们整个企业来说是有非常重要作用的,不仅是在系统的开发设计,实施、运维领域有应用,后续业务领域也会使用到,今年重点在运维领域进行了应用的探索。它在运维领域能够起到非常大的效果,首先架构视图的建设会非常大程度上改变传统的运维模式,大家都知道传统的运维基本上都是通过流程、工单方式进行组织的,其实有很多问题,首先第一个是它的效率比较低,第二是会出现线上线下脱离的情况。通过架构视图可以有效的把各个运维场景进行串接形成新的运维组织模式,大家通过在架构视图上看到相应的信息之后来组织运维,会大大提升运维的效率。大家都知道系统管理员好多都是不懂业务的,他们在维护系统过程当中其实对实际业务情况都不是很了解,通过这套架构视图拉近了业务到运维的距离,通过它可以把运维向业务方面进行延伸,后续逐步向业务级的运维努力。    

下面举了几个具体的场景给大家做介绍。首先是变更过程管控,通过架构视图对接自动化变更,可以实时展现变更计划以及执行过程,结合架构视图的信息以及变更内容、变更执行步骤、变更时间等指标进行变更的影响分析,同时对自动化变更执行的异常信息进行识别、分析和推荐。

第一是可以进行变更情况展示,选择过去、现在或未来的时间,会展示在各个应用领域上面要做的变更数量。点到具体的应用领域里可以看到在某个时间段内,在这个业务领域下有哪些系统要做变更,灰色的代表还没有执行的变更,黄色是进行中的,绿色是已完成的。点击具体的变更可以察看到变更的具体信息、变更的实施工艺,同时还可以看到自动化变更执行的进度情况。

第二是可以进行投产进度的跟踪,对于某一应用领域的投产,可以重点关注在某个业务场景中的功能投产情况,从图上可以清楚的看到这次投产主系统、协同系统变更的进度情况,根据进度情况可以辅助我们营业的时间

第三通过架构视图可以做变更影响分析,原来变更在做影响分析的时候只能做到对系统的影响,再往上一层对于业务的影响只能通过人的经验进行判断,有了架构视图之后可以根据变更信息自动分析业务的影响,并在架构视图中进行展现。选择一个日期,可以展示日期所做变更可能对哪些应用领域、哪些业务产生影响。点到业务场景某一具体变更之后可以查看该变更的影响分析,包括影响功能,预计影响时间、预计影响多少用户、影响交易量等。

第四在图上还可以变更异常情况进行查看,从图上一目了然,变更标红了,说明变更在执行过程中出现了异常,查看具体变更的情况会展示出具体变更到底在哪个环节出现了异常,同时还可以把相关变更过程中的监控指标进行订阅,辅助进行变更异常的分析。通过架构视图与自动化变更的结合,可以加强变更过程的管控,有效控制变更风险。    

第二个要给大家讲的是故障处置,会分两部分讲,首先讲故障的应急组织,不知道大家了不了解数据中心的应急,比如故障发生之后在场景不是特别明确的情况下,应急组织效率是相对比较低的,通过架构视图可以通过搜索和钻取定位到问题场景,一键建立电话会议,实现准确和快速的应急组织,比如建行95533,收到报账,显示建亚外卡POS刷卡消费失败,我们输入建亚POS消费,会把POS消费场景展现出来,这时候我们可以清晰的看出在收单的地方有个告警并快速选择收单跟它关联的系统,选中系统之后,通过每个系统里面详细的配置信息,包括应用管理员、项目组人员信息等,可以一键组织应急会议。同时架构视图与移动端进行对接,运维人员通过手机快速接入到电话会议中,进行相应的应急。通过这个方式大幅度提高应急的组织时间,提高组织的准确度。同时通过手机端可以做到随时随地能够应急。    

下面再介绍一下故障的智能处置,通过架构视图可以大幅度提升信息获取效率,通过系统智能分析与人工决策相结合,可以实现快速准确的根因定位及故障处置,如图监控系统发生告警后,可以从监控系统或者视图上搜索搜到场景,搜到场景之后可以展示出业务场景中对应的哪个节点出现报警,触发根因分析可以告诉我们这条交易线上哪个节点是最有可能发生故障的物理子系统,同时可以展示出该系统最近做了多少变更、有多少告警、执行了多少操作,针对这个节点会自动触发对存储、网络、平台、设备的健康检查,最后定位到底是系统哪个位置出现了问题。根据架构视图可以快速进行业务影响分析,系统关联了哪些业务领域通过架构视图是可以快速了解的,所以它会很快的告诉我们哪些业务产生影响。同时架构视图还跟自动化处置平台进行对接,通过一键操作进行快速的处置,这就是在故障处置方面做的应用。它是通过根因的精准定位、问题在线分析、业务影响的快速确认实现故障的一键式处置。    

最后再说一下它在资源容量预测分析这一块做的应用,传统的容量分析是基于系统的视角对它相关的资源进行分析,有了架构视图将基础设施和业务进行了关联,就可以从业务视角出发打通业务与系统的壁垒,建立业务容量的计算模型,真正能够做到基于业务容量的预测。根据各个功能的用户数、历史容量数据、系统压测情况给出合理的容量值,并且根据目前的容量增长情况对容量进行预测,在架构视图上可以展示未来某一个应用领域可能会出现容量的问题。例如,选择未来一个事件,显示收单有容量问题,点到收单领域之后会告诉我们在业务场景中哪两个系统可能出现容量的问题,点击具体某一个系统会对业务容量的变化情况进行预测分析,同时基于业务容量的变化对对应的资源包括服务器、数据库、存储和网络,根据它的占用模型进行容量的预测,可以从业务向下分析出基础设施容量的容量情况。通过架构视图与容量分析相结合,能够预测业务高峰,动态支持业务流量变化。    

我们的系统今年已经开始推广,截止到现在已经成功推广到了建行对客服务的多个关键业务应用,包括存款、借记卡、支付结算、贷记卡等领域,涉及到的物理子系统189个,场景数量257个,相关功能点数达到7822个。    

随着项目的不断开展,将逐步覆盖到建行所有的应用,包括营销支持、产品与服务、产品运营、业务支持、报告决策、风险管理等领域,实现IT架构全景视图的全面覆盖。    

这就是我今天要给大家分享的主要内容。感谢大家的聆听! 

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-12-15 18:36:00
国内资讯 直击中国IDC产业年度大典:一众上市公司争艳,算力演进新趋势浮现
近年来,我国算力产业发展迅速,数据中心规模不断扩大,算力需求持续增长,算力技术不断创新。 <详情>
2023-09-04 16:58:00
国内资讯 第十八届中国IDC产业(长三角)年度大典在上海成功举办
IDCC作为算力产业交流与合作的重要平台,有效推动了我国两大重要经济枢纽地区的算力产业发展。 <详情>
2023-03-21 09:53:00