随着互联网金融的快速发展,数据中心规模越来越大,设备越来越复杂,传统运维模式无法满足当前业务需求,为了解决运维困境,某超级大行引入浪潮ISPIM服务器管理平台,ISPIM凭借资产信息自动录入、监控指标精细化管理、故障诊断专家大数据规则库、异构设备统一管理等功能,帮助该行数据中心运维效率2倍提升,保障业务稳定可靠运行。

近年来,互联网金融快速崛起,传统银行不断转型升级,推出各类线上金融产品,引入智慧化设备,无纸化办公、远程金融交易等等,海量数据实时交易对银行的信息系统也提出了更高的要求。信息技术在银行系统扮演的角色越来越重要,各大银行纷纷把构建安全、稳定、有序、高效的IT运维管理模式,推动业务系统稳定运行视作增强自身竞争能力的关键一环。

传统运维模式跟不上业务快速发展的脚步

随着企业业务量的不断增长,数据中心的规模越来越大,而大规模的异构厂商设备难以进行统一监控和管理,企业运维压力不断攀升。传统运维模式严重依赖“人力”,运维人员即是数据中心能力的瓶颈。例如,数据中心新设备上架后的资产登记工作、服务器移动后的资产信息变更统计工作、年终机房设备的盘点、数据中心的报表整理等均需要以人工的方式进行维护,工作量较大、容易出错。

而随着银行数据中心服务器保有量的不断增加,设备告警泛滥、缺少融合,而且告警的设备在发生问题后,很难在第一时间得到处理。在面对故障修复问题时,传统运维模式大多依赖于人的经验判断,而面对大量复杂的异构设备,运维人员难免判断失误。

传统运维与精细化管理是矛盾的,传统运维模式无法单独对服务器的功耗进行实时的监控和统计,只能通过供电设备对整个机房(包含空调、照明、服务器等)耗电进行统计,能耗管理粒度粗。

告别传统模式,浪潮ISPIM助力金融行业运维转型

为了能够提升服务器运维水平和运维效率,解决传统运维模式当前面临的挑战,某银行巨头近年来将“带外管理技术研究”作为年度课题展开研究,期望通过新技术解决目前运维的痛点,保障业务运行的可靠性。

作为世界TOP级银行,该行数据中心服务器保有量高达数万台,采用两地三中心的容灾方案,支撑着全国的资金管理、收费缴费、金融理财等业务。为了满足当前运维管理需求,解决运维困境,该行引入了浪潮ISPIM来助力运维。ISPIM(浪潮物理基础设施管理平台)是面向互联网、金融、通信等行业数据中心的物理基础设施自动化运维平台,具备资产统一管理、设备实时监控、告警精准推送、设备自动巡检、无状态固件管理、智能能耗分析等功能,可实现服务器、存储、交换机和防火墙等设备的统一管理,能有效地帮助企业提高运维效率、降低运维成本,保障数据中心安全、可靠、稳定地运行。

1

图1 ISPIM功能架构图

创新运维管理平台,看ISPIM如何乘风破浪

经过对运维需求的考察,该行与浪潮最终决定在该行数据中心使用6台虚拟机,以“主备HA模式”部署ISPIM。在主机宕机的情况下,可以自动切换并启用备机,保证数据中心设备监控的持续运行。其中,主动采集频率为1h,监控指标可达150W+,覆盖了数据中心设备的所有组件。

2

图2 部署方式

浪潮ISPIM支持资产信息自动录入,能够定时批量地扫描资源,同时自动获取设备的型号、SN序列号、BMC版本号等元数据信息,并支持导出资产报表。7x24小时的服务器部件级监控告警,能够实现全性能指标监控,包括风扇、温度、电压等指标的监控。通过主/被动的监控方式,可以实时捕捉设备异常信息并及时将告警信息推送给运维人员,极大地降低了工作人员的运维压力。

ISPIM内置服务器专家级大数据规则库,拥有主动巡检机制,内置492个故障模型、30,000+专家经验,可以快速诊断故障根因并关联至对应的应急预案建议,自动提供解决方案。支持对服务器性能指标进行阈值设置,实现性能功耗的精准控制。功耗管理功能,用户可以一目了然的查看不同类型服务器的能耗详情,做到“心中有数”,为后期数据中心采购设备、扩大规模等提供参考建议。

ISPIM你值得拥有,改变数据中心运维套路

互联网、移动互联网乃至物联网的快速兴起带动了数字技术的普及,在这一趋势下,数据中心事实上已经成为绝大多数公司的核心生产力和重要资产。与此同时,业务扩张与创新也使得数据中心的规模不断膨胀,以BAT为例,其区域数据中心规模均已步入10万+服务器级别。
浪潮ISPIM可同时对于数万台不同品牌服务器、存储、网络设备等设备的统一监控、运维、告警管理,运维效率2倍提升,基于浪潮故障专家库的大数据规则故障诊断功能,可将故障诊断提升到93%,并且可在快速处理故障的同时最大程度降低数据泄露风险。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2020-08-25 13:28:03
运维管理 网银互联云计算数据中心运维团队如何应援78.6万的TFBOYS线上演唱会?
8月末的演唱会,7月初的运维保障。网银互联通航云计算数据中心早在7月初开始部署本次演唱会的重保工作。公司先后多次召开相关重保工作专题会议,对通航云计算数据中心进行全 <详情>
2020-07-28 14:56:04
市场情报 为数据时代保驾护航 浩云网络举行六地三中心大型联合运维演习
7月24日,正值浩云首个运维日,浩云网络联合杭州、广州、成都、佛山、天津、贵阳六地的云计算基地举行了“六地三中心大型联合运维演习”。 <详情>
2020-05-22 10:58:12
运维管理 数据中心如何为恶劣天气做好准备
天气会严重影响数据中心的运营。而热浪和雷暴很容易损坏敏感设备,而地震、洪水和龙卷风等更严重的事件可能会使数据中心业务中断几天甚至几周的时间。 <详情>
2020-03-25 13:42:53
运维管理 数据中心智能安防是运维系统重要组成
随着数字化视频监控技术成熟,数字化视频监控技术给视频监控的多样化应用打开了窗口,为后续智能化安全防护系统的建设提供了可能性,数据中心通过IP以太网技术搭建安防系统 <详情>
2019-11-26 15:16:00
云资讯 网络工程专业毕业生是否可以转向学习云计算知识?
云计算运维与传统网络运维不同,对于运维人员的技术要求要高一些,比如运维人员除了要具备基础的网络工程知识之外,还需要系统地掌握操作系统(Linux)、数据库和云计算平 <详情>