中国IDC圈12月9日报道:近些年来,随着互联网和云计算的发展,包括电子商务,游戏,金融保险等很多领域的企业,都纷纷加大了对IT运维的投入。在这其中,又以数据库运维最受重视。因为数据库运维水平的高低,将可以直接影响企业的业务发展。以游戏公司为例,从最早的客户端游戏,到后来的SNS游戏、网页游戏,甚至现如今的移动端游戏产品,其数据库的演进始终没有停止。日前,我们IDC圈百家访谈栏目组特地走访了触控科技的萧田国先生,萧田国先生从1999年起涉足数据库管理工作,对各种关系型数据库如Oracle/MySQL/MS SQL Server及NoSQL有丰富实战经验,近几年也负责运维整体工作的协调管理。以下是他分享的关于数据库运维方面的一些心得。

1

      萧田国,男,硕士毕业于北京科技大学,目前为触控科技运维负责人。拥有十多年运维及团队管理经验。先后就职于联想集团、搜狐畅游、智明星通、世纪互联等。

稳定易控是游戏数据库需求所在

实际上,虽然各行各业都十分重视数据库运维工作,但由于属性不同,所以数据库之间也有很大的差别。萧田国先生表示,这主要是由于行业需求不同所致。以电商行业为例,一般都是采用大型数据库集群作为支撑,而中小公司的核心业务,像支付系统、用户系统依旧以Oracle数据库为主,只有技术能力超强的大型电商企业,才敢于实现去IOE化。

再比如游戏行业,该行业由于特殊性所致,所以基本上都是大面积采用MySQL,而且是分治独立的MySQL单实例数据库为主。这个特殊之处,几乎贯穿并适用于客户端游戏、网页游戏,甚至是现在的移动端游戏。这主要是因为游戏需要满足分服(分区制)的需求。比如触控科技运营的手游《秦时明月》,目前已经开服几百个,每个服都是一个独立的游戏世界,每个游戏世界都有一个MySQL数据库支持(可能有些服共享一个数据库实例)。

这个特殊性给数据库运维带了不同的挑战。一,数据库数量多,得想办法保障所有数据库都不出问题,而且监控报警系统得强大,任何一个数据库出问题,都能第一时间发现和响应;二,对数据库管理员(简称为DBA,下文同)的综合素质要求更高,掌控力要求更强。他们还需要有较强的Linux技能,甚至对服务器、硬盘及RAID卡的选型、性能及厂家故障处理,都了如指掌,毕竟数据库服务器那么多、而且又非常重要,系统组同学操作起来可能压力非常大,而且对DBA而言也风险较大;三,数据库备份和校验是个问题,数据库服务器可能分布在多个机房,一般出于成本考虑,可能不会配置数据库主从热备机制,而只是数据库逻辑备份,这样数据库备份的存储和可用性校验都比较棘手(一般需要周期性的抽样做恢复性测试),需要开发自定义脚本或程序去解决。另外某些大服需特殊优化,以保证业务的持续性和备份的可用性。

高效团队是数据库专业运维的基础

如前所述,数据是一个企业的生命,数据库的运维对于企业运营是重中之重,而一支高效的团队则可以让运维效率事半功倍。这其中既要有懂得管理和技术实施的负责人,也要明确分工,专业规范,并建立赏罚分明的机制。

萧田国先生认为,和其他团队一样,负责人是数据库运维的关键所在,必须对数据库有深刻的把握,否则容易出现数据库技术人员口服心不服的情况。数据库从业人员一般都有过系统的数据库理论知识学习、参加过1到2个通用数据库产品的专业培训、取得相应专业证书(属于持证上岗,呵呵),并具有较高的学历。如果负责人不能在技术和管理方面实现全面的超越,将很难驾驭这些精英级的人物。同样,如果负责人的工作分配不到位、出现问题也不能快速定位、协助团队成员有效解决,那就容易离心离德,使团队一盘散沙。

其次,量才用人,做好梯队分工也非常重要。现在大部分公司的DBA,其实从事很多例行重复性的工作,例如业务数据导出和数据库例行更新等事情。这些工作完全可以交由刚毕业的实习生,或者是初级数据库技术人员来做;而将中级技术人员分配到更复杂些的操作当中,如SQL优化、故障深入分析和预防;高级技术人员则更多的进行些架构优化、源码分享或新技术研究及应用。用好人的另一个方面,也包括发挥技术人员的优势。例如,有些高级技术人员不善沟通,就不要老让他们抛头露面、也不要把他们去当成业务接口人,而如果这些高级人员,技术水平确实较高,那就要当做资源型人才来对待。尽量为其提供更好的支持,以便发挥其才能。这样也可以提升这些人的价值感和团队向心力。另外,人性化管理是数据库团队的重要要求之一,按照彼得•德鲁克先生管理学的理论,对知识工作者的管理,不能像流水线的工人,更不能像政府机关那样层次分明。需要柔性管理,顺势而为,方能取得更好效果。

最后,要有专业规范的流程文档,明确奖惩、例行分享。数据库是个危险的系统,数据库技术人员是个危险的职业,除了不能完全依赖个人能力之外,还应该更多的强调业务的持续性和继承性(不能因某主力DBA离职,整个业务都受影响)。经验数据表明,很多严重甚至灾难级别的数据库故障,究其原因,都并非技术水平不行,而是DBA的粗心大意导致。所以建议花大力气,事无巨细的建设流程规范,尽量避免人为事故或重大故障的发生。对出现过的重大故障,时时温习,做到举一反三,避免再犯类似问题。对出现的严重事故或故障,要做到明确处罚,严格执行。

数据库是云计算需主要解决的问题之一

数据库是区别和衡量各大云计算性能的主要指标之一。萧田国先生认为,最终用户一般通过两个办法来实现基于云计算的数据库,即在开设好的虚拟机上自己搭建数据库,或使用云计算厂商提供的关系型数据库产品(RDS)。对于这一点,各家厂商的叫法不同,但基本的用途和功能一致。目前国内各大云计算平台,在云端数据库这方面,仍然有很多事情可以做。比如提升性能和稳定性等。我们曾经选用了国内八大云计算厂商,进行了长达4个月的测试。从测试结果来看,大部分厂商存在的情况是,RDS的损耗较多。而且厂商封装好的RDS产品,参数优化调整困难,限定了只能使用的数据库类型、版本。另外RDS产品都限制了数据库空间,如果超过该空间的话,调整难度很大,这也制约了RDS的使用,并且违背了云计算自动扩展的初衷。从这些角度来看,还有很多可优化的空间。

关于云计算、云端数据库的更多分享,以及未来云端数据库的趋势预估等内容,敬请期待我们的后续内容。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-28 14:18:27
市场情报 GoldenDB分布式数据库持续演进,聚焦核心能力构建
在业务创新及科技创新的双重驱动下,金融行业IT系统分布式架构转型是必然趋势。 <详情>
2023-08-03 15:00:02
市场情报 GoldenDB助力广发银行核心系统国产化替代
在核心系统改造中极为关键的数据库层面,广发银行引入了GoldenDB分布式数据库。 <详情>
2023-07-31 15:03:00
市场情报 快速、高质量,GoldenDB助力山东移动CRM-BOSS核心系统成功商用
!GoldenDB项目组不仅在6个月内做到首个地市核心系统快速上线,在后续地市从部署、测试到上线用时仅为21天。 <详情>
2023-07-28 17:57:42
市场情报 亮相中国互联网大会!金篆信科GoldenDB参加数字技术与应用成果展
数据库与芯片、操作系统并列为新一代信息技术自主创新的三大核心能力之一,直接体现国家信息技术的基础能力。 <详情>
2023-07-26 15:20:18
市场情报 共建繁荣金融生态!中兴通讯GoldenDB完成中电金信六款产品互认证
GoldenDB与中电金信通过优势互补,共同在金融行业数字化转型领域紧密合作。 <详情>