为了能有更多时间在双11期间买买买,阿里巴巴的工程师研发出了一款AI来解放自己。

11月6日,阿里巴巴数据中心AI调度官“达灵”正式上任。在实习期间,达灵打破了人类工程师的多项纪录:将数据中心资源分配率拉升到了90%以上,在部分业务中节省了一半服务器,并且可以2秒钟锁定异常机器,命中率94%。

“伴随双11规模的逐年暴涨,管理、调度上万台服务器这样的工作已经不适合人来做了。” 阿里巴巴资深搜索研发专家郑南说,达灵这套算法能够快速给出最优的计算资源部署方案,并且根据访问量不断搬运应用和数据,确保没有一台机器偷懒。

今年工程师的职责变成如何用数据去喂养“达灵”。郑南说,我们要做的就是提供表格数据大小、应用历史访问量以及目前的部署方案等信息,省下的就是喝着茶看她的表演。“她甚至可以在线上克隆一个真实的服务,自己进行压力测试,以判断方案是否最优。”

除了对计算资源的不断调度、应用的不断搬运外,达灵还有一个职责是及时发现异常机器,快速隔离。要知道,双11期间一台机器的异常,可能带来百万级用户的下单失败。

但对工程师来说,从机器出现异常、被发现到处理完成,整个过程有时会长达数分钟。而这已经是人类能做到的极限。达灵能够把时间、负载、服务状态等不确定因素通过数据算法关联,最终快速锁定异常机器。

日常工作中,达灵每天会采集29亿条机器运营状态,日均隔离异常机器1000次左右,在大促期间调度准确率达到94%,时间只需要2秒钟。

阿里巴巴iDST团队是达灵的创造者。项目负责人朱胜火博士说,达灵的工作首先是在集群监控数据之上,建立起很多个深度学习、在线学习的模型,由此对集群内每一台机器、每一个应用,当前和未来的状态都了然于胸。在此基础上,达灵通过应用强化学习、组合优化等技术,可以在复杂环境中自行学习判断,作出一系列比如错峰排布、碎片规整等聪明的决策,从而全局最优化集群的资源分配率以及稳定性。

除了“达灵”以外,机器运营小二、机器导购员、智能客服、AI设计师、机器拣货员、机房巡逻员等一系列新物种已在天猫双11前夕集中上岗。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-01-04 10:41:40
国内资讯 分析师视角:2018年的数据中心3大预测
向数字业务平台的迁移促使基础设施和运营(I&O)领导者必须重新去思考他们的数据中心策略。像人工智能这样的数字业务平台,包括机器学习(ML)、深度神经网络(DNN)和物联网,对 <详情>
2018-01-04 10:32:07
机房建设 解读SDN成为数据中心网络佳选的五大原因
软件定义网络(SDN)是指通过控制和数据包转发平面分离来实现,这种架构可以降低运营成本,减少进行更改或提供服务所需的时间。由于所有的智能都存在于软件中,而不是单一 <详情>
2018-01-04 10:10:26
机房建设 Uptime Institute总裁:数据中心领域至少还有10年的增长
日前,行业媒体与数据中心设施咨询机构Uptime Institute总裁Lee Kirby一起探讨与分析了数据中心行业技术与发展的现状与趋势,其内容包括数据中心认证、层级、边缘计算、电 <详情>
2018-01-04 09:41:00
国际资讯 欧洲数据中心市场在2018年将如何变化
2017年对全球数据中心发展来说是火热的一年,但是随着更多的整合、新市场的出现,以及新法规的出台,欧洲的数据中心在2018年似乎将面临比较极端的变革。 <详情>