2023年12月29日,国家发改委、国家数据局、中央网信办、工信部、国家能源局五部门日前联合印发《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,提出要建设涵盖通用计算、智能计算、超级计算的融合算力中心,促进不同计算精度算力资源服务有机协同。
近日,全国优秀数据中心点亮计划栏目组就走访了这样一家集超算、智算和通用计算为一体的融合算力中心——吉利科技(长兴)数据中心,并采访了长兴吉数科技有限公司总经理张振杰先生,请他向我们介绍了这一汽车工业“数字化大脑”的建设背景、业务特色、运营模式、发展规划等方方面面。
长兴吉数科技有限公司总经理 张振杰
建设初心
智能化是汽车产业当前重要的发展方向,汽车产业链上下游的数据、算力、存力需求呈现爆发式增长,对数据中心的需求也日益增加。长兴吉数作为吉利科技集团的子公司,以满足吉利集团汽车研发需求为导向,打造了吉利科技(长兴)数据中心——当前国内车企自建规模最大的融合性算力中心。
“我们数据中心建设的初心,是为吉利智能驾驶服务。目前吉利汽车智能驾驶云端算力从81亿亿次到102亿亿次,我们数据中心全力保障基础设施安全稳定。”张振杰表示,在规划立项之初,吉利预估到未来几年中随着其汽车产品智能化的发展,对于数据和算力的需求会越来越大,所以启动了数据中心项目的建设。
吉利科技(长兴)数据中心位于浙江省湖州市南太湖绿色智能制造产业园,于2019年正式兴建,2021年年底建成并投入使用,当前一期已经建成12个模块机房、标准5KW机柜2520架。
其中,最令吉利人自豪的,无疑是跻身全球超算TOP 500榜单第185名的超级计算机——吉利星睿智算中心·智能仿真平台(Geely Wise Star-Dubhe)。该超算总算力达3.54PFlop/s,采用冷板式液冷散热,单机柜功率高达70Kw,是中国汽车产业乃至制造产业第一个上榜的超算中心。
“当前超算的算力使用率已经达到了90%以上,”张振杰介绍,吉利当前新车研发都会在超算上进行车型设计、计算风阻系数、安全碰撞模拟等,即增强了新产品设计的安全性、可靠性,也大大降低了时间成本。
除超算外,吉利科技(长兴)数据中心还有庞大的智算中心业务。吉利星睿智算中心拥有“中国汽车行业首个百亿参数大模型、首个高速云计算网络,及业界首创的行业研发工具链、数据归集算法、云边协同计算模式”等10余项行业领先的首发技术,可提升吉利整体研发效率20%。人工智能大模型和智驾模型训练时长从3个月,缩短到仅需8个小时,训练速度直线200倍。
吉利星睿智算中心成为吉利打通 “车路云网图”,实现天地一体化和万物互联的算力底座。智算中心包括吉利研发体系投入星睿云智驾平台的几百台GPU服务器,以及长兴吉数自建的50台A800 GPU资源池,算力能力不断提升。
“每一款新车从研发阶段就需要海量的智能驾驶算法训练,智算中心还用来训练吉利自己的大模型。”张振杰表示:“吉利的最新车型已经搭载了大模型,以后还有更多的车型会搭载这些智能系统。大家可以去体会一下,感受一下它的智能化的程度。”
多元化发展
“吉利科技(长兴)数据中心业务以满足吉利集团内部的需求为根本,然后在有余力的情况下对外提供服务。”张振杰表示,面向产业的未来需求,吉利科技(长兴)数据中心的规划和建设规模作了一定的超前规划。
据介绍,当前智算机柜上线数量为1000架左右。因此,在“算有余力”的情况下,吉利科技(长兴)数据中心开始了对外业务的拓展。
“多元化”,是张振杰对吉利科技(长兴)数据中心业务的总结。据介绍,吉利长兴数据中心的业务特色主要体现在两个方面,一是产品形态丰富多元,二是合作模式灵活多元。
“我们可以提供传统5Kw的机柜,也可以为GPU服务器托管提供可高至25Kw的机柜。在散热方式上,我们有传统的精密空调加水冷系统,也有冷板式液冷、浸没式液冷。”
张振杰介绍,作为融合型算力中心,吉利科技(长兴)数据中心涵盖了传统的通用数据中心和智能化的智算中心的功能,并拥有超算、智算、液冷、高电等多种产品形态,可以满足高性能计算、大数据分析、人工智能训练等多种服务需求。
在业务合作方面,吉利科技(长兴)数据中心同样采用了多元模式。当前正在运行的机柜中,既有吉利集团托管的业务,也有数据中心自己的资源池,还有大量外部客户托管、租赁、共享的服务器。
“我们不仅积累了资源,还积累了客户。”张振杰表示吉利科技(长兴)数据中心的业务形式不仅多元,而且开放:“对于那些有GPU但没客户的合作方,就由我们出机柜,合作方出GPU,共同服务有智算需求的客户。”
张振杰透露,吉利科技(长兴)数据中心的客户并不限于汽车领域,而是面向所有有智算需求的行业。数据中心的合作模式体现了吉利的开放和包容的理念,也为数据中心的运营带来了多元化的收入来源。
据了解,当前吉利科技(长兴)数据中心正在运行的业务中,外部客户占比已经达到1/4,并且在持续增长中。
三大优势打造优质服务
张振杰介绍,吉利科技(长兴)数据中心的服务客户的优势主要体现在三个方面,一是资源优势,二是合作优势,三是人才优势。
在资源优势方面,吉利科技(长兴)数据中心拥有丰富的网络资源和采购资源,能够保证数据中心的网络质量和设备供应。数据中心直接接入三大运营商的网络,是真正的三线机房。借助吉利集团的采购体系,能够优先获取到市场上紧缺的GPU和其他设备,降低了数据中心的成本。
丰富的合作渠道,是长兴吉数业务发展的底气之一。
张振杰介绍,一方面是与吉利集团内部的合作提升了吉利科技(长兴)数据中心的服务能力。另一方面是与国内知名的公有云服务商建立了稳固的合作关系,借助云厂商的技术和经验,提高了数据中心的运维效率和智能化水平。
“前期资源为王,后期就要拼运营、拼团队实力。”张振杰认为智算中心的发展模式已经远远超出了传统数据中心“风火水电”的框架。未来的发展,离不开人才梯队的建设。
“我们的团队由老兵和新兵组成,有资深专家和入行新人,有传统IT人员和数据中心专家,形成了一个老中青搭配的团队,并通过系统和知识库沉淀我们的运维的经验,保证了数据中心的安全和稳定。”张振杰介绍。
据了解,吉利科技(长兴)数据中心目前正在规划第二期的建设,包括超算中心和智算中心在内,规模均增长一倍。张振杰表示,长兴吉数不会止步于此,正在考虑在华北、西北地区的国家一体化算力网络枢纽节点建设新的数据中心。
“我们数据中心的发展要与吉利集团的业务发展相匹配,我们要根据吉利集团的汽车销量和研发进度,合理规划我们数据中心的建设节奏和规模。”张振杰表示。