2024年被普遍认为是“大模型落地应用元年”,而要让大模型真正落地应用到企业的生产环节中,推理能力至关重要。所谓“推理能力”,即大模型利用输入的新数据,一次性获得正确结论的过程。除模型本身的设计外,还需要强大的硬件作为基础。

在8月21日举办的2024火山引擎AI创新巡展上海站活动上,火山引擎云基础产品负责人罗浩发表演讲,介绍了火山引擎AI全栈云在算力升级、资源管理、性能和稳定性等方面做出的努力,尤其是分享了针对大模型推理问题的解决方案。

罗浩表示,在弹性方面,与传统的云原生任务相比,推理任务,以及面向AI native应用,由于其所对应的底层资源池更加复杂,因此面临的弹性问题也更加复杂。传统的在线任务弹性,主要存在于CPU、内存、存储等方面,而AI native应用的弹性问题,则涉及模型弹性、GPU弹性、缓存弹性,以及RAG、KV Cache等机制的弹性。

同时,由于底层支撑算力和包括数据库系统在内的存储都发生了相应的变化,也导致对应的观测体系和监控体系出现不同的变化,带来新的挑战。

在具体应对上,火山引擎首先在资源方面,面向不同的需求,提供了更多类型的多达几百种计算实例,包括推理、训练以及不同规格推理和训练的实例类型,同时涵盖CPU和GPU。

在选择实例时,火山引擎应用了自研的智能选型产品,当面训练场景或推理场景时,在给定推理引擎,以及该推理引擎所对应的模型时,都会给出更加适配的GPU或CPU实例。该工具也会自动探索模型参数,包括推理引擎性能等,从而找到最佳匹配实例。

最后,结合整体资源调度体系,可以通过容器、虚拟机、Service等方式,满足对资源的需求。

而在数据领域,目前在训练场景,最主要会通过TOS、CFS、VPFS支持大模型的训练和分发,可以看到所有的存储、数据库等都在逐渐转向高维化,提供了对应的存储和检索能力。

图片1.png

在数据安全方向,当前的存储数据,已经有了更多内容属性,企业和用户对于数据存储的安全性也更加在意。对此,火山引擎在基础架构层面提供全面的路审计能力,可通过专区形式,支持从物理机到交换机,再到专属云以及所有组件的对应审计能力。

对此,罗浩以火山引擎与游戏公司沐瞳的具体合作为例给予了解释。在对移动端游戏里出现的语言、行为进行审计和审核时,大量用到各种各样的云基础,以及包括大模型在内的多种AI产品,而火山引擎做到了让所有的产品使用都在同一朵云上,使其在整体调用过程当中,不出现额外的流量成本,也使整体调用延时达到最优化。

另外,在火山引擎与客户“美图”合作的案例中,在面对新年、元旦、情人节等流量高峰时,美图通过火山引擎弹性的资源池,同时利用火山潮汐的算力,使得应用整体使用GPU和CPU等云资源时,成本达到最优化。

罗浩最后表示,未来火山引擎AI全栈云在算力、资源管理、性能及稳定性等方面还将继续探索,为AI应用在各行业的落地,奠定更加坚实的基础,为推动各行业智能化和数字化转型的全新助力。(作者:于白)

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-08-27 10:14:49
算力新闻 大模型难道只是智算中心的客户么?
无论是市场推动,还是政策指引,因为大模型的爆发和应用需求,直接推动了智算中心的技术革新和规模扩张,也成为了智算中心最重要的客户群体。 <详情>
2024-08-23 17:50:23
市场情报 火山引擎谭待:没必要将AI和云对立,大模型是“云2.0”的组成部分
云市场的本质是规模经济,规模大意味着更强的竞争力、更好的弹性、更低的成本。 <详情>
2024-07-29 14:12:00
2024-07-10 18:24:24
市场情报 《智算与大模型人才白皮书》于2024世界人工智能大会上重磅发布
白皮书创新地提出“智算与业务共生的组织运作框架”,指导人工智能+时代下的组织运作与人才发展。 <详情>
2024-06-24 10:35:17
产业专家:应尽快推进锂电在数据中心应用的标准制定与落地
2024-09-14 17:14:12
2024智算生态发展大会成功举办 多方携手共绘智算蓝图
2024-09-13 19:12:00
Gartner发布2024年中国基础设施战略技术成熟度曲线
2024-09-10 18:00:24
自备算力?宁德时代也在建设数据中心
2024-09-09 15:24:14
“碳”索新机遇 “智”造新图景——正泰智能电气40年媒体开放日活动成功举办
2024-09-09 13:37:00
中信数字科技集团揭牌成立,布局算力网络和数字基建
2024-09-06 17:13:10
PPIO派欧云发布全新算力云产品,助力大模型推理千倍降本
2024-09-06 16:35:46
有奖调研|诚邀参与科智咨询2024年中国数据中心产业出海调研
2024-09-06 10:43:44
工信部十一部门:对算力基础设施实施差异化能耗、用地等政策
2024-09-05 14:21:35
首都国企开放日走进中关村工业互联网产业园——探索AI技术于工业互联网生态下的应用新场景
2024-09-05 10:32:00
1.28亿 邢台智算中心建设项目设计-施工EPC总承包中标公示
2024-09-04 10:25:58
兰洋科技王梦骋:解决浸没式液冷使用疑虑需打造更多应用示范【数字匠人】
2024-09-04 10:20:00
绿色算力引领潮流,中卫市数据局在中国智算产业绿色科技大会上备受瞩目
2024-09-03 15:46:00
扬帆出海:算力中心企业东南亚与中东地区投资策略与指引
2024-09-02 17:08:00
中交(中卫)云数据中心绿色创新发展论坛成功举行
2024-09-02 09:41:00