2024世界人工智能大会启明创投·创业与投资论坛今天举行。阶跃星辰创始人、CEO 姜大昕博士受邀出席此次论坛,发表了主题为《攀登AGI的路径与实践:万亿参数和多模融合》的演讲,分享了对于大模型发展现状与趋势的观察与思考。在演讲中,姜大昕重点阐述了一个核心观点:探索AGI路径,“Scaling Law”和“多模态”是相辅相成、缺一不可的两个方向。两者齐头并进,最终到达AGI。

Scaling Law仍处于陡峭区间,万亿参数是基本出发点

近年来,GPT系列模型的演进,客观上验证了Scaling Law的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。虽然业内围绕“Scaling Law还能走多远”尚未形成共识,但阶跃星辰认为,参数量接下来再提高一个数量级是依然成立的。Scaling Law 目前依然奏效,模型性能仍然在随着参数量、数据量和计算量的增加呈幂次方增长。在此发展过程中,万亿参数量已经成为一个基本的入门门槛。

正是基于这样的认知,阶跃星辰很早便启动了万亿参数模型的训练。从千亿到万亿,模型的参数规模提升了一个量级,难度也提升了十倍以上。为此,阶跃星辰加大资源投入,尤其在系统和算法上积极探索,最终走通了万亿参数 MoE 大模型训练的道路。在 WAIC 2024 上,阶跃星辰发布了全新的 Step-2 万亿参数语言大模型正式版。根据从逻辑推理、世界知识、数学和编程等多个维度进行的权威测试,Step-2 模型能力都已全面接近国际主流模型,在部分测试集甚至实现了超越。

多模态是构建世界模型的基础能力,将走向理解与生成的统一

在不断攀登Scaling Law的同时,阶跃星辰也强调,多模态是构建世界模型的基础能力,是通向AGI的必经之路。从算法角度看,世界模型的演进会分为三个阶段:

第一阶段是模拟物理世界;

第二阶段是通过具身智能和物理世界交互,主动探索物理世界;

第三阶段是通过发展系统能力,发现新的物理规律,归纳物理世界。

从模拟世界,到探索世界,再到归纳世界,多模态是贯穿这三个阶段的基本能力。目前,全球科技巨头正在积极探索并布局多模融合的路径,多模态大模型研发的脚步正越走越快。然而,多模态领域目前存在的问题是,视觉的理解模型和生成模型是分开发展的。其造成的结果就是理解模型的理解能力强而生成能力弱,或者生成模型的生成能力强而理解能力弱。因此,多模态大模型接下来面临的一项关键挑战,就是能否将理解和生成统一在一个模型里。

目前,阶跃星辰正在朝着这个方向努力,并取得了一些阶段性的进展。在 WAIC 2024上,新升级的Step-1.5V千亿参数多模态大模型性能大幅提升,具备更出色的视频理解能力;新发布的Step-1X图像生成大模型,则是阶跃星辰首次推出多模态生成大模型。

在演讲的最后,姜大昕总结到,从千亿参数到万亿参数,从文本到多模,从多模理解到多模生成,标志着阶跃星辰在短时间内连续攀登上大模型的多个台阶,打造了行业领先的通用大模型矩阵。未来,基于强大的模型能力,阶跃星辰期待与众多领域的行业头部企业深度合作,共同探索积累大模型场景落地的经验,并为合作伙伴提供更多的价值。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
议程揭晓丨12月20日算力技术创新与应用系列论坛
2024-12-09 15:47:29
采访普洛斯数据中心郭仁声:智算时代 我们需要怎样的算力与数据中心
2024-12-09 11:44:05
5040机架 内蒙古云著智算产业园项目一期封顶
2024-12-06 14:24:19
马斯克超级计算集群再升级:xAI扩大GPU规模至百万
2024-12-06 14:21:34
未来10年的智算中心应该怎么建?|12月20日北京,AI算力建设系列论坛将启
2024-12-06 11:44:36
亚马逊发布超级计算机集群和新型AI芯片服务器
2024-12-05 14:54:16
12月20日北京,聚焦区域算力生态|2024算力产业生态高质量发展大会
2024-12-05 11:27:14
以用户需求为核心,科华数据领航高端定制数据中心新赛道
2024-12-04 15:52:50
英特尔CEO突然宣布退休 数据中心芯片竞争力不足或是主因
2024-12-04 10:12:00
莲花控股终止与新华三6.93亿订单:已自持700台算力服务器
2024-12-04 10:06:00
头部算力企业将悉数亮相、大咖云集,完整议程重磅公布|12月19-20日,北京,第十九届中国IDC产业年度大典重磅启幕
2024-12-04 09:54:00
总机柜1.8万个 兴业银行贵安新区数据中心开工
2024-12-03 10:07:00
SUSE推出一站式可观测性平台SUSE Cloud Observability 助力Rancher社区用户告别多工具监控
2024-11-28 15:19:38
800亿 17座数据中心落地马来西亚雪州
2024-11-28 14:53:32
5万机架 中国移动高原大数据中心(二期)开工
2024-11-28 14:47:35