500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。

 

《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。

在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。

在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。

《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
【数字匠人】联想袁帅青:“一横五纵” ,打造布局完整稳定高效算力基础设施
2024-07-12 16:42:33
恒润股份:算力租赁业务营收“较为有限” 上半年业绩预亏
2024-07-12 16:36:22
通信出海新举措:工信部批复四地设立国际通信业务出入口局
2024-07-11 14:51:09
国家“东数西算”枢纽节点绿色算力指数研究报告: 和林格尔领跑
2024-07-11 11:01:00
面向GPU高功率未来,相变浸没式液冷做好准备了吗?
2024-07-08 11:54:00
天府智算西南中心投运!四川能投天府云42KW智算风冷算力仓正式交付使用
2024-07-08 11:19:00
2024中国绿色算力(人工智能)大会:和林格尔数据中心集群的崛起与展望
2024-07-08 11:03:31
天罡智算交易平台正式上线 并携手沙利文发布人工智能算力行业白皮书
2024-07-04 11:37:37
以“红船精神”照亮奋斗之路——中国航信教育培训基地
2024-07-04 11:16:13
数能共振 绿算领航 数据中心全生命周期绿色算力指数论坛在京举行
2024-07-03 09:55:23
2024中国绿色算力(人工智能)大会在呼和浩特开幕
2024-07-02 14:30:00
阿里云宣布关停两地数据中心服务
2024-07-02 10:16:40
投资5.27亿元、3840架,中移动一国际数据中心投产
2024-07-02 10:13:42
数据中心如何大幅提升绿电利用率?丨绿色算力产业观察
2024-07-02 09:59:19
走进和林格尔:产业链升级促进算力高质量发展
2024-06-28 15:24:39