据外媒报道,卡内基梅隆大学机器人学院(CMU RI)的科学家正在研究一种可以解读人类肢体语言的计算机系统,其识别范围甚至可以缩小到手指。这个新进程可以实时运行,为人们和机器交互开辟更自然的方式。

人工智能1

目前,人们与计算机交互主要限于打字、鼠标点击和触摸屏等。虽然智能语音交互技术也被添加到该列表中,但却很难让电脑识别人们的肢体语言。这些通常非常微妙,并且包括可以被物体或其他人遮挡的个体手指的位置的细节。除此之外,虽然大型数据库存在注释的面部表情和身体位置,但并没有任何手势和姿势。

智能云2

卡内基·梅隆机器人副教授Yaser Sheikh领导的团队找出了一些解决这个问题的方法。第一种方法是是通过让研究生站在摄像机前面,摆出数千种不同的姿势和手势,为计算机提供更多的数据。

第二种方法是颠倒了计算机解读姿势的通常顺序。计算机不是通过整体,而是通过手指、手臂,腿部和脸部等单独部位的动作或表情来进行解读。

第三种方法是在CMU的全景工作室的两层屋顶上装了500台摄像机,每拍摄一个动作都可以呈现出几百张图像。这使得计算机可以从数百个不同的角度来研究姿势。

博士生Hanbyul Joo表示:“单次拍摄可以让您看到一个人手部的500张图像,并自动注释手的位置。手由于太小无法被大多数设备注释,但是对于这项研究,我们只使用了31台高清摄像机,但仍然能够构建一个庞大的数据集。”

该团队正在努力如何从2D模型转换至3D模型以获得更好的识别效果。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-01-16 10:37:56
国内资讯 瞭望 | 前瞻2024人工智能四大趋势
2024年值得关注的是AI代理和无代码软件开发带来的“冲击波”。 <详情>
2023-12-25 16:19:17
市场情报 人工智能产业蓬勃发展的背后:智能算力走上C位,中国移动谋篇布局
随着人工智能产业的成熟,特别是今年以来大模型的爆发,智算中心逐步替代了数据中心进入大众视野 <详情>
2023-11-23 12:00:20
运维管理 康普观点:数据中心如何更快、更经济地利用AI
AI/ML 已经到来,并将成为人、企业和设备之间交互方式中更重要、更集成的一部分。 <详情>
2023-11-03 16:18:55
2023-09-28 16:45:39
市场情报 构筑数实融合新基点,“华为云杯”2023人工智能应用创新大赛圆满收官
大赛以“云聚园区 智享未来”为主题,特设“创客”与“企业”两大赛道,旨在强化企业创新主体地位,支持中小企业专精特新发展。 <详情>