日前,亚马逊云科技为其机器学习数据标注服务Amazon SageMaker Ground Truth新增合成数据(图像)生成功能。客户使用这一新功能,可以生成数十万计已标注的合成图像,无需手动标注数据,提高标注的准确性,并快速获取高质量的训练数据集。该功能的推出让Amazon SageMaker变得更强大,作为亚马逊云科技机器学习服务层面的核心产品,亚马逊云科技不断丰富Amazon SageMaker的功能,仅2021年就推出60多项新的特性和功能。

机器学习(ML)模型构建是一个不断重复、迭代的过程,从数据收集和准备开始,然后是模型训练和部署。其中,为模型训练收集大量、多样化且准确标注的数据集,是非常具有挑战性并耗时的第一步。

以计算机视觉(CV)应用为例,在工业领域,该技术能够改善生产质量、提高仓库管理的自动化水平等,目前已在工业数字化和智能化发挥了关键作用。然而,为训练计算机视觉模型而收集数据的过程既耗时又费力,有时甚至几乎无法完成。为确保模型的准确性,数据科学家可能会花费数月时间,从生产环境中收集数十万张图像,尽可能涵盖数据的所有变化。但在某些情况下,例如,要获取罕见或价格昂贵的产品的缺陷的图像,只有通过故意损坏产品这种极端方式才能实现,这让数据科学家无法从真实数据中找到所有的数据变化。

收集完所有数据后,数据科学家团队还需要准确地标注图像,这又是一项艰巨的任务。手动标注图像进程缓慢且容易出现人为错误;同时,构建自定义标注工具和设置缩放标注操作可能既耗时又昂贵。将真实数据与合成数据相结合是缓解这一挑战的方法之一,让数据科学团队可以创建更完整和平衡的数据集并增加数据的多样性。

亚马逊云科技机器学习数据标注服务Amazon SageMaker Ground Truth,可以让客户创建任何图像数据,包括在现实世界中难以发现和复制的特殊场景数据。客户甚至可以自定义对象和环境的变量,例如反映不同的照明、颜色、纹理、姿势或背景。Amazon SageMaker Ground Truth让数据科学家可以为其正在训练的机器学习模型“量身定制”特定用例。此外,客户还可以选择Amazon SageMaker Ground Truth Plus,借助亚马逊云科技的专家团队创建高质量的训练数据集,无需构建用于标注的应用程序或自行管理标注的人员。

Plus One Robotics是一家物流机器人视觉软件开发商。Plus One Robotics 创始人、首席技术官Shaun Edwards 表示,“随着人力资源的减少以及仓库商品量的激增,客户希望我们能帮助他们处理仓库中千变万化的物品。新入库的商品可能是首次出现,或者只在特定情形下出现。使用合成数据能让我们预先对系统进行训练,以应对现实可能遇到的各种情况。我们使用Amazon SageMaker Ground Truth生成数以万计带标签的、来自不同承运商的逼真物品图像,对物品姿势、位置、甚至贴纸或标签之类的表面变化进行建模。合成图像使我们能够更快地训练性能更好的系统,其完整性和精确性使我们免去繁琐的数据标注和清洗步骤,每天为客户超过100万的运单提供支持。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-12-15 14:07:51
市场情报 加速本地创新 亚马逊云科技自研芯片Amazon Graviton3实例已落地中国
这些实例均基于 Amazon Nitro System构建,与采用Amazon Graviton2的实例相比,整体性能提升高达25%,内存带宽提升50%,同时能耗更低,能效提升高达60%。 <详情>
2023-12-06 10:57:45
市场情报 亚马逊云科技推出五项Amazon SageMaker新功能,助力规模化开发应用模型
随着模型不断改变各行各业的客户体验,Amazon SageMaker让企业更轻松快速地构建、训练和部署支持各种生成式AI使用场景的机器学习模型。 <详情>
2023-12-04 11:56:49
市场情报 亚马逊云科技宣布推出四项Zero-ETL集成特性,让跨数据存储的数据访问与分析更快速、更便捷
oAmazon Aurora PostgreSQL、Amazon DynamoDB、Amazon RDS for MySQL与Amazon Redshift的Zero-ETL集成特性使客户能够分析不同来源的数据,无需自行构建和维护数据管道 ; o <详情>
2023-11-14 11:44:45
市场情报 亚马逊云科技中国区域推出Amazon FSx for NetApp ONTAP 助力客户云端开启文件存储
通过Amazon FSx for NetApp ONTAP,客户无需改变其应用或管理数据的方式,即可在亚马逊云科技上启动、运行和扩展全面托管的NetApp ONTAP文件存储系统,并通过与亚马逊云科 <详情>
2023-11-03 15:32:12
云资讯 围绕5个核心因素 亚马逊云科技打造生成式AI普惠通道
在生成式AI领域,亚马逊云科技希望借助相关产品和服务,实现生成式AI技术的普惠化,赋能更多企业和个人开发者加速创新。 <详情>