在不久的将来,如果你看到两个“眼镜男”面对面热切交谈,却各自说着不同种类的语言,不要惊讶,他们很可能是佩戴了具有智能翻译功能的VR眼镜。这种眼镜可以将对方说出的话即时翻译成自己可以理解的语言并显示出来。

智能翻译VR眼镜,这正是字节跳动旗下火山翻译正在进行的一项产品研发。10月26日,在主题为“智算·新际”的2021人工智能计算大会(AICC 2021)上,字节跳动AI LAB机器翻译负责人王明轩为媒体记者展开了一副智能翻译的未来画卷。

字节跳动AI LAB机器翻译负责人王明轩

字节跳动AI LAB机器翻译负责人王明轩

依托字节体系 成就百亿量级AI翻译引擎

经过近10年的发展,字节跳动拥有了抖音、今日头条、抖音火山版等一系列爆款产品,同时也积累了丰富的场景解决方案和底层技术能力。为了将这些能力对外赋能,字节跳动了推出了面向企业业务的数字化中台——火山引擎以及一系列中台产品,火山翻译便是其中之一。

王明轩介绍,从品牌角度看,火山翻译可以看做火山引擎的子品牌。火山翻译承载了对内、对外两个方向的使命。对内是通过AI翻译支持字节跳动产品及业务,对外则通过企业业务将字节跳动的AI翻译能力赋能给需要的企业。

字节跳动业务场景差异极大。火山翻译不仅仅要面对100多个国家地区各自的官方语言,还要面对各式各样的方言,需要解决语言问题非常复杂。此外,包括抖音在内的字节跳动产品形式丰富,包含了视频、语音、静态和动态图像等等,都需要做到准确、迅速的翻译。

一个是多语言,一个多模态。”王明轩概括性地描述了火山翻译要面对的问题。他表示,解决了这两个问题的火山翻译产品具备了极大的通用性。火山翻译因此拥有了很深厚的技术积累,也形成了独有的优势。

据介绍,目前火山翻译每天处理的字符数据量达到了百亿级。为了提升实时业务场景的翻译效率,以及AI数据训练的效率,火山翻译自研并开源了一款业内最快的一个推理引擎(LightSeq)。在硬件方面,通过与浪潮等伙伴的业务合作,火山翻译很好地解决了在AI训练和业务场景中的算力需求。

“字节跳动本身的业务就非常具有挑战性,”王明轩表示,火山翻译是随着字节跳动的发展和需求成长起来的。因此,在对外赋能的企业业务中,火山翻译很少遇到复杂程度或者场景差异度超过字节跳动自身需求的情况,能够有效地满足外部企业客户的需求。

全场景赋能 打造多语言无碍互通体验

翻译准确性一直是评判翻译质量的核心标准。

“在某些场景火山翻译的质量已经超过译员的平均水平。”王明轩介绍,火山翻译的准确性从整体看能达到80%以上。虽然距离尽善尽美的100%还有一定距离,但相对于人工翻译的平均质量已经有很大进步。

此外,相比于人工翻译,机器翻译的特点是使用简便,成本更低且具有随时随地性。对于未来,王明轩认为人工翻译将会聚焦在头部小场景需求,而机器翻译将成为满足更广阔、更丰富场景翻译需求的主力军。

这些场景可能包括在线文本翻译、文字及图片识别、实时会议翻译、对话即时翻译等。要做到这些,显然已经超出了“翻译”的范畴。

因此,火山翻译从本质看,是更多中台产品的一个集合体。这其中包括语音识别、TTS、图像识别、视频识别等中台能力。在字节跳动内部,将这些中台能力称为“原子能力”,意即不可分的最小能力。

“务实”,是王明轩对字节跳动一系列研发活动的看法。过去数年中,字节跳动开源了很多有影响力的代码、模型、数据,贡献了多篇前沿论文,并荣获ACL2021最佳论文。同时,在实际的场景应用中,包括火山翻译在内产品不断根据用户反馈进行迭代和改进,确保产品功能的最佳。

“我们要确保每一项原子能力都做到好,最后他们整合在一起的解决方案才是真正经受得起考验的。”王明轩表示。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-01-09 09:51:00
大数据资讯 下一个被AI抢掉饭碗的,会是字幕君们?
在笔译、口译之外,又有一种职业被认为会最先被AI所取代,那就是字幕组。毕竟字幕组的主要工作是翻译对话,比起翻译文章来说肯定会更容易被AI替代。但事实果真如此吗?AI带 <详情>