英伟达希望用AI化身填充虚拟和物理世界

导读 Nvidia 宣布了一个用于创建名为Omniverse Avatar 的虚拟代理的新平台。该平台结合了许多离散技术——包括语音识别、合成语音、面部跟踪

Nvidia 宣布了一个用于创建名为Omniverse Avatar 的虚拟代理的新平台。该平台结合了许多离散技术——包括语音识别、合成语音、面部跟踪和 3D 头像动画——英伟达称这些技术可用于为一系列虚拟代理提供动力。

在公司年度 GTC 会议的演讲中,Nvidia 首席执行官 Jensen Huang 展示了一些使用 Omniverse Avatar 技术的演示。在其中一个数字亭中,一个可爱的动画角色通过快餐店的菜单与一对夫妇交谈,回答诸如哪些食物是素食之类的问题。该角色使用面部跟踪技术来保持与顾客的目光接触并对他们的面部表情做出反应。“这将有助于智能零售、免下车和客户服务,”该技术的黄说。

在另一个演示中,动画玩具版的黄回答了有关气候变化和蛋白质生产等主题的问题,在第三个演示中,有人在电话会议中使用了一个逼真的动画化身作为替身。来电者在繁忙的咖啡馆里穿着便装,但他们的虚拟形象穿着得体,说话时没有任何背景噪音。最后一个示例基于 Nvidia 的 Project Maxine 工作,该工作旨在借助机器学习修复来改善视频会议的常见问题(如低质量流和保持眼神交流)。

Omniverse Avatar 的发布是 Nvidia 不可回避的“omniverse”愿景的一部分——为一系列模糊的技术打造一个宏伟的品牌。与“元宇宙”一样,“全域”基本上是关于允许远程协作的共享虚拟世界。但与Facebook 所有者 Meta 提出的愿景相比,英伟达不太关心将您的办公室会议转移到虚拟现实中,而更关心用虚拟对手复制工业环境,以及——在其化身工作的情况下——创建与人互动的化身在物理世界中。

与这些演示一样,Nvidia 的演示看起来相当流畅,但尚不清楚这项技术在现实世界中的实用性。例如,对于自助服务终端的角色,与简单地从菜单中选择他们想要的项目相比,客户是否真的更喜欢这种交互式体验还不清楚。Huang 在演示文稿中指出,虚拟形象的响应时间为两秒——比人类慢,如果客户匆忙,势必会引起挫败感。同样,尽管该公司的 Project Maxine 技术看起来很闪光,但我们尚未看到它对现实世界产生重大影响。