Nvidia宣称其AI可以解决视频通话中的一些最大问题

作者：admin浏览数：2020-10-07 09:11:18

Nvidia宣布为开发者推出一款名为Nvidia Maxine的新视频会议平台，它声称可以解决视频通话中最常见的一些问题。Maxine将使用Nvidia的GPU在云端处理通话，并在人工智能的帮助下以多种方式提升通话质量。

利用人工智能，Maxine可以重新调整呼叫者的脸部和目光，让他们始终直视摄像头，通过只传输 "关键的面部点"，将视频的带宽要求 "降低到H.264流媒体视频压缩标准要求的十分之一"，并提升视频的分辨率。Maxine提供的其他功能还包括人脸重光、实时翻译和转录，以及动画头像。

当然，并非所有这些功能都是新的。视频压缩和实时转录已经很常见了，和已经在 Pro X和FaceTime中引入了目光对准功能，以确保人们在视频通话时保持目光接触。但Nvidia无疑希望其在云计算领域的影响力以及令人印象深刻的AI研发工作能够帮助其超越竞争对手。不过，真正的考验将是看是否有成熟的视频会议公司真正采用Nvidia的技术。Maxine不是一个消费者平台，而是一个供第三方公司改进自己软件的工具包。不过到目前为止，Nvidia只宣布了一项合作--与通信公司Avaya合作，后者将使用Maxine的部分功能。

在与记者的电话会议上，Nvidia负责媒体和娱乐的总经理Richard Kerris将Maxine描述为一个 "真正令人兴奋和非常及时的公告"，并强调其AI驱动的视频压缩是一个特别有用的功能。他表示："我们都经历过这样的时刻，在我们现在每天进行的会议中，带宽一直是一个限制，如果我们将AI应用到这个问题上，我们就可以重构两端的差异场景，只传输需要传输的内容，从而大幅降低带宽。"

Nvidia表示，其压缩功能使用了一种被称为生成性对抗网络或GANs的AI方法，在云端部分重建呼叫者的面孔。这也是许多深度伪造中使用的技术。人工智能软件不是将整个屏幕的像素进行流式传输，而是分析通话中每个人的关键面部点，然后在另一边的视频中智能地重新生成面部，该公司在一篇博客文章中表示，这使得在互联网上来回传输数据量少得多的视频流成为可能。

Nvidia宣称其AI可以解决视频通话中的一些最大问题

Nvidia宣称其AI可以解决视频通话中的一些最大问题

相关软件

相关文章

推荐文章

评论

热门评论