阿里斩获AI领域 “奥斯卡” 四项冠军，新研究可精准预测视频目标位置

应用分类
游戏分类

阿里斩获AI领域 “奥斯卡” 四项冠军，新研究可精准预测视频目标位置

作者：admin浏览数：2020-06-29 15:38:47

CVPR 是 AI 领域规模最大的会议，被誉为计算机视觉领域“奥斯卡”，其范围涵盖计算机视觉领域的前瞻学术研究和工业应用，会议的研究成果体现着视觉 AI 领域研究的趋势。由于视频会议、直播等应用逐渐普及，2020 年顶级科技公司的研究成果逐步从图像延伸到视频领域，涉及视频压缩、视频分割、三维视觉等领域。

据介绍，阿里参加的四项比赛均为视频技术领域。在 DAVIS 挑战赛中，阿里达摩院团队率先实现突破，力压悉尼科技大学 ReLER 实验室，以 84.1 的分数获得了第一名，比 2019 年第一名的中兴和华中科技大学联合团队高出 7.4 分。

图 | 阿里 AI 以 84.1 分的成绩斩获 DAVIS 比赛第一名

具体来说，阿里参与的是 DAVIS 半监督赛道。要求是假设用户不与算法交互以获取分割掩膜，输入值只给出第一帧的正确掩膜，算法需要在后续每一帧中实现对单个或多个目标的分割，也就是要把目标的像素标注出来。

如上图所示，衡量分割准确率有两种标准，分别以 J 和 F 为代号，代表区域相似度（Region Similarity）和轮廓准确度（Contour Accuracy）。前者测量正确像素的标注数量，后者测量目标轮廓的分割有多精准。最终成绩是 J 和 F 标准的综合分。

图 | 阿里 AI 可以基于视频前一帧画面，精准预测目标物体下一帧的位置

作为对比，今年 DAVIS 挑战赛第二名 ReLER 实验室提出的 CFBI + 算法，原本领先基础 STMVOS 算法近 10 分，但阿里团队使用空间约束方法、新型训练策略和微调等技术，将基础算法的表现大幅提高了 12 分，摘下桂冠。

除获得四项比赛冠军，阿里还有 17 篇论文入选 CVPR 2020，其中包括一篇自动驾驶领域的研究成果，该论文提出了一个通用、高性能的自动驾驶检测器，首次实现 3D 物体检测精度与速度的兼得，可以有效提升自动驾驶系统安全性能。

目前，阿里视觉 AI 技术已在全球率先实现大规模落地。例如，城市大脑、拍立淘、优酷视频等阿里集团内部业务场景均已大规模使用该技术；阿里 CT 影像 AI 已经服务全球 600 多家医疗机构，疫情期间已完成 50 余万例病例临床诊断。

责编：胡巍巍

上一篇:5G发牌一周年，基站、终端门槛已破但入网依旧难下一篇:李开复：AI割韭菜的阶段已经过去了，怎么赚钱是重点！

相关软件

相关文章

推荐文章