OPPO斩获全球计算机视觉顶级会议CVPR 2020两项第一

  PingWest 品玩 6 月 17 日讯。在今年的全球计算机视觉顶级会议 CVPR(Conference on Computer Vision and Pattern Recognition 国际计算机视觉与模式识别会议)上,OPPO 获得两项第一名、两项第三名。

  OPPO 获得第一名的技术成果为将模糊图片”算“清晰的“极端超级分辨率感知”技术;此外,通过照片计算拍照方位的”手持设备视觉定位”技术则获得第三名和分项第一;通过读取录像智能识别其中人类行为的“长视频行为识别”技术,同时获得第三名。

  除 OPPO 研究院智能感知与交互研究部之外,OPPO 美国研究所也在 CVPR 上展露风采,取得“真实世界超分辨率图像处理技术”(Real-World Super-Resolution Challenge:Track 1: Image Processing artifacts)第六名的成绩,OPPO 美研所时空实验室主管孟子博在 CVPR 做了暗光影像技术演讲“穿透黑暗:从图像到视频”(Looking into the dark: from image to video), 美研所 AI 计算机视觉高级技术总监全书学做了“从零开始构建可在智能手机和 AR 眼镜上运行的统一 SLAM 系统”演讲(Building a unified SLAM system running on both smartphone and AR glass from scratch)。

  “极端超分辨率感知”( Perceptual Extreme Super-Resolution)是 CVPR 难度最高的赛项之一,要求从模糊的低分辨率图片中,获得细节更清晰、更接近真实情况的高清图像。这是计算机视觉技术中难度最大的领域之一,需要尽可能地平衡图像的画质与真实性。针对这项挑战,OPPO 提出了独创的神经网络架构 RFB-ESRGAN,通过更智能的方式提取原图特征,用分布式算法提高计算效率,以更多元的采样与计算模型配合,通过计算把模糊的图片清晰放大了 16 倍,从全球 280 多个顶尖参赛团队中脱颖而出,获得了第一名,其他参赛者,不乏来自脸书、百度、微软、亚马逊、中科院、UIUC 等国际顶尖科技公司与院校的团队。

OPPO 极端超分辨率感知处理效果,最左侧图片红框内为原图,最右侧为最终结果

OPPO 极端超分辨率感知处理效果,最左侧图片红框内为原图,最右侧为最终结果

  这项技术将在未来为诸多应用场景提供帮助,例如将用户手机拍摄到的模糊影像处理成细节丰富的高清效果,修复图像受到损坏的老照片、老电影,或者对卫星、航天图像进行细节分析等工作。

人工智能程序对图片从多维度进行分析
人工智能程序对图片从多维度进行分析

  在“手持设备视觉定位”挑战(Visual localization for handheld devices challenge)中,OPPO 获得了面向室外场景的数据集(Aachen Day-Night)第一名,与面向室内场景的数据集(InLoc)第三名。“视觉定位”是通过搜集和分析图像中的海量信息,对自身拍摄方位作出精确判断。这一技术对未来的 AR 眼镜,智能机器人,精准导航等应用都能起到重要作用。例如,当智能机器人助手安装了摄像头之后,就可以利用视觉定位技术对拍摄到的图像作运算分析,获得准确定位,从而精准的移动。

  此外,OPPO 还在“长视频行为识别”(Activity detection in extended videos)赛项中获得了第三名。“视频行为识别”是指在某段视频中分析并判断人或物体对象的行为动作。OPPO 的智能程序可高效识别并重组每一帧画面中的人物,辨别复杂动态视频中的人类行为。在一段数十人出镜的长视频中,它准确识别了视频中每个人走动或是聊天等的数十种动作。这项技术在未来能广泛应用在人机交互、运动分析等领域,例如未来的手机产品便可以自动识别正在运动的拍摄对象,并自动调节快门对焦。

  2020 年初,OPPO 研究院正式成立智能感知与交互研究部,邀请行业领军人物郭彦东博士加盟并担任 OPPO 智能感知首席科学家,领导快速组建并逐步完善专业科研团队。目前,智能感知与交互研究部已初具规模。此次 OPPO 参加 CVPR 2020 的多项获奖成果均来自该团队。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注