滴滴自动驾驶:人脸检测算法创纪录,与伯克利产业联盟达成合作

商业
滴滴自动驾驶:人脸检测算法创纪录,与伯克利产业联盟达成合作
麻省理工科技评论 2019-04-27

2019-04-27

4 月 25 日,滴滴携手加州大学伯克利分校 DeepDrive 深度学习自动驾驶产业联盟(Berkeley DeepDrive)在京举办 CVPR 2019 自动驾驶预研讨会,会上滴滴正式宣布与 BDD 达成战略合作。
自动驾驶
4 月 25 日,滴滴携手加州大学伯克利分校 DeepDrive 深度学习自动驾驶产业联盟(Berkeley DeepDrive)在京举办 CVPR 2019 自动驾驶预研讨会,会上滴滴正式宣布与 BDD 达成战略合作。

在发展自动驾驶技术上,滴滴又在学术研究和产业合作上迎来新的进展。

4 月 25 日,滴滴携手加州大学伯克利分校 DeepDrive 深度学习自动驾驶产业联盟(Berkeley DeepDrive)在京举办 CVPR 2019 自动驾驶预研讨会,会上滴滴正式宣布与 BDD 达成战略合作。

滴滴自动驾驶:人脸检测算法创纪录,与伯克利产业联盟达成合作

(来源:BDD)

BDD 是由加州大学伯克利分校领导的研究应用于汽车领域的计算机视觉和机器学习前沿技术的产业联盟,全球范围内主要的自动驾驶公司和不少科技公司都已经加入这一产业联盟。根据滴滴和 BDD 的介绍,这次双方将围绕智能驾驶大主题,在前沿研究及应用落地、顶尖人才培养、学术交流等方向展开全方位的积极探索。

滴滴在自动驾驶技术开发上的最大优势之一在于其拥有非常好的交通大数据。此前 3 月,滴滴联合 BDD 启动 CVPR 2019 WAD 自动驾驶识别挑战赛,滴滴就提供一个大规模、高质量的真实驾驶场景视频数据集 D²-City(https://gaia.didichuxing.com/d2city),涵盖 12 类行车和道路相关的目标标注。

在今年 CVPR 2019 上,双方也将举办自动驾驶研讨会(WAD),基于伯克利 BDD100 K(史上最大规模自动驾驶视频数据集之一)、滴滴 D²-City 两个大规模、高质量真实驾驶场景视频数据集,组织目标检测、目标跟踪迁移学习挑战赛。

滴滴自动驾驶:人脸检测算法创纪录,与伯克利产业联盟达成合作

图丨滴滴出行信息安全战略副总裁、美国研究院院长弓峰敏博士与 BDD 主任、伯克利人工智能研究院(BAIR)联合主任 Trevor Darrell 教授(来源:滴滴)

而在最近的一项业内评测上,滴滴的人脸检测算法也崭露头角。

根据近日 WIDER FACE 公布的最新评测结果,滴滴 AI Labs 团队联合北京邮电大学 PRIS 团队提出的人脸检测 DFS 算法,在 Easy、Medium 和 Hard 三个评测子集的六项评估结果中取得了五项第一、一项第二的成绩。

WIDER FACE 是目前业界公开的数据规模最大、检测难度最高的人脸检测数据集之一,由香港中文大学于 2016 年建立,共包含 32,203 张图像和 393,703 个人脸标注。其中 40% 的数据为训练集(Training),10% 的数据为验证集(Validation),50% 的数据为测试集(Testing)。每个集合中的数据根据人脸检测的难易程度分为“Easy”、“Medium”、“Hard”。

其中,滴滴在“Easy”、“Medium”和“Hard”三个测试子集中,DFS 算法性能分别达到 96.3% AP,95.4% AP,90.7% AP。

由于汇集了人脸尺寸大小变化、拍照角度引起的人脸姿态变化、不同程度的人脸遮挡、表情变化、光照强弱差异以及化妆等多种影响因素,该数据集在全球人脸检测领域极具挑战性,每次评测均会吸引多家国内外科技巨头及高校院所(包含卡耐基梅隆大学、加州大学圣地亚哥分校、北航、浙大、京东、腾讯优图、百度、华为云、IBM 沃森研究院等)在这个数据集上验证了自己的算法效果。

滴滴自动驾驶:人脸检测算法创纪录,与伯克利产业联盟达成合作

图 丨验证集性能曲线图(来源:http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html)

滴滴自动驾驶:人脸检测算法创纪录,与伯克利产业联盟达成合作

图 丨 测试集性能曲线图(来源:http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html)

DFS 算法以卷积神经网络中的特征融合为切入点,为了防止高层特征图上的语义信息覆盖低层特征图上的细节信息,提出了特征融合金字塔(Feature Fusion Pyramid)结构,其以空间和通道注意力机制的方式融合高低层特征,在不失细节信息的同时将语义信息作为上下文线索(contextual cues)增强低层特征;另外,DFS 算法提出了一种辅助训练单阶段检测器的语义分割分支(Semantic Segmentation branch),促使检测网络以一种自监督的方式实现注意力机制以及学到更好的特征。

具体地说,DFS 算法独特的语义分割分支分层地利用更强的语义分割监督信息监督训练网络,使得用于预测人脸的各级特征图专注于各自最适宜检测到的不同尺寸的人脸。

滴滴自动驾驶:人脸检测算法创纪录,与伯克利产业联盟达成合作

图 丨DFS 算法网络框架图

目前,滴滴平台已经在广泛使用其开发的人脸检测和识别技术,用于司机人不符检测、行程中车内录像时的乘客隐私保护等场景等。

滴滴自动驾驶:人脸检测算法创纪录,与伯克利产业联盟达成合作

图丨滴滴的驾驶场景理解平台(来源:DeepTech)

除此之外,根据滴滴 AI Labs 资深研究员车正平博士、李广宇博士介绍,滴滴的AI Labs 也正在基于其海量真实驾驶数据开发一款驾驶场景理解平台,能基于驾驶场景理解、大数据分析与风险预测等能力提升出行安全与体验,同时也在构建智能驾驶模拟测试环境,加速滴滴智能驾驶系统优化迭代。


麻省理工科技评论

From Tech to Deeptech