Waymo和特斯拉都在做的事，“AI民工”要失业了“GGAI布道”

一套强大的传感器套件+神经网络的盘算“大脑”，是保证自动驾驶能够在感知车辆周围情况并做出宁静、合理决议的关键。

为了建设强健的神经网络，我们需要大量多样的训练数据。同时，通过真实路测和仿真测试来训练机械学习模型，并不停革新自动驾驶技术。

已往几年，在“人脸识别”、“自动驾驶”、“语音识别”等应用领域崛起的背后，焦点依然是要求精准的标注数据。

有数据显示，中国有10万名全职数据标注员和100万名兼职数据标注员，他们用人工标注为人工智能数据训练模型提供最重要的“燃料”。

一些所谓的AI公司，一年在数据收罗、标注外包业务上都要支付数百万甚至是数千万的用度。但这种依靠人工的数据标注，依然无法到达100%的准确度。

此外，传统收罗及分析数据的历程，大多是通过车队收罗、给样本数据贴标签的方式举行——这种方式既费时又花钱。让任务变得越发难题的是，某些情况不太可能经常发生。

为了充实使用边缘场景，并进一步改善自动驾驶系统的感知，一直以来Waymo与来自谷歌大脑的团队互助，扩展自动数据增强研究，并在数据集上举行测试。

一、增加没有新数据的数据集

数据的不停扩充使得自动驾驶训练可以增加数据量和多样性，而不需要分外的收集或标志成本。

扩凑数据背后的原理很简朴：假设你有一张狗的照片。通过使用种种图像增强操作，如旋转、剪切、镜像、颜色变换等，可以对照片举行变形和变换，但这并不能改变这是一张狗的图像的事实。

这些简朴的转换将一张狗的图像转换成许多张，只管确定使用哪些增强操作组合并应用它们需要大量的手工工程。

使用AutoAugment工具，谷歌大脑设计了一个由扩充计谋组成的新搜索空间——扩充操作的组合。他们能够通过强化学习自动探索使用哪些增强计谋。

通过从数据自己寻找最优的图像转换计谋，谷歌大脑能够革新种种学术数据集上的图像识别任务，并将这些思想扩展到COCO数据集上的工具定位问题。

他们还发现了一种方法，可以大大降低搜索有效数据扩展计谋的盘算成本，使其成为一种有效且廉价的工具，可以使用它来收集凌驾2000万英里的公共门路上的自动驾驶数据集。

二、应用到激光雷达点云

在谷歌大脑团队的协作下，Waymo正在扩展这项研究，以自动发现最佳数据增强计谋，从而革新现有Waymo Drive系统的感知能力。

在2019年，Waymo开始将自动数据增强技术从RandAugment应用到基于Waymo图像的分类和检测任务中。他们在几个分类器和探测器上取得了显著的进步，包罗那些有助于对外来物体(如修建物和动物)举行分类的分类器。

在基于图像的数据取得乐成后，Waymo探讨了自动数据增强计谋是否也可以改善激光雷达的3D检测任务。

激光雷达是Waymo的焦点传感器之一。它不仅能绘制出300米外的3D情况，还为自动驾驶技术提供了重要的配景数据，告诉系统物体在那里，它们可能去那里。

由于Waymo定制设计的激光雷达能够提供详细的三维信息，基于激光雷达的模型是系统的关键，并确保准确地检测和跟踪所有在门路上的物体。

为了提高激光雷达点云检测模型的质量和鲁棒性，通常接纳数据增强的方法，可是现有的增强计谋由于手工设计而受到限制。由于没有现成的点云扩展解决方案，Waymo决议自主构建一个。

与图像差别，扩大激光雷达点云是一个更庞大的整体维度。因此，用于图像分类和目的检测的自动增强技术的搜索空间不能直接用于点云。

由于三维数据中几何信息的性质，点云的变换通常有大量的参数，包罗几何距离、运算强度、采样概率等，而某些图像增强技术，如颜色变换，基础不适用于单色的三维数据。

因此，Waymo建立了一个新的点云扩展搜索空间，以发现专门为点云数据集设计的计谋。一种新的激光雷达点云增强计谋，建立的搜索空间包罗八个增强操作。

每个增强操作都与一个概率和特定的参数相关联。例如，GroundTruthAugmentor有参数表现采样车辆、行人、骑自行车的概率，而GlobalTranslateNoise操作有参数表现平移操作在x、y和z坐标上的畸变巨细。

为了自动地为激光雷达点云寻找良好的增强计谋，Waymo建立了一种新的自动数据增强算法——基于渐进种群的增强(PPBA)。

PPBA建设在谷歌之前的基于种群的训练(PBT)事情的基础上，Waymo用进化盘算训练神经网络，使用的原理类似于达尔文的自然进化论。

PPBA通过缩小每次种群迭代的搜索空间，接纳在已往迭代中发现的最佳参数，有效地优化扩展计谋。

通过在Waymo的开放数据集中自动增加激光雷达点云的数据，PPBA实现了跨越检测架构的显著性能革新。

开放数据集是迄今为止公布的最大和最多样化的多传感器自动驾驶数据集之一。Waymo的实验还讲明，与随机搜索或PBA基线相比，PPBA在寻找数据扩充计谋方面更快、更有效。

此外，由于依赖标志激光雷达数据来训练神经网络，PPBA还可以节约标志成本，从而提高数据处置惩罚效率，因为一个标志的样本可以变得许多。

Waymo开放数据集上的3D检测实验讲明，使用PPBA比不增加训练网络的数据效率高10倍。

三、从实现功效到提升效率

实验讲明，将自动数据增强技术应用于激光雷达数据，可以在不增加数据收罗和标志的情况下显著提高三维目的检测效果。

数据效率的提高尤其重要，因为这意味着Waymo可以加速训练历程，改善第五代Waymo Drive系统的感知能力。

在这方面，特斯拉也有很是类似的计谋来加速场景数据的积累。不外，和Waymo差别的是，特斯拉是基于庞大真实数据加速自动标注效率，Waymo则是基于有限数据的多元化标签效率，从降低对路测收集数据的压力。

特斯拉的创新，是一个名为3D自动标签工具，这被其视为全自动驾驶功效开发的重要组成部门。埃隆·马斯克最近证实，正在完成Autopilot焦点基础代码和3D标注的事情，基于其凌驾22亿英里的真实驾驶数据。

“在标识方面，所有8个摄像头同时使用视频举行标识，比原有系统提升三个数量级的效率。“特斯拉的人工智能主管安德烈•卡帕西(Andrej Karpathy)表现，标注数据是一项成本极高的焦点技术。

此前，大多数人工智能及自动驾驶公司接纳人工处置惩罚方式，但特斯拉一直在实验差别的机制来完善自动化标注平台。

好比，在预测其他车辆切入本车道场景，特斯拉使用其车队获取此类可能造成事故的数据。然后，这些信息被自动注释并用于训练神经网络，而神经网络又从可识此外模式中自我学习。