手机版
扫描查看手机站

特斯拉首席AI科学家解释:自动驾驶汽车为何不需要激光雷达

来源:互联网/编辑:IT世界网/时间:2021-12-04

在手机上看

扫一扫进入手机端

打造全自动驾驶汽车需要哪些技术栈?对于这个问题的答案,企业和研究者有不同的理解。实现自动驾驶的方式有很多,从纯摄像头加计算机视觉到计算机视觉加高级传感器。

特斯拉一直是自动驾驶纯视觉方法的支持者。在今年的计算机视觉和模式识别会议(CVPR)上,首席AI科学家Andrej Karpathy解释了原因。

在CVPR 2021自动驾驶研讨会上,过去几年负责特斯拉自动驾驶的Karpathy详细介绍了公司如何开发出只需要视频输入就能了解汽车周围环境的深度学习系统。此外,他还解释了为什么特斯拉在同样使用视觉技术的自动驾驶汽车制造商中处于领先地位。

上周末,我们就特斯拉自动驾驶项目近期在CVPR的工作做了演讲,介绍了如何通过视觉神经网络提供高精度的深度、速度和加速度识别功能。这项工作的前提条件包括:能够处理数百万辆汽车的数据引擎、强大的AI团队和超级计算机。

-Andrej Karpathy(@ Karpathy)2021年6月21日

通用计算机视觉系统

深度神经网络是自动驾驶技术堆栈的主要组成部分之一。这个神经网络负责分析汽车摄像头捕捉到的道路、标志、汽车、障碍物和行人等物体。

然而,深度学习模型在检测图像中的对象时经常出错。正因为如此,大多数自动驾驶汽车制造商(包括Alphabet的Waymo)倾向于使用激光雷达,这是一种通过向各个方向发射激光束来创建汽车周围3D地图的设备。激光雷达的存在可以提供大量的附加信息,填补神经网络的空白。

然而,在自动驾驶仪堆栈中添加激光雷达将进一步增加整个系统的复杂性。Karpathy解释说,“首先,我们需要用激光雷达预先绘制环境地图,然后创建一个高清地图,添加所有车道、道路连接和红绿灯。这样,在测试期间,只需定位相应的地图即可引导车辆绕行。”

然而,为自动驾驶汽车创建各地区的高精度地图无疑是相当困难的。Karpathy说,“这些高清激光雷达地图的获取、构建和维护成本极高,而且很难扩大规模。这意味着我们很难保持整体基础设施的最新状态。”

特斯拉的选择是不在自动驾驶堆栈中使用激光雷达和高清地图。Karpathy指出,“车身周围有8个摄像头和视频,周围的一切都会在车内体现出来。”

自动驾驶技术必须找出车道在哪里,红绿灯在哪里,当前显示的是什么状态,会对车辆本身产生什么影响。此外,该技术方案必须具备在没有任何预定义道路导航信息的情况下完成定位工作的能力。

Karpathy承认,基于纯视觉元素实现自动驾驶确实比较困难,因为只有神经网络单独基于视频输入才能运行良好。但他也提到,“只要这个系统能够工作,它就会成为一个通用的视觉系统,可以部署在地球上的任何地方。”

有了通用视觉系统,您的汽车不再需要任何辅助设备。卡普西说,特斯拉已经在朝着这个方向前进。此前,该公司一直采用雷达和摄像头相结合的方式引导车辆完成自动驾驶。然而,最近特斯拉开始销售没有任何雷达的车辆。

Karpathy提到,“我们拆除了雷达装置,后续车辆只靠视觉识别引导行驶。”他补充说,特斯拉深度学习系统的自动驾驶效果已经达到雷达的几百倍。在这个阶段,雷达本身已经成为一种阻力,并“产生噪音”。

监督学习

特斯拉首席AI科学家解释:自动驾驶汽车为何不需要激光雷达

IT世界网 www.hnce.org 版权所有 豫ICP备10007855号-1

IT世界网游戏下载基地温馨提示:适度游戏娱乐,沉迷游戏伤身,合理安排时间,享受健康生活

免责声明:本站部分内容、图片来自于网络及其他公共渠道,内容仅供参考。版权归原作者所有,如涉及作品内容、版权和其它问题,请发邮件通知我们,我们将在第一时间处理。