3月1日深度神经网络是自动驾驶技术栈的主要组成部分之一
神经网络分析道路、标志、汽车、障碍物和人的车载摄像头信息。但深度学习在检测图像中的物体时也会出错。这就是为什么包括 Alphabet 子公司Waymo在内的大多数自动驾驶汽车公司都使用激光雷达的原因,这种设备通过向各个方向发射激光束来创建汽车周围环境的 3D 地图。激光雷达提供了可以填补神经网络空白的附加信息。
然而,将激光雷达添加到自动驾驶堆栈也有其自身的复杂性。“你必须用激光雷达预先映射环境,然后你必须创建一个高清地图,你必须插入所有车道以及它们如何连接以及所有红绿灯,”Karpathy 说。“在测试时,您只需定位到该地图即可四处行驶。”
创建自动驾驶汽车将要行驶的每个位置的精确地图是极其困难的。“收集、构建和维护这些高清激光雷达地图是不可扩展的,”Karpathy 说。“让这个基础设施保持最新状态是极其困难的。”
特斯拉在其自动驾驶堆栈中不使用激光雷达和高清地图。“所有发生的事情,都是第一次发生在车内,基于汽车周围八个摄像头的视频,”Karpathy 说。
自动驾驶技术必须弄清楚车道在哪里,红绿灯在哪里,它们的状态是什么,以及哪些与车辆相关。它必须在没有任何关于它正在导航的道路的预定义信息的情况下完成所有这些工作。
Karpathy 承认,基于视觉的自动驾驶在技术上更加困难,因为它需要仅基于视频源运行得非常好的神经网络。“但一旦你真正开始工作,它就是一个通用的视觉系统,主要可以部署在地球上的任何地方,”他说。
使用通用视觉系统,您的汽车将不再需要任何辅助装备。Karpathy 说,特斯拉已经在朝着这个方向发展。此前,该公司的汽车结合使用雷达和摄像头进行自动驾驶。但它最近开始运送没有雷达的汽车。
“我们删除了雷达,在这些车上只靠视觉行驶,”Karpathy 说,并补充说,原因是特斯拉的深度学习系统已经到了比雷达好一百倍的地步,现在雷达正在启动阻止事情并“开始制造噪音”。