为什么不建议你买一台“纯视觉”的智能驾驶汽车

近日，太平洋汽车和易车网对于多个热门车型进行了AEB性能的横向评测，测试过程非常精彩。

如下是部分测试结果：

图片来源：太平洋汽车（https://www.bilibili.com/video/BV1MrdUYvEZ4/）

图片来源：易车（https://www.bilibili.com/video/BV1hMLRz8EHV/）

其中，从测试结果来看，排名靠前的车型基本均是采用视觉+雷达的融合感知方案。

最近，智驾安全在行业内也备受关注，因此本文再探讨一下这个老问题：“纯视觉”是不是智驾的演进方向？

特斯拉是“纯视觉”方案的最早发起者，其出发点是“第一性原理”：既然人可以只通过眼睛开车，那么机器也可以。

本文尝试探讨一下到底什么是“第一性原理”，人类驾驶和智能驾驶的区别，以及为什么不建议买一台“纯视觉”的智能汽车。个人观点，未必准确，欢迎批评指正。

01“纯视觉”和“第一性原理”的定义

1. “纯视觉”

从字面意思来说，“纯视觉”是指汽车智驾的传感器配置只采用视觉传感器（即摄像头）。

目前严格的“纯视觉”主要是特斯拉，全车采用了7个摄像头，没有任何的激光雷达、毫米波雷达和超声波雷达。大疆成行平台也有完全没有雷达的传感器配置方案。

而其他“纯视觉”的方案，并非严格的“纯视觉”，只是没有激光雷达，而依然使用了毫米波雷达和超声波雷达。例如：小鹏是11V3R12U、华为ADS基础版是10V3R12U、理想AD Pro是10V1R12U、乐道是11V1R12U、极越是11V5R12U等等。

图片来源：盖世汽车

本文所讨论的“纯视觉”主要是指严格的“纯视觉”，即仅使用摄像头，不使用任何激光雷达、毫米波雷达和超声波雷达。

2. “第一性原理”

“第一性原理”最早源自古希腊哲学，亚里士多德在其著作《形而上学》中首次提出了这一概念。他认为，第一性原理是“不可被进一步推导的最基本的命题或假设”，即所有知识和推理的终极基础。

简单来说，每个系统中存在一个最基本的命题，它不能被违背或删除。其核心思想是：回归事物的本质，剖析最基本的原理和假设，从而构建新的认知框架或解决方案。

“第一性原理”不仅是科学研究的重要方法论基础，也成为许多创新者和思想家用以颠覆传统认知的工具。通常可以分解为以下三个步骤：

1-分解问题：将复杂的问题拆解为最基本的组成部分，找出其中不可再分的核心元素。
2-质疑假设：对现有的假设和框架提出质疑，剔除那些未经验证或可能错误的预设前提。
3-重新建构：基于第一性原理，构建新的解决方案或理论框架。

埃隆·马斯克将“第一性原理”的思想，应用在特斯拉汽车、脑机接口和SpaceX等产品的开发中，马斯克表示：

“借助第一性原理，我将事物的本质提炼出来，从最基础的层面进行推导……”
“采用第一性原理来思考问题，而非依赖比较思维，至关重要。我们常常习惯于比较，别人做过或正在做的事情，我们也跟着做，如此一来，只能实现微小的逐步改进。第一性原理的思维方式是从物理学视角审视世界，即一层层剥离事物的外在表象，洞察其内在本质，再从本质出发逐步构建。”

因此，马斯克所理解的“第一性原理”思维模型就是——追溯事物的根本，重新思考行动方式。

与“第一性原理”相对的是“类比思维”。“类比思维”是指基于已有的知识、经验或现象，进行推测和判断，例如“如果类似的事情在过去是这样，那么现在也应该如此”。

“类比思维”在日常生活中非常常见，因为它简便快速，并且在很多时候都可以得到正确的决策。然而，“类比思维”往往依赖于既有视角，而忽略了事物的本质。

所以相比之下，“第一性原理”要求摒弃已有的框架和假设，从最基本的真理或者最初的需求出发，重新构建认知体系。这种方法虽然耗时费力，但却能够帮助我们剔除经验主义的干扰，更深刻地揭示问题的本质，从而突破传统的限制，找到创新的解决方案。

3. 自动驾驶的“第一性原理”

对于自动驾驶来说，马斯克说：既然人可以只通过眼睛开车，那么机器也可以。

所以，特斯拉的观点是，既然人只是通过视觉来开车，那么自动驾驶也应该只使用视觉来开车。

从上述“第一性原理”和“类比思维”的定义来看，上述逻辑恰恰是典型的“类比思维”，而不是“第一性原理”。

甚至有网友表示，如果“人开车只用眼睛”是第一性原理的话，由于人只有一双眼睛，那么汽车上超过两颗摄像头以外的部分，是不是也应该被拿掉？甚至，应该开发一个两只眼睛的机器人来开车，而不是开发域控制器和在车身上安装摄像头？

在2025年4月的禾赛发布会上，李一帆表示，如果用这种“第一性原理”造车，车应该是用腿走路的：

使用“第一性原理”的飞机（扑翼机）：

这种飞机“耽误”人类“起飞”165年：

那么，自动驾驶的“第一性原理”到底是什么呢？

自动驾驶是解决出行的问题，而出行的本质是人们希望“安全、舒适、快捷地从A点到B点”。

因此，如果从“第一性原理”出发，应该围绕“安全”、“舒适”和“快捷”的原始需求，去设计自动驾驶系统。而不应该看人类怎么开车，自动驾驶系统也应该怎么开车。

02从“第一性原理”出发，人驾是最优解吗？

目前智能驾驶系统的感知和控制系统很难与人类眼睛和大脑相比。

同时，即便智能驾驶系统达到了人类的相同水平，人驾也不是出行“第一性原理”的最优解。

1. 人类眼睛的感知能力远高于摄像头

人类的双眼经过几百万年的进化，目前是一套精密的“双目可变焦360°”视觉系统。

人类每个眼球的FOV大概是水平120°，垂直60°，角分辨率约为0.005°，折算像素大概为5.76亿。（来源：https://cloud.tencent.com/developer/news/876314）

图片来源：https://zhuanlan.zhihu.com/p/20263068

晶状体可以通过拉伸和收缩，获得不同的焦距，通过“无极变焦”，使得人类可以看清远处和近处的目标。

加上配合头部的旋转，因此可以实现360°的视角。

目前，没有任何摄像头可以达到人类眼睛的感性性能。

2. 人类开车也不是出行的最优解

即便有一天科技的进步，机器的能力真的达到了人类的水平，这样就够了吗？

根据Waymo的统计，人类司机的事故率是每百万英里2.78起事故，即1起/57.8万公里。（数据来源：https://zhuanlan.zhihu.com/p/673632392）

据了解，全球每年约发生400万起交通事故，导致约130万人死亡，受伤人数超过2000万。

其中，人为因素占比60%-70%（超速、酒驾、疲劳驾驶、分心驾驶等），车辆因素占比10%-15%（刹车失灵、轮胎爆裂、灯光故障等），道路与环境因素占比20%-25%（雨雪、大雾等）。（数据来源：https://22.xtlcw.com/post/7346.html）

视频来源：太平洋汽车

因此，许多驾驶辅助系统开始逐渐应用，用于降低驾驶员的操作负荷，提升行车安全性，降低事故率。例如各种基于雷达和摄像头的AEB系统、BSD系统和车道保持系统。

所以，即便是人类自己开车都无法保证足够的安全性，还需要其他系统辅助人类开车。

那还还远未达到人类能力的“纯视觉”系统，为什么就有信心是从“第一性原理”出发的最优解了呢？

根据埃隆马斯克自己的建议，自动驾驶系统的安全性应该比人类驾驶员安全10倍。（来源：https://www.thepaper.cn/newsDetail_forward_14545325）

03为什么“纯视觉”有安全隐患

1. “纯视觉”方案安全性缺陷

1）探测原理

摄像头、激光雷达和毫米波雷达的工作原理不同，它们各有优劣势，对比如下：

其中，摄像头可以提供的信息最多，不过激光雷达和毫米波雷达可以提供更为准确的距离和速度信息，并且光线和天气的适应性更强。

图片来源：中国信通院、浦银国际

2）视觉容易失效的场景

视觉采用被动测量方案，因此外部环境对于感知性能的影响巨大。

摄像头在在诸多场景会发生致盲失效或者性能大幅衰减，例如：隧道口、大灯眩光、暗光、背景重合等等。

图片来源：灵明光子

其中，对安全性影响最大的是：

在低光照环境下，如夜晚或室内停车场，相机图像的信噪比大幅降低，导致物体检测误差和有效监测距离均大幅恶化。强光直射时，相机过曝会严重影响相关区域的目标识别，甚至完全致盲。
对于不规则物体（翻倒车辆、树木等）、无纹理物体（例如白色卡车、玻璃幕墙等低对比度目标），视觉容易出现漏判或误判。

值得一提的是，在这其中很多场景的视觉失效，并非是可以简单通过算法优化来进行弥补的，例如：

3）小米SU7的事故

在2025年3月29日的小米SU7事故中，事故车从发出接管到车祸发生，时间不到3秒。据小米官方介绍，小米SU7标准版的FCW和AEB两个子功能不响应锥桶、水马、石头、动物等障碍物。

图片来源：小米汽车《关于大家关心问题的回答》

本次事故发生在低照度的夜晚，视觉检测距离不足导致预警时间过短，AEB不识别特殊目标，和事故车没有搭载激光雷达有很大的关系。

图片来源：小米汽车《小米SU7答网友问（第五集）》

4）针对特斯拉FSD的调查

2024年10月，特斯拉的全自动驾驶（FSD）功能在美国遭遇了重大调查。此次调查由美国国家公路交通安全管理局（NHTSA）缺陷调查办公室发起，原因是在能见度降低的区域，启动了FSD功能的特斯拉车辆发生了多起碰撞事故，并造成了人员伤亡。

据NHTSA的公告显示，此次调查涉及约241万辆特斯拉汽车，调查将重点评估FSD系统在道路能见度降低情况下的监测和应对能力，并进一步排查是否还有其他类似事故的发生。值得注意的是，此次调查涉及的四起事故中，有一起事故造成了一名行人死亡。这些事故均发生在特斯拉汽车开启FSD功能驶入能见度降低的道路区域时。

根据《华尔街日报》2024年公布的一份调查显示，在实际应用场景下，特斯拉纯视觉方案表现很不稳定。视频公布的12个车祸画面中，有8个发生在夜晚，有2个发生在凌晨或黄昏光线不佳的情况，夜晚和光线不佳的车祸占比高达83%。