本公众号前一篇文章,分析了华为智驾ADS和特斯拉FSD研发路线的不同,得出了特斯拉路线是正确的结论,很多读者看了不服,可能是我写的比较快,有部分意思没有表达清楚,本篇补充说明一下。
首先,有很大部分读者留言说华为也有纯视觉的智能驾驶,比如在问界M7和智界S7的低配版本上面就有纯视觉的,然后说纯视觉的也是深度学习算法。这里概念比较多,容易混淆,解释一下:
智能驾驶的数据可以分为两类,第一类是视觉建模数据(采集数据用雷达和摄像头等),第二类是驾驶操作数据(驾驶员刹车超车避让等),这两类要结合起来才可以训练深度学习的智能驾驶模型,华为的驾驶操作数据(第二类)不够,不足以训练深度学习网络。
一句话:目前华为汽车的驾驶数据积累,根本不足以让华为通过深度学习算法训练出智能驾驶的能力。
华为选择用高端雷达的智驾方案是迫不得已的!
华为概念的汽车是从2023年才开始上市,到现在全国也没有几台,这一年多的驾驶数据,是根本无法训练一个多维度多层次的深度学习神经网络结构的,更不用说Transformer架构的大模型。而特斯拉汽车是2008年就上市了,至今已经15年的时间了,仅2023年全球交付量就有180万台,而且一开始就是纯电动的,带智能的,这么多年积累的驾驶数据量,足以支持特斯拉采用纯视觉模式的Transformer大模型训练FSD。
华为目前用的视觉算法,是用于视频物体识别,再配合雷达探测和传感器等高级设备采集数据,合并进行3D物理建模,把路面上的物体都3D建模,然后再通过距离和速度的算法,来自动驾驶汽车。这里面要说用到深度学习技术的部分,也就是视频物体识别,不可能用到自动驾驶的训练上,更不可能采用大模型架构!用脚趾头想就知道,华为目前的驾驶数据量(第二类)根本不支持它训练深度学习的智能驾驶模型!
其次,比较一下两个智驾算法的特点。
非深度学习神经网络算法的智能驾驶(华为)的特(que)点在于:这类程序是无法穷举路面的情况的,要知道在行驶中,没有任何一台车看到的情况是一样的,同一台车每天同一个时间经过同一个地点看到的也是不一样,程序路径根本没办法穷举所有情况,所以必然会遇到那种从来没遇到过的exception,然后需要人类立即接管。而且这类算法的指令运行判定路径不同,遇到不同情况程序反应时间是不确定的。
而使用深度学习神经网络算法的智能驾驶(特斯拉)的特点在于:它不需要用穷举,在遇到训练时未见过的情况可以做到举一反三,因为深度学习神经网络算法可以自动找出事物之间的内在联系和本质规律,这些联系和规律可能人类都还没有觉察到,而且可以不断迭代进化,在模型训练稳定以后,推理的时候,推理时间非常确定(依赖网络隐层数),每步智能操作反应时间都可以量化。
最后,就是笔者一直强调的技术伦理问题,华为的算法解决不了,上一篇已经说得很清楚,这里就不说了。
当然,华为也可以慢慢步进到深度学习的智能驾驶路径,然而这个过程需要巨量的数据,华为的车太少了,数据积累太慢了,可能需要很久很久的时间。目前华为选择用高级雷达的智驾路线,是迫不得已的。
不过,中国的智能汽车越来越多了,“如果”所有车企可以一起共享驾驶的数据,那么应该很快就能够训练出深度学习的智驾大模型的,但这个“如果”,就需要很强的组织协调能力了,毕竟驾驶数据对于每个车企可是一种数据资产,是宝贵的商业财富,也是每个车企的护城河,共享很难实现吧。
Views: 0