新势力集体拥抱“端到端”

如题所述

1. “再不努力工作,你就要被AI淘汰了。” 2024年伊始,伴随着Sora红遍全球,社畜们陷入了新一轮的AI焦虑之中。 与此同时,站在智能驾驶行业前沿的大佬们,却从中看到了无限的希望。
2. 近日,《汽车产经》围绕着Sora对智能驾驶行业的启示,面向夏一平(极越CEO)、刘涛(智己汽车联席CEO)、杨泓泽(车联天下CEO)等行业专家进行了简单的问卷调查,问题如下。
3. 极越CEO夏一平问卷结果关于前两个问题,几乎所有受访嘉宾都选择了非常同意。因为在他们眼里生成视频只是Sora的表象。 在 OpenAI的官网上,关于 Sora 的研究论文被命名为《把视频生成模型作为世界模拟器》。 “世界模拟器”(world simulators)是比“生成视频”更关键的存在,也是Sora真正令人兴奋的地方。
4. “只有让AI像人一样认知和思考问题,实现端到端的架构部署,我们才有机会真正达成无人驾驶。” 一位不愿具名的受访者说道。 事实上,目前整个智能驾驶行业也确实在顺着这个方向向前探索。
5. 在Sora爆火之后,马斯克很快就转发了一条特斯拉2023年的视频,并表示特斯拉拥有世界上最好的现实世界模拟和视频生成能力! 视频中,特斯拉通过AI生成了七个不同角度的驾驶视频,只要输入“变道”或者“转弯”等指亩慎判令,七个视频就能同步发生变化。
6. 由于特斯拉生成的视频只用于模拟车辆行驶,所以和Sora生成的视频相比,场景相对单调。 但在马斯克看来,二者的AI的能力是不相上下的,区别只在于他们将这种能力用到了不同的领域。
7. 去年8月,马斯克直播测试了特斯拉的FSD V12版本,并自豪地表示特斯拉首先跑通了端到端的智能驾驶架构; 2月中旬,特斯拉将FSD V12向部分普通用户推送,标志着端到端的架构初步走向商业化落地。
8. 据了解,在FSD V12中,工程师删除了30万行定义驾驶规则的C++代码,并省掉了传统智驾系统的感知、预测、决策、控制等模块,转而向系统输入数以百万计的人类驾驶视频,使其学习像人类一样应对真实的驾驶状况。 最终做到以感知数据为输入,直接输出用于车辆的控制指令,全部过程都靠神经网络模型来完成,而不是像过往那样,按照设置好的规则执行具体的命令。
9. 端到端智能驾驶系统示意这正是端到端模型的核心,它和Sora都在试图让AI拥有人类一样的发散和逻辑能力。 特斯拉和OpenAI这两个充满爱恨纠葛的企业,用不同的方式展示了:当大模型对世界有了理解和模拟,会带来多大的突破和想象空间。
10. 随着大模型一次又一次惊艳世人,拥抱端到端架构已经成为了智驾行业主旋律。 新势力们争先恐后地跟进这条路线,并未很多人表示可以在国内拿出比特斯拉FSD更加卓越的体验。
11. 行业转向端到端架构的方向是非常明确的。 特斯拉虽然有一定领先,但极越在中国的落地能力一定更强。” 极越CEO夏一平自信地表示。
12. 同时,迅改他还认为,不管是ChatGPT还是最近的Sora, AI发展越来越像人类自己,因此Sora对智驾研发本身有很大的启发。
13. 智己汽车联席CEO刘涛同样认为,Sora进一步印证了端到端路线的正确性,目前智己汽车也正在全力推动端到端架构落地,创造“更像人”的智能驾驶体验。
14. 另外,蔚来已经确定将在年内推出基于端到端的主动安全能力; 理想的端到端模型也在全力加速中,并且基于其销量规模的领先,很多专家看好其能够后来居上。
15. 当然,仅从宣传口径上来看,小鹏是国内新势力中走得最快的。 1月份,何小鹏宣称:“端到端大模型已经在运用中展现出了足够的优越性。 小鹏汽车将在2024年内推动其全面上车,并且在北上广深等核心城市实现千公里被动接管次数小于1次的目标。”
16. 2022年10月份,小鹏在广州落地全国首个城市NGP时,对外表示其城市NGP在预测、规划、控制模块的代码量是高速NGP代码量的88倍,而感知模块的神经网络模型数量是高速NGP的4倍。
17. “大模型团队成立之后,发现特别多的泛化代码变成了相对简单的端到端模型,车辆在感知、控制方面都表现得比想象中更聪明。 它甚至可以理解‘前方ETC维修,请变道’的提示。” 何小鹏说道。
18. 小鹏汽车董事长何小鹏
19. 除了更高的功能上限,结构的简化还带了更高的效率和更优的功耗。 例如小鹏XNGP早期架构,仅负责动态感知的XNet就要耗费一颗OrinX算力的122%。 优化之后仅用9%的OrinX算力就实现了同样功能。
20. 省下来的车端算力,可用于更多功能或更强性能,进一步提升系统的功能上限和鲁棒性。 总而言之,为了获得更强的能力而不断堆叠的代码,对车企来说是“越来越沉重的负担”,与追求更加简洁的系统原则是相悖的。
21. 而端到端的智能驾驶在功耗、效率、性能上都展现出了足够的优越性。 更重要的是,它有机会彻底突破corner case对于行业制约,已经被行业当作终极的技术路线,但并非所有人都有能力跟进这条路线。
22. 从普通架构转型端到端的智能驾驶,对于车企而言意味着部分颠覆掉过去成果和积累。 同时在算力、数据量和人才、资金等方面都会有更高的要求。
23. 有行业专家甚至预言:“全世界大约只有10%的玩家有能力完成架构的切换。”夏一平认为“相比Sora所展现的AI水准,我们(国内)的AI在数据量、质量、模型和算力上都还有很大的差距,当然最关键差距在人才上。”
24. 具体来看,虽然端到端架构省略了大量的基础代码,大大提升了自动化程度。 但仍需人类工程师手写代码来完成筛选数据、处理数据、组织模型训练等工作。
25. “这些代码少而精,需要基础扎实、经验丰富的工程师团队反复试错、验证。 这样的人才,在国内少之又少。”一位智驾从业者说道。
26. 数据源:工信部 图源:前瞻经济学人
27. 除了人才,端到端架构需要的数据量成倍增长,数据质量要求更高,这也意味着需要更高算算力的超算基础设施。
28. 截止到去年底,初步实现端到端智驾落地的特斯拉FSD Bate累计行驶里程为12.9亿公里。 据悉,在 FSD V12 版本训练初期中,特斯拉便投喂了约 1000 万个特斯拉车主的驾驶视频片段。
29. 相比之下,小鹏的智驾累计总里程还不到6亿公里,新势力中销量最突出的理想智驾里程也只有5.6亿公里,在数据规模上和特斯拉还有较大差距。
30. 除了数据量的差距,从这些难以计算的数据中,找出可以用于训练的有效数据,是另一个重要的挑战,它不但需要好的模型,更需要强大的算力基础。
31. 依据公开资料,截止到2023年8月,特斯拉能提供 10EFLOPS 规模的算力。 国内厂商中,领先的华为拥有2.8EFLOPS算力;吉利星睿中心算力为 810PFLOPS(1EFLOPS=1000PFLOPS),理想汽车、毫末智行和小鹏汽车的算力分别为 750PFLOPS、670PFLOPS 和 600PFLOPS。
32. 另外,无论是人才、数据还是算力,最终比拼的都是金钱。 按照计划,特斯拉今年将会在超算集群上再投入15亿美元,到年底让总算力提升到100EFLOPS。 小鹏在年初也宣布要拿出35亿人民币投向智能驾驶相关的AI技术研发。
33. 所以,端到端的智能驾驶,比拼的不仅仅是技术储备。 更多的时候PK的是企业的综合能力,尤其是和销量规模息息相关的数据的数量与质量,最有可能扮演胜负手的角色。 而这一切都决定了智驾行业未来几年会随着汽车行业一起快速走向集中化。
34. NO.3[实现“端到端”没那么简单]从普通架构转型端到端的智能驾驶,对于车企而言意味着部分颠覆掉过去成果和积累。 同时在算力、数据量和人才、资金等方面都会有更高的要求。
35. 有行业专家甚至预言:“全世界大约只有10%的玩家有能力完成架构的切换。”夏一平认为“
温馨提示:答案为网友推荐,仅供参考
相似回答