特斯拉最重要的技术,开始大放异彩

小夏 娱乐 更新 2024-02-26

让我们先仔细看看这个**。

你能发现**中的内容是人工智能生成的吗?

在农历新年假期结束之前,OpenAI 的第一代模型 SORA 诞生了。

您所要做的就是输入提示,Sora 将根据您对现实世界内容的理解生成极其逼真的世界模拟。

SORA最令人惊奇的地方在于,它不仅对输入的文本反应迅速,而且还能主动理解物理世界,保持多个角色、镜头和视觉风格的一致性。

prompt:a chinese lunar new year celebration video with chinese dragon.(一条中国龙庆祝中国龙年**)。

输入以上提示后,OpenAI为我们展示了一段由SORA制作的庆祝新年的短视频,人物众多,元素多样,表情多样,生动得逼真。 **生成模型成功破圈,AI概念股占主导地位**,新时代到来的呐喊声不绝于耳。

这是属于AIGC的又一个,马斯克显然有话要说。

在与X(前身为Twitter)的评论互动中,马斯克说大约一年前,特斯拉能够使用精确的物理技术对世界进行逼真的模拟只不过大部分的训练**都是从开车**过来的,而且比较枯燥。

埃隆·马斯克(Elon Musk) **来自:法新社

不管怎么说,马斯克去年搬走了,特斯拉美联社负责人阿肖克·埃卢斯瓦米(Ashok Elluswamy)的**就证明了这一点。 **,特斯拉能够提供 7 个逼真的模拟视角,除此之外马斯克认为,特斯拉能够超越OpenAI的地方在于,特斯拉能够在此过程中生成极其准确的物理现实。

共7个模拟现实视角** - 截图自x

当然,两家公司业务的差异也导致了该技术的不同用途。 对于特斯拉来说,模拟现实的生成技术可以帮助FSD(特斯拉全自动驾驶)更好地了解实际驾驶环境,积累经验并快速成长。

SORA已经开始了新一轮的AIGC风暴。 那么,代表特斯拉智能驾驶最高水平的FSD进展如何呢?

你无法摆脱测试版 FSD

FSD对特斯拉来说非常重要,它与特斯拉未来的销售直接相关。

去年年中,马斯克在股东大会上透露了两款新平台车,并毫不掩饰地表达了对这两款新车的超乐观预期。 他认为,这两款新车将能够为特斯拉带来超过500万辆的年销量。 特斯拉的目标是到 2030 年销售 2000 万辆新车,除了目前的全电动二人组外,新平台车型将占据绝对的主要销售力量。

今年年底,有关新型紧凑型全电动汽车的更多信息出现了。 据相关知情人士透露,这250,000美元(约合人民币17元)98万元)紧凑型纯电动汽车内部代号NV9X,特斯拉去年曾就红木车型向**商家发出招标邀请,预计周产量将达到1万辆(年产量接近50万辆)。

特别是,这款新车预计将有带和不带方向盘的款式,马斯克希望在推出紧凑型新车的同时,打造一款极其干净的自动驾驶出租车在没有任何人工控制的情况下驱动这种模式的关键是 FSD。

只可惜,自从特斯拉在2020年10月首次发布FSDbeta测试版以来,马斯克频频喊FSD全自动驾驶即将实现,就像是一套现实的匹诺曹故事。

**来自:路透社

马斯克对FSD近乎吹捧的赞美可以追溯到FSD Beta v9版本。

2021年7月,特斯拉也在重构毫米波雷达模型剥离的底层算法,全新FSD Beta V9采用纯视觉技术路线,首次加入城市场景

2021 年 9 月,马斯克在推特上对 FSD v10 版本的体验大加赞赏,并声称 FSD 10 会让你大吃一惊

2022 年 4 月,FSD v10版本 11 可帮助车辆在恶劣路况和天气下显著减少误报

2023 年 4 月,特斯拉 FSD 迭代到 Beta v11第3版,特斯拉从中开辟了高速城市NOA的系统架构

2023 年 6 月,特斯拉推出了 FSD Beta v114.版本 3 将车道信息引入占用网络模型,以提高切入和切出的准确性

2023 年 7 月,特斯拉继续推出 FSD Beta v114.6.提高车辆的AEB性能

随着在 beta 后缀中添加小数位,FSD 想要摘下 beta 帽子似乎很遥远。

转折点出现在 v11 中4.在第 6 版之后,马斯克开始频繁地在 Twitter 上预热 FSD v12。 他表示,V12将把城市街道的驱动堆栈升级为端到端的神经网络,FSD将通过持续的数据输入学习和成长来取代30万行C++人力。 最后,FSD v12 的 C++ 只剩下 2000 行,更重要的是,FSD 会在 v12 中删除 beta 后缀。

11月,特斯拉首次向内部员工推送FSD Beta V12,虽然beta后缀尚未去掉,但采用端到端解决方案后的FSD确实让特斯拉的智能驾驶体验成为真正的拐点。 今年1月,在特斯拉的全年业绩**会议上,马斯克承诺FSD Beta V12将在未来几周内在北美推出40万辆汽车。

2 月 20 日,特斯拉证实已开始向非内部员工所有者推送 FSD Beta V121.2. 此次获得推送的车型包括已订阅FSD驱动包的HW30/4.0 个模型, 0 随机推送5%-2%的符合条件的车主。

随着 V12 版智能驾驶逻辑的里程碑式发布,FSD 开启测试版的曙光已经到来。

算力轰击,量变产生质变

FSD Beta V12的实际驾驶体验如何? 我们不妨回顾一下去年马斯克直播的场景。

去年 8 月,在加利福尼亚州帕洛阿尔托,马斯克在 X (Twitter) 上开启了 FSD v12 版本的实时公开测试。 马斯克驾驶一辆配备HW3的汽车0 搭载智能驾驶硬件的Model S,从特斯拉工程总部开始,全程直播。

**来自:x直播截图

在直播中,马斯克向我们强调了测试的随机性,这辆Model S的行驶路线不是提前预设的,而是在直播中随机选择的航点进行测试,到达随机导航目的地时,FSD模仿人类的驾驶习惯,驾驶车辆靠边停车。

整个直播结束后,FSD V12发挥了显著的作用,不仅汽车的驾驶风格更接近人类,而且在面对一些前所未见的复杂路况,如施工改道等情况时,FSD也表现出了较强的学习能力,正确选择了行驶路线。

然而,在45分钟的智能驾驶过程中,也有几次马斯克不得不接手。 有一次,Model S 驶到红绿灯路口,当左转的绿灯和直行的红灯同时亮起时,消防处将左转的绿灯识别为直线的绿灯,Mosaic 不得不干预停车。 在识别出乌龙茶后,马斯克还表示,他将向FSD展示更多类似的红绿灯识别**,以帮助AI加深对交通规则的理解。

虽然是被迫接手,但比起beta v11版本的性能飞跃,beta v12的首次亮相性能可以说是有缺陷的。 可以肯定的是,神经网络的发展正在大大缩小FSD误差的空间。

经过6个月的大规模推送,FSD发展到什么程度?让我们来看看一些收到随机提要的海外博主对FSD v12的评价1.2.性能。

x 用户@aidrivr 在接到特斯拉的推送后,他迅速跟进了实际测试。 在实际测试中,他表示,在总共45分钟的测试时间里,FSD的驾驶风格非常接近人类,实现了零接管。

Aitrivr 还让我们仔细了解了 FSD Beta v12 的亮点。 最出圈的片段之一是,它表明 FSD 有能力在 U 形十字路口进行自主掉头特斯拉AP监管负责人Paril Jain兴奋地表示,最好的事情是,特斯拉没有为FSD提供大量培训,以便掉头**换言之,FSD只需要从日常驾驶数据中学习,就可以在复杂的路况下做出拟人化的、成熟的驾驶决策。

U型弯U型转弯能力-**截图自x@aidrivr

另一种情况是消防处对被淹没路面的准确识别。 白天和白天,使用 FSD Beta v122.其中 1 辆特斯拉车辆能够准确识别路面上的水坑,并做出减速和绕行等动作。 Aitrivr在帖子中说,他在各种版本的FSD中测试了类似的路况,但没有一个成功,到目前为止,只有v12能够做到这一点。

识别前方道路的洪水区域 - **x@aidrivr截图

消防处持续识别绕行前方的水坑-**截图来自x@aidrivr

神经网络为 FSD 提供了更好的游戏功能。 博主 X @aidrivr 随后发布了消防处在遇到汽车和在狭窄道路上通过时的反应。 在某住宅区狭窄的路面会面场景中,特斯拉在感应到迎面而来的车辆存在后,迅速改变方向为空间让路,在会议结束的那一刻,FSD启动并平稳变道,完成了与车辆相遇的全过程。

窄路会议表现 - **截图自x@aidrivr

而当面对一些距离比较极端的狭窄路况时,消防处可以轻松应对。 Aitrivr 展示了一段 FSD 穿过狭窄道路施工的片段,他说这是在以英寸为单位播放并快速做出决定,并且还顺利驶出施工部分。

施工窄路通道 - **截图自x@aidrivr

总之,相较于beta v11版本,FSD beta v12的驱动风格更加拟人化和大胆,神经网络的可塑性让FSD的性能大放异彩。

不过,Beta v12 并非没有问题。 另一位同样收到推文的 X 博主@cdotswish透露,虽然 V12 拥有丝滑且更像人类的驾驶风格,并且不需要接管 45 分钟,但在某些场景中会遇到犹豫和摇摆,例如十字路口右转游戏和红绿灯前的白线识别。 在这方面,马斯克也很快做出回应,称问题很快就会在12中出现3版本。 」

归根结底,智能驾驶的竞争是一场算力的战争。 根据 Omdia Research 的数据,我们不妨看看旧照片,看看新照片特斯拉去年积累了15K Nvidia H100芯片的算力储备。 不过,马斯克曾公开表示,特斯拉在不同场合投入训练的算力不足,为了推广FSD,马斯克亲自承诺加大对英伟达和AMD芯片的购买力度特斯拉计划到 2024 年 10 月达到 100 exa-flops(约 300,000 个相当于计算能力的 A100 芯片)。

**来源:Omdia Research

去年8月,在马斯克V12上线亮相后不久,有消息称,特斯拉正在中国组建一支约20人的本地运营团队和一支约100人的数据标注团队,以推动FSD在中国的落地。 FSD落地中国的窗口正在出现,算力是新的马力,这场算力大战将杀死任何人。

相似文章

    历史上最重要的 14 项技术进步中,哪一项对人类文明的贡献最大?

    技术是改善生活方式的关键。我们的远古祖先知道这一点,所以他们制作了石器来制作 切割和收获。他们看到了大自然的破坏力,并学会了用火做饭。然后我们在轮子上移动,直到我们用翅膀飞翔。我们把电带入玻璃灯泡,把光带入黑暗。我们最伟大的科学家学会了 原子,但他们仍在尝试融合它们。随着时间的流逝,每一次进步都使人...

    人生中最重要的事情是什么

    人生中最重要的事情是什么每个人对这个问题都有不同的看法。有些人可能认为生命中最重要的东西是财富和地位,而另一些人可能认为生命中最重要的是健康和幸福。在我看来,生活中最重要的是人际关系,即我们如何与他人建立联系。人际关系是指人与人之间的联系和互动。这些相互作用可以是积极的,也可以是消极的。无论是积极的...

    生活中最重要的是冷静

    人生是一段跌宕起伏的旅程,就像潮水的起伏,时而波涛汹涌,时而平静如镜。当谈到成功时,我们需要保持谦虚,不要对我们的胜利感到自满。当我们失败时,我们需要冷静地接受它,不要因为挫折而气馁。生命的价值在于平静。冷静的心态,让我们在沉浸的喧嚣中保持独立,不被外界的变化所动摇。俗话说,一根竹杖,一双草鞋,在风...

    对于大型模型的应用来说,最重要的是逻辑推理能力MEET2024

    编辑部 从 meet 量子比特组织 qbitai 一个法律案件的事实是否清楚,如何确定它与法律的关系,都是合乎逻辑的。在meet智能未来大会上,面墙智能联合创始人兼CEO李大海在谈到大模型落地法律行业时,强调了逻辑推理能力的重要性。他认为,AGI革命是继蒸汽革命 电力革命和信息革命之后的第四次技术变...

    在世界上,认知是最重要的

    在世界上,认知是最重要的认知是指人们获取 处理 存储和应用信息的能力,是人们认识 理解和应对世界的基础。以下是表明认知重要性的一些原因 认知影响决策 人们的决策往往受到自身认知能力的影响。认知能力较高的人能够更全面地思考,权衡利弊,并做出更明智的决定。认知塑造行为 人们的认知能力决定了他们的行为方式...