多年来,埃隆·马斯克一直在谈论Dojo——这台将成为特斯拉人工智能战略核心的超级计算机。Dojo的重要性不言而喻,它被视为特斯拉实现完全自动驾驶(FSD)和推动机器人出租车落地的关键技术
多年来,埃隆·马斯克一直在谈论Dojo——这台将成为特斯拉人工智能战略核心的超级计算机。Dojo的重要性不言而喻,它被视为特斯拉实现完全自动驾驶(FSD)和推动机器人出租车落地的关键技术。然而,自2024年8月以来,关于Dojo的消息逐渐减少,业界关注点转向了特斯拉新的AI训练超级集群Cortex。本文将深入探讨Dojo的背景、技术架构、发展历程以及它对特斯拉未来战略的意义,并分析其与Cortex的关系。
Dojo的背景:特斯拉AI战略的核心
马斯克的目标远不止于造车,他希望特斯拉成为一家AI公司,通过模拟人类感知,解决自动驾驶的核心难题。不同于大多数自动驾驶企业依赖多种传感器(如激光雷达、雷达和摄像头)及高精度地图,特斯拉坚持仅依靠摄像头采集视觉数据,并通过神经网络进行处理,实现自动驾驶。这种“纯视觉”方案对计算能力提出了极高的要求,也正是Dojo诞生的根本原因。
特斯拉前AI负责人安德烈·卡帕西(Andrej Karpathy)曾将特斯拉的AI战略比作“从零开始构建一种合成动物”,试图通过海量数据和强大的计算能力,模拟人类的视觉感知和决策过程。而Alphabet旗下Waymo等公司则采用传感器融合和传统机器学习方法,已实现L4级自动驾驶的商业化应用。但特斯拉至今尚未推出完全不需要驾驶员的自动驾驶系统。
目前,约有180万用户支付8000至1.5万美元订阅FSD。特斯拉计划通过Dojo训练AI软件,并通过OTA(无线更新)方式推送至用户车辆。特斯拉庞大的车辆保有量为其提供了海量驾驶视频数据,这些数据是训练FSD神经网络的基础。特斯拉的核心逻辑是:数据越多,越接近实现真正的完全自动驾驶。
然而,这种“数据驱动”策略也面临质疑。一些行业专家指出,训练过程的经济成本会迅速增长,成为限制因素;此外,单纯的数据积累并不一定能提升模型性能,关键在于数据质量和有效的信息提炼。尽管存在这些质疑,短期内数据驱动的趋势仍将持续,而数据的增长必然带来对更高计算能力的需求,这正是Dojo存在的意义。
什么是超级计算机?Dojo的技术架构
Dojo是特斯拉专为人工智能训练打造的超级计算机系统,主要用于FSD神经网络的训练。其名称来源于武术练习场“道场”(Dojo),寓意其作为AI训练平台的核心作用。一台超级计算机由成千上万个称为“节点”(node)的小型计算机组成,每个节点都配备自己的中央处理器(CPU)和图形处理器(GPU)。CPU负责整体管理,而GPU则处理高强度计算任务,例如将复杂运算拆分成多个并行任务。
GPU在机器学习领域至关重要,尤其是在FSD模拟训练中。它们同样驱动着大语言模型的发展,这也是为何生成式人工智能的崛起,使英伟达成为全球市值最高的科技公司之一。尽管特斯拉拥有自己的计算硬件,但它仍然大量采购英伟达的GPU来训练人工智能模型。
特斯拉为何需要超级计算机?Dojo的计算核心:D1芯片
特斯拉采用“纯视觉”方案进行自动驾驶,这需要超级计算机来处理海量驾驶数据,并进行数百万次模拟训练。特斯拉希望打造一个数字化的“人类视觉皮层”及“大脑决策系统”,这需要存储和处理从全球车辆收集的海量视频数据,并以与人类视觉感知能力相匹配的速度进行实时处理。
为了摆脱对第三方芯片的依赖,并提升计算效率和降低延迟,特斯拉自主研发了D1芯片,专为AI计算优化。D1芯片由台积电采用7纳米工艺制造,拥有500亿个晶体管,芯片面积达645平方毫米。特斯拉表示,该芯片能够同时进行计算和数据传输,其指令集架构(ISA)完全针对机器学习任务进行了优化。
然而,D1芯片的性能仍不及英伟达A100 GPU。为了提升计算能力和数据吞吐量,特斯拉将25颗D1芯片集成为一个计算单元(Tile)。每个Tile的计算性能为9千万亿次浮点运算/秒(9 petaflops),带宽达到36太字节/秒(36 TB/s)。
Dojo的整体架构采用模块化设计:6个Tile组成一个机架(Rack),2个机架组成一个机柜(Cabinet),10个机柜组成一个ExaPOD超级计算系统。Dojo的计算能力将通过部署多个ExaPOD进行扩展。此外,特斯拉正在研发新一代D2芯片,以进一步提升计算效率和降低延迟。
Dojo对特斯拉意味着什么?战略意义与潜在收益
掌握自研芯片生产,意味着特斯拉未来可能以更低成本快速扩展AI算力。这使得特斯拉能够降低对英伟达等第三方芯片的依赖,减少供应链风险,并控制成本。在2024年第二季度财报电话会议上,马斯克曾表示,英伟达硬件的需求“高得惊人”,特斯拉正在努力降低对英伟达的依赖。
马斯克曾表示,Dojo未来有潜力在算力竞争中与英伟达一较高下。摩根士丹利在2023年9月的一份报告中预测,Dojo可以通过自动驾驶出租车和AI软件服务等新业务模式,为特斯拉带来额外的收入增长,甚至可能为公司市值贡献5000亿美元。
然而,Dojo项目也面临挑战。首个版本的Dojo主要用于特斯拉计算机视觉数据的标注与训练,用途较为局限。未来版本的Dojo将更适用于通用AI训练,但这需要对当前基于GPU架构的AI软件进行重构。
此前有报道称,特斯拉于2023年7月开始生产Dojo,但马斯克曾表示Dojo“已经上线并执行有用任务数月”。特斯拉曾预计Dojo将在2024年2月跻身全球五大最强超级计算机之列,并到2024年10月达到100 ExaFLOPS的计算能力。但截至目前,特斯拉尚未公开披露相关信息,这些目标是否达成仍存疑。
2024年第二季度财报电话会议后,马斯克表示,特斯拉AI团队正在使用Tesla HW4 AI计算机(现更名为AI4),与英伟达GPU结合进行训练。他提到,当前训练集群中包含90,000块英伟达H100 GPU和40,000台AI4计算机。马斯克补充道:“到年底,Dojo 1的训练能力将相当于8000块H100 GPU。”
在2024年第四季度财报电话会议上,Dojo甚至未被提及。相反,特斯拉宣布已在Q4完成Cortex的部署,并表示Cortex是推动FSD V13版本实现的关键。这暗示着特斯拉的AI战略重心可能正在发生转移,Dojo的进展可能不如预期。
Dojo与Cortex的关系
Dojo和Cortex都是特斯拉用于AI训练的超级计算机集群,但它们的目标和侧重点有所不同。Dojo主要用于训练FSD神经网络,而Cortex则旨在解决更广泛的现实世界AI问题,包括FSD和Optimus机器人的训练。Cortex拥有“海量存储能力”,这表明它可能更侧重于处理和分析大量非结构化数据。
特斯拉对Dojo和Cortex的投入,体现了其对AI技术的高度重视。这两个项目的发展,将对特斯拉的自动驾驶技术和机器人技术的未来发展产生深远的影响。
Dojo作为特斯拉自主研发的超级计算机,是其AI战略的核心组成部分。虽然目前关于Dojo的公开信息有限,但其对特斯拉实现完全自动驾驶和开拓新的商业模式具有重要意义。Dojo的未来发展,以及它与Cortex的关系,值得持续关注。 随着特斯拉AI技术的不断进步,Dojo能否实现其最初的宏伟目标,并为特斯拉带来预期的经济效益,仍有待时间检验。
标签: 特斯 Dojo 超级 计算机 深度 解析 发展 历程 技术
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!