OpenAI发布首款自研AI推理芯片Jalapeño
「OpenAI携手博通发布首款自研推理芯片Jalapeño,专为AI推理任务优化,性能功耗比显著提升,旨在降低对英伟达GPU的依赖。」
OpenAI于本周三正式发布了其首款自研定制推理处理器,这款芯片是与博通合作设计与制造的。命名为Jalapeño的新处理器,专为满足OpenAI推理系统的独特需求而设计。OpenAI表示,其自身的AI模型也参与了芯片的开发过程。
尽管该芯片仍在测试阶段,但OpenAI透露,早期结果显示,其每瓦性能比当前最先进的替代方案有显著提升。这一合作早在去年十月就已正式宣布,但OpenAI的芯片计划长期以来一直被视为降低公司对英伟达GPU依赖的一种方式。谷歌和亚马逊都已构建了类似的定制芯片,通常被称为“AI加速器”——即专门为加速机器学习工作负载而设计的硅芯片。
OpenAI总裁格雷格·布罗克曼在博通合作宣布后不久,于公司内部播客中解释了公司的芯片开发策略。布罗克曼在节目中表示:“我们对工作负载有深刻的理解。我们一直在寻找服务不足的特定工作负载,并思考如何构建能够加速实现可能性的东西。”
Jalapeño专门针对推理任务进行了设计,推理是指运行预构建的AI模型以响应用户命令的过程。在公告中,OpenAI强调了该芯片在运行实时编码模型时的低运营成本。更耗性能的任务(如预训练)可能仍将依赖英伟达硬件,但即使是推理成本的小幅降低,也能极大改善公司的盈利状况。
优化推理系统可能成为未来AI经济学的关键因素,并且这一优化很可能发生在技术栈的每一层。OpenAI已经在构建Codex等代理产品以及驱动这些产品的模型,同时也在建设运行这些模型的数据中心。进入定制芯片领域,让公司能够在这一过程中走得更远。OpenAI在公告中写道:“OpenAI不仅在开发前沿模型或在它们之上构建产品;它还在设计底层基础设施:芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。因为OpenAI在整个技术栈上运作,每一层都可以围绕同一个目标进行优化:让模型对用户更快、更可靠、更实惠。”
这一战略布局标志着OpenAI从单纯的模型开发者向全栈AI基础设施提供商的重大转变。通过自研芯片,OpenAI能够针对自身模型特性进行深度优化,从而在性能、成本和可靠性方面获得竞争优势。Jalapeño的推出不仅有助于降低运营成本,还可能推动AI推理效率的整体提升,为更广泛的应用场景铺平道路。
来源:Heooo AI工具导航