
(SeaPRwire) – 其AI帝国建立在GPU之上。但它对Groq高达200亿美元的押注表明,该公司并不认为仅靠GPU就能主导AI目前最重要的阶段:大规模运行模型,即推理(inference)。
当然,AI推理领域的争夺战核心在于其经济性。一旦模型完成训练,它所做的每一件有用之事——回答查询、生成代码、推荐产品、总结文档、驱动聊天机器人或分析图像——都发生在推理阶段。正是在这个时刻,AI从沉没成本转变为创收服务,随之而来的是降低成本、缩短延迟(即等待AI回答的时间)和提高效率的压力。
这种压力正是推理成为行业下一个潜在利润战场的原因——也是Nvidia在圣诞假期前宣布的一笔交易中,从Groq(一家专注于设计快速、低延迟AI推理芯片的初创公司)获得技术授权,并聘用其大部分团队(包括创始人兼CEO乔纳森·罗斯(Jonathan Ross))的原因。
推理是AI的‘工业革命’
Nvidia CEO黄仁勋(Jensen Huang)明确谈到了推理的挑战。尽管他表示Nvidia“在AI的每个阶段都表现出色”,但他在11月的公司第三季度财报电话会议上表示,推理“真的、真的很难”。现代推理绝非简单的“一个提示输入、一个答案输出”,它必须支持持续推理、数百万并发用户、有保证的低延迟以及严苛的成本限制。而需要处理多步骤的AI代理将大幅增加推理需求和复杂性——并提高出错的风险。
黄仁勋表示:“人们认为推理是一次性的,因此很容易。任何人都可以那样进入市场。但事实证明,推理是最难的,因为思考本身就相当困难。”
Nvidia对Groq的支持突显出这一信念,并表明即使是主导AI训练的公司,也在对推理经济性的最终走向进行对冲。
黄仁勋还直言推理对AI增长的核心作用。在最近的BG2播客对话中,他表示推理已占AI相关收入的40%以上,并预测其“即将增长10亿倍”。
黄仁勋说:“这是大多数人尚未完全理解的部分。这就是我们谈论的行业。这就是工业革命。”
这位CEO的信心有助于解释,为何即使底层经济性仍未稳定,Nvidia仍愿意对推理的交付方式进行积极对冲。
Nvidia试图垄断推理市场
Cambrian AI Research创始人兼首席分析师卡尔·弗罗因德(Karl Freund)表示,Nvidia正在对冲风险,以确保其涉足市场的所有领域。他解释道:“这有点像Meta收购 。并不是说他们认为Facebook不好,而是他们知道存在一种替代方案,他们希望确保这种方案不会与自己竞争。”
尽管黄仁勋曾对Nvidia现有推理平台的经济性做出过强有力的宣称。弗罗因德说:“我怀疑他们发现,要么该平台未能像预期那样引起客户共鸣,要么他们看到了Groq和另一家名为D-Matrix的公司所采用的基于芯片内存的方法的优势。”他指的是另一家由 支持的快速、低延迟AI芯片初创公司,该公司以20亿美元的估值筹集了2.75亿美元。
弗罗因德表示,Nvidia进军Groq可能会提升整个品类的价值。他说:“我相信D-Matrix现在是一家非常开心的初创公司,因为我怀疑得益于[Nvidia-Groq交易],他们的下一轮融资估值会高得多。”
其他行业高管表示,随着AI从聊天机器人扩展到机器人、无人机和安全工具等实时系统,AI推理的经济性正在发生变化。这些系统无法承受数据往返云端的延迟,也无法承受计算能力不总是可用的风险。因此,与集中式GPU集群相比,它们更青睐Groq这样的专用芯片。
OpenInfer创始人兼CEO贝纳姆·巴斯塔尼(Behnam Bastani)表示,他的初创公司专注于在数据生成附近运行AI推理——例如在设备、传感器或本地服务器上,而不是遥远的云数据中心——其目标是“边缘”(edge)的这类应用。
他强调,推理市场仍处于起步阶段。而Nvidia正试图通过与Groq的交易垄断该市场。他说,由于推理经济性仍未稳定,Nvidia正试图将自己定位为涵盖整个推理硬件栈的公司,而不是押注于单一架构。
他说:“这将Nvidia定位为一个更大的保护伞。”
本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。
分类: 头条新闻,日常新闻
SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。