人工智能不再仅仅是软件层面的概念,它正在成为AI工厂的基础,在这里芯片、数据管道和网络协同工作,形成数字化结果的生产系统。这种新兴模式正在重新定义性能衡量标准以及各行各业价值创造的方式。
这些AI工厂将定制半导体、低延迟网络结构和大规模数据监测整合成实时反馈循环,从而产生竞争优势。它们正在重塑商业模式,芯片制造商获得长期定制合同,企业利用遥测技术将传统体验转变为活跃的数字生态系统。计算经济学现在可以与制造业经济学相提并论。
theCUBE Research的John Furrier和Dave Vellante在最新一期的theCUBE Pod节目中探讨了Broadcom、英伟达和IBM如何应对这一转变。他们的对话涵盖了从美国公开赛的实时分析到定制芯片交易的兴起,以及扩展AI驱动基础设施的更广泛竞争。
"对于Broadcom和英伟达来说,这将是一个持续的繁荣期,因为它们是军火商和供应链的核心,"Furrier表示。"英伟达正在进军企业市场,Broadcom则采取更开放的方法。"
AI工厂的构建和变现模式已成为解读当今市场的重要视角。这个概念强调计算资源不是抽象工具,而是数据驱动结果的生产线。Broadcom和英伟达代表了这个领域的两个极端。英伟达追求垂直整合模式,硬件、软件和系统紧密耦合。根据Vellante的分析,Broadcom采取模块化方法,追求多年期定制芯片交易,同时将半导体与软件配对以平衡周期。
"他们把美国公开赛变成了AI数据工厂,"Vellante谈到theCUBE最近参加的体育赛事时说。"虽然他们没有使用这样的营销术语,但这确实是一个数据工厂。他们拥有超过一百年的比赛数据,包括球落点的所有历史记录。每场比赛产生450万个数据点,这简直令人难以置信。"
美国公开赛成为AI工厂经济学的展示窗口,IBM的watsonx在17个球场上近实时处理数百万数据点。Broadcom160亿美元的季度业绩强调了同样的主题:长期芯片交易和资本密集型生态系统正在重新定义供应商策略、客户体验和企业价值。
"OpenAI交易代表了我所说的大规模集群白盒模型,简单来说,将会有一个市场兴起来满足对定制芯片的需求,这些芯片将输入到可能是英伟达克隆版的专用系统中,"Furrier解释道。"OpenAI有巨大的现金激励来垂直整合自己的业务。我们一直在就异构与同构进行辩论。"
除了收益和芯片设计的头条新闻,更广泛的讨论集中在生态系统如何演进。AI工厂不仅仅是超大规模企业的现象,它们通过合作伙伴关系、数据集成策略和智能体工作流程的应用影响企业。这就是为什么AI工厂系列中即将进行的对话具有重要意义:它们将辩论从芯片和云集群扩展到企业准备就绪性、互操作性和治理。
"Broadcom的收入接近160亿美元,季度增长23%。营业收入60亿美元,约占收入的37%,"Vellante在谈到他们的行业地位时说。"他们的自由现金流为70亿美元,占收入的45%——这比微软还高,比英伟达还高。Broadcom的特点是他们拥有这些长期、高价值、多年期、数十亿美元的定制芯片交易。"
英伟达的集成方法以"黄氏定律"为框架,强调每年性能翻倍,尽管其企业影响仍存在疑问。英伟达和Broadcom都从AI需求中受益,而Salesforce、IBM等公司则推动智能体驱动的数据增长。然而,华尔街经常忽视这些策略,这突显了为什么财务和技术路线图仍然密不可分。
"我认为英伟达处在学习曲线上,在需要最新最好技术的范围内,英伟达领先于所有人,"Vellante解释道。"他们在学习曲线上走得最远,这意味着他们拥有最多的创新和最低的成本——当然不是最低的价格,但这是他们的护城河。除非这些定律变得不再不可改变,否则我认为这种情况还会持续相当长的时间。"
Q&A
Q1:什么是AI工厂?它与传统的计算模式有何不同?
A:AI工厂是将芯片、数据管道和网络协同工作的生产系统,用于产生数字化结果。与传统计算模式不同,AI工厂将定制半导体、低延迟网络和大规模数据监测整合成实时反馈循环,不再是抽象工具,而是数据驱动结果的生产线。
Q2:Broadcom和英伟达在AI工厂领域采用了什么不同策略?
A:英伟达追求垂直整合模式,将硬件、软件和系统紧密耦合;Broadcom则采取模块化方法,追求多年期定制芯片交易,同时将半导体与软件配对以平衡周期,采用更开放的策略。
Q3:美国公开赛如何展示了AI工厂的应用?
A:美国公开赛被转变为AI数据工厂,IBM的watsonx在17个球场上近实时处理数百万数据点。他们拥有超过一百年的比赛数据,包括球落点的所有历史记录,每场比赛产生450万个数据点,展示了AI工厂的实时数据处理能力。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。