Positron推出专业AI推理芯片，挑战英伟达市场地位

初创公司Positron获得5160万美元A轮融资，推出专门针对AI推理的Atlas芯片。该公司声称其芯片在性能功耗比和成本效益方面比英伟达H100高出2-5倍，并已获得Cloudflare等企业客户采用。Positron专注于内存优化设计，无需液体冷却，可直接部署在现有数据中心。公司计划2026年推出支持16万亿参数模型的下一代Titan平台。

随着大规模AI部署需求激增，芯片创业公司Positron正将自己定位为市场领导者英伟达的直接挑战者，通过提供专用的节能内存优化推理芯片，旨在缓解行业日益严重的成本、功耗和可用性瓶颈。

Positron联合创始人兼首席技术官Thomas Sohmers在接受VentureBeat视频采访时表示："我们的关键差异化优势是能够以更高效率运行前沿AI模型——与英伟达相比，每瓦特和每美元可实现2倍到5倍的性能提升。"

Positron首席执行官、前AI云推理提供商Lambda首席运营官Mitesh Agrawal指出："我们制造的芯片可以部署在数百个现有数据中心，因为它们不需要液体冷却或极端功率密度。"

风险投资家和早期用户似乎对此表示认同。Positron昨日宣布完成超募的5160万美元A轮融资，由Valor Equity Partners、Atreides Management和DFJ Growth领投。

在早期客户群体中，包括知名企业和推理密集型行业的公司。已确认的部署包括主要安全和云内容网络提供商Cloudflare，该公司在其全球分布式、功耗受限的数据中心使用Positron的Atlas硬件。

进入充满挑战的市场

然而，Positron也正进入一个充满挑战的市场。据报道，竞争对手AI推理芯片创业公司Groq已将其2025年收入预测从20亿美元以上下调至5亿美元，凸显了AI硬件领域的波动性。

面对更高效、更小的大语言模型和专用小语言模型的兴起，Positron的领导层选择拥抱这一趋势。Agrawal表示："一直存在这种双重性——本地设备上的轻量级应用和集中式基础设施中的重量级处理。我们相信两者都会持续增长。"

Atlas：推理优先的AI芯片

虽然英伟达GPU通过加速模型训练帮助催生了深度学习热潮，但Positron认为推理——模型在生产中生成输出的阶段——现在是真正的瓶颈。

Positron的解决方案是Atlas，这是专门为处理大型Transformer模型而构建的第一代推理加速器。与通用GPU不同，Atlas针对现代推理任务的独特内存和吞吐量需求进行了优化。

该公司声称，Atlas的每美元性能比英伟达H100高出3.5倍，功耗降低66%，同时实现93%的内存带宽利用率。

从Atlas到Titan

仅在成立15个月后，Atlas就已开始出货和投产。该系统支持在单个2kW服务器中运行多达5000亿参数的模型。

Positron正准备在2026年推出下一代平台Titan。基于定制设计的"Asimov"硅芯片，Titan将提供每个加速器高达2TB的高速内存，支持多达16万亿参数的模型。

关键是，Titan设计为在传统数据中心环境中使用标准风冷运行，避免了下一代GPU日益需要的高密度液冷配置。

工程效率与兼容性

从一开始，Positron就将其系统设计为即插即用替代方案，允许客户使用现有模型二进制文件而无需重写代码。Sohmers解释说，Positron专注于推理，设计能够直接处理英伟达训练模型的硬件。

内存是关键需求

Sohmers和Agrawal指出AI工作负载的根本转变：从计算密集型卷积神经网络转向内存密集型Transformer架构。虽然英伟达和其他公司继续专注于计算扩展，但Positron押注于内存优先设计。

美国制造的芯片

Positron的生产管道完全在美国本土。公司第一代芯片使用英特尔设施在美国制造，最终服务器组装和集成也在国内完成。对于Asimov芯片，制造将转向台积电，但团队致力于尽可能保持其余生产链在美国。

未来展望

Agrawal强调，基于经济性和性能销售物理基础设施——而不是将其与专有API或商业模式捆绑——是Positron在怀疑论市场中获得信誉的部分原因。他表示："如果你无法基于硬件的经济性说服客户部署你的硬件，你就不会盈利。"

来源：VentureBeat

0赞

好文章，需要你的鼓励

Positron推出专业AI推理芯片，挑战英伟达市场地位

来源：VentureBeat

2025

07/30

12:57

分享

点赞

CIO有效管理影子AI的六大策略

英国推出DaRe2THINK平台助力全科医生参与临床试验

OpenAI与谷歌解读AI如何重塑市场营销策略

帕洛阿托将为你揭示未来科技发展趋势

Belkin最新MagSafe充电产品实测体验

迪士尼与AI动画的新现实：瞬间生成30万个动画姿态

AI偏见问题已被证实存在但模型"承认"无法证明什么

数字化时代职场转型指南：三大核心能力助力职业发展

Sora负载过重限制用户生成：OpenAI面临GPU熔毁警告

Snap用户将破10亿，Meta推新XR应用，多项AI技术迎来突破

KDE Plasma设定日期彻底弃用X11，Wayland推进加速

PostHog承认Shai-Hulud 2.0是其历史上最严重的安全事件

从试点到回报：将AI投资转化为真实投资回报率

ChatGPT推出学习模式，旨在引导学习而非直接给答案

Stack Overflow数据揭示"几乎正确"的AI代码带来隐性生产力负担

微软与OpenAI谈判：确保AGI里程碑后技术访问权限

Arcee推出企业级可定制AI模型AFM-4.5B，基于严格筛选的清洁数据训练

企业级智能体AI框架Agntcy正式加入Linux基金会

飞利浦AI战略：通过智能化实现大规模优质医疗服务

Writer发布企业级自主AI"超级智能体"

Matrice.ai与Voltage Park合作，加速无代码计算机视觉开发

Photoshop推出强大AI工具助力内容创作者

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: