Positron推出专业AI推理芯片，挑战英伟达市场地位

初创公司Positron获得5160万美元A轮融资，推出专门针对AI推理的Atlas芯片。该公司声称其芯片在性能功耗比和成本效益方面比英伟达H100高出2-5倍，并已获得Cloudflare等企业客户采用。Positron专注于内存优化设计，无需液体冷却，可直接部署在现有数据中心。公司计划2026年推出支持16万亿参数模型的下一代Titan平台。

随着大规模AI部署需求激增，芯片创业公司Positron正将自己定位为市场领导者英伟达的直接挑战者，通过提供专用的节能内存优化推理芯片，旨在缓解行业日益严重的成本、功耗和可用性瓶颈。

Positron联合创始人兼首席技术官Thomas Sohmers在接受VentureBeat视频采访时表示："我们的关键差异化优势是能够以更高效率运行前沿AI模型——与英伟达相比，每瓦特和每美元可实现2倍到5倍的性能提升。"

Positron首席执行官、前AI云推理提供商Lambda首席运营官Mitesh Agrawal指出："我们制造的芯片可以部署在数百个现有数据中心，因为它们不需要液体冷却或极端功率密度。"

风险投资家和早期用户似乎对此表示认同。Positron昨日宣布完成超募的5160万美元A轮融资，由Valor Equity Partners、Atreides Management和DFJ Growth领投。

在早期客户群体中，包括知名企业和推理密集型行业的公司。已确认的部署包括主要安全和云内容网络提供商Cloudflare，该公司在其全球分布式、功耗受限的数据中心使用Positron的Atlas硬件。

进入充满挑战的市场

然而，Positron也正进入一个充满挑战的市场。据报道，竞争对手AI推理芯片创业公司Groq已将其2025年收入预测从20亿美元以上下调至5亿美元，凸显了AI硬件领域的波动性。

面对更高效、更小的大语言模型和专用小语言模型的兴起，Positron的领导层选择拥抱这一趋势。Agrawal表示："一直存在这种双重性——本地设备上的轻量级应用和集中式基础设施中的重量级处理。我们相信两者都会持续增长。"

Atlas：推理优先的AI芯片

虽然英伟达GPU通过加速模型训练帮助催生了深度学习热潮，但Positron认为推理——模型在生产中生成输出的阶段——现在是真正的瓶颈。

Positron的解决方案是Atlas，这是专门为处理大型Transformer模型而构建的第一代推理加速器。与通用GPU不同，Atlas针对现代推理任务的独特内存和吞吐量需求进行了优化。

该公司声称，Atlas的每美元性能比英伟达H100高出3.5倍，功耗降低66%，同时实现93%的内存带宽利用率。

从Atlas到Titan

仅在成立15个月后，Atlas就已开始出货和投产。该系统支持在单个2kW服务器中运行多达5000亿参数的模型。

Positron正准备在2026年推出下一代平台Titan。基于定制设计的"Asimov"硅芯片，Titan将提供每个加速器高达2TB的高速内存，支持多达16万亿参数的模型。

关键是，Titan设计为在传统数据中心环境中使用标准风冷运行，避免了下一代GPU日益需要的高密度液冷配置。

工程效率与兼容性

从一开始，Positron就将其系统设计为即插即用替代方案，允许客户使用现有模型二进制文件而无需重写代码。Sohmers解释说，Positron专注于推理，设计能够直接处理英伟达训练模型的硬件。

内存是关键需求

Sohmers和Agrawal指出AI工作负载的根本转变：从计算密集型卷积神经网络转向内存密集型Transformer架构。虽然英伟达和其他公司继续专注于计算扩展，但Positron押注于内存优先设计。

美国制造的芯片

Positron的生产管道完全在美国本土。公司第一代芯片使用英特尔设施在美国制造，最终服务器组装和集成也在国内完成。对于Asimov芯片，制造将转向台积电，但团队致力于尽可能保持其余生产链在美国。

未来展望

Agrawal强调，基于经济性和性能销售物理基础设施——而不是将其与专有API或商业模式捆绑——是Positron在怀疑论市场中获得信誉的部分原因。他表示："如果你无法基于硬件的经济性说服客户部署你的硬件，你就不会盈利。"

来源：VentureBeat

0赞

好文章，需要你的鼓励

Positron推出专业AI推理芯片，挑战英伟达市场地位

来源：VentureBeat

2025

07/30

12:57

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

从试点到回报：将AI投资转化为真实投资回报率

ChatGPT推出学习模式，旨在引导学习而非直接给答案

Stack Overflow数据揭示"几乎正确"的AI代码带来隐性生产力负担

微软与OpenAI谈判：确保AGI里程碑后技术访问权限

Arcee推出企业级可定制AI模型AFM-4.5B，基于严格筛选的清洁数据训练

企业级智能体AI框架Agntcy正式加入Linux基金会

飞利浦AI战略：通过智能化实现大规模优质医疗服务

Writer发布企业级自主AI"超级智能体"

Matrice.ai与Voltage Park合作，加速无代码计算机视觉开发

Photoshop推出强大AI工具助力内容创作者

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会