AI推理芯片公司Positron AI今日宣布完成2.3亿美元超额认购的融资,公司估值超过10亿美元。该公司专注于开发能效优化的人工智能推理定制芯片和硬件。
此轮B轮融资由Arena Private Wealth、Jump Trading和Unless共同领投,新投资者和战略投资者包括卡塔尔投资局、Arm和Helena。现有投资者Valor Equity Partners、Atreides Management和DFJ Growth等也参与了本轮融资。
首席执行官Mitesh Agrawal表示:"能源供应已成为AI部署的关键瓶颈。我们的下一代芯片在核心工作负载中的每瓦特Token处理能力将比英伟达即将推出的Rubin GPU高出五倍。"
在与AI芯片和图形处理单元对比时,Agrawal指出内存是推理的下一个瓶颈。Positron开发的定制芯片Asimov将于2027年初发货,每个设备将配备超过2304GB的内存,而Rubin仅有384GB。
"这将在视频处理、交易、万亿参数模型以及任何需要巨大上下文窗口的工作负载中成为关键差异化因素,"Agrawal说。他补充道,预期Positron的定制芯片在特定内存密集型工作负载的性价比方面将超越Rubin。
英伟达在2026年CES上发布了其最新旗舰GPU芯片Rubin,采用3360亿个晶体管构建,在处理NVFP4数据时可提供约50 petaflops的性能。
Positron表示正在构建基础设施层,通过降低运行模型所需的成本和功耗,使AI在大规模应用中更加实用。该公司目前的产品是Atlas,这是一个完全采用美国制造系统构建的快速部署和扩展推理系统。
SemiAnalysis LLC创始人兼首席执行官、Positron的顾问和投资者Dylan Patel表示:"内存带宽和容量是扩展下一代模型AI推理工作负载的两个关键限制因素。"
该公司表示,Asimov的设计基于AI模型的现实需求:它们更依赖于内存带宽而非纯粹的计算能力。Asimov旨在支持每个加速器2TB内存和每个Titan系统8TB内存,实现与Rubin GPU相当的带宽性能。
在GPU和AI芯片市场,英伟达是需要超越的标杆。根据市场报告,尽管面临竞争,英伟达目前约占85%的市场份额,其竞争对手包括AMD和高通。作为最接近的竞争对手,AMD仅占7%的市场份额,在2025年第三季度增长0.8%,显示了英伟达目前的市场主导地位。
Positron AI构建专用AI硬件和软件,旨在大幅降低推理的能源成本。该公司表示,预期其Asimov路线图将使其成为增长最快的公司之一,并获得强劲的商业吸引力,目前已在与云计算、先进计算和性能敏感行业的多个"前沿客户"合作中看到这一点。
此外,该公司表示正在与行业领导者构建平台生态系统,包括Arm Holdings、Super Micro Computer等关键技术和供应链合作伙伴。
Q&A
Q1:Positron AI的核心技术优势是什么?
A:Positron AI专注于构建高能效AI推理芯片。其下一代芯片Asimov在每瓦特Token处理能力上比英伟达Rubin GPU高出五倍,并配备超过2304GB内存,远超Rubin的384GB,特别适合内存密集型工作负载。
Q2:Asimov芯片什么时候能够上市?
A:根据Positron AI的计划,其定制芯片Asimov将于2027年初开始发货,目前该公司已经在与多个前沿客户进行合作测试。
Q3:Positron AI在AI芯片市场面临什么竞争?
A:目前英伟达在AI芯片市场占据约85%的主导地位,AMD作为最接近的竞争对手仅占7%市场份额。Positron AI希望通过其高能效和大内存容量的差异化优势在这个市场中获得突破。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。