Probably获900万美元融资，致力于打造更可靠的AI系统

AI初创公司Probably完成900万美元种子轮融资，投资方为Andreessen Horowitz。该公司致力于解决大语言模型幻觉问题，目标是实现99.99%的准确率。其首款产品为数据科学工具，通过"确定性验证器"系统对LLM输出进行校验，并训练模型适配该验证器。得益于精良的"harness工程"，系统可运行于比前沿模型低四个级别的小型模型上，支持本地硬件部署，大幅降低token成本。未来该技术还将扩展至会计、医疗等精度敏感场景。

随着大语言模型能力持续增强，幻觉问题却依然难以彻底解决。即便是最顶尖的模型，也难免出现错误。尽管目前已有一些检测手段，但业界仍在探索最优解。

初创公司Probably近日完成900万美元种子轮融资，领投方为知名风险投资机构Andreessen Horowitz，其目标正是构建一套更为严谨的错误拦截机制。

创始人Peter Elias表示，公司的核心目标是在幻觉内容和简单事实错误到达用户之前将其拦截，并实现99.99%的准确率。这一精度在确定性系统中较为常见，但对AI而言却极难达到。事实上，要将大语言模型提升至这一准确率水平，需要对AI工程的许多基本假设进行重新审视。

Probably推出的首款产品是一款数据科学工具，专为从复杂数据集中快速提取答案而设计。每条结果均附带引用来源和完整的推导审计追踪记录，这一做法在AI工具领域正日益普及。

然而，要防止错误渗入摘要，需要一套复杂的约束体系。Elias将其形容为"数据科学机甲套装"：大语言模型生成的初步答案会经过确定性验证系统的核查，不符合数据集的结果将被直接驳回。关键在于，该大语言模型已针对验证器进行专项训练，整个系统在速度与准确性上均经过优化。

"我们在构建这套系统时发现，约束工程做得越好，对模型本身的能力要求就越低，"Elias说，"只要将上下文信息足够精确地提炼出来，模型就不需要费太大力气便能给出正确答案。本质上，这是一个持续降低歧义性的过程。"

这一机制使Probably的数据科学工具得以运行在规模更小的AI模型上。Elias透露，当前版本使用的模型"比前沿模型低四个级别"，因此可以部署在本地硬件（即普通台式机而非数据中心）上运行，从而大幅降低AI使用中与Token相关的成本。

在Token成本持续攀升、众多客户重新审视AI预算的当下，这一思路颇具吸引力。而Elias的愿景并不止步于数据科学领域——同一套引擎可延伸至会计、医疗等场景，正如他所说，"任何对精准度要求较高的应用场景"均可适用。

"令我真正感到有趣的是，那些大型AI实验室甚至都没有尝试去做这件事，"Elias说，"因为他们在激励机制上倾向于反其道而行——你每多纠正一次模型，他们就多赚一次钱。"

Q&A

Q1：Probably开发的AI系统是如何防止大语言模型产生幻觉错误的？

A：Probably采用了一套"数据科学机甲套装"约束体系，大语言模型生成的初步答案会经过确定性验证系统核查，不符合数据集的结果会被直接驳回。同时，大语言模型已针对该验证器进行专项训练，整体系统在速度与准确性方面均经过优化，目标是实现99.99%的准确率，确保错误在到达用户前被拦截。

Q2：Probably的数据科学工具为什么可以在本地硬件上运行？

A：由于Probably的约束工程体系足够完善，对底层模型的能力要求大幅降低。目前使用的模型比业界前沿模型低四个级别，因此无需依赖数据中心，普通台式机即可运行，从而显著减少了与Token相关的使用成本，在当前Token成本上涨的背景下具有明显优势。

Q3：Probably的技术除了数据科学领域，还能应用在哪些场景？

A：Probably的核心引擎具备较强的可扩展性，可延伸至会计、医疗服务等多个领域。创始人Peter Elias将其定位为"任何对精准度要求较高的应用场景"，只要业务对准确性有严格要求，该技术框架理论上均可适配。

来源：TechCrunch - AI

0赞

好文章，需要你的鼓励

Probably获900万美元融资，致力于打造更可靠的AI系统

来源：TechCrunch - AI

2026

06/17

16:59

分享

点赞

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

SpaceX市值突破2.7万亿美元，超越亚马逊跻身全球第五

Robinhood裁员10%却只字不提AI，用AI甩锅已不再奏效

SiMa.ai推出智能体开发工具，将物理AI部署周期从数月缩短至数天

HPE扩展私有云AI工厂产品组合，助力下一代自主智能体部署

OpenAI财务文件泄露：公司每年亏损数十亿美元

六成美国消费者表示品牌信息中出现"AI"字样令人反感

高通发布骁龙Reality Elite芯片，推动空间计算迈入AI时代

HPE扩展自动驾驶网络战略，全力迎接AI生产部署新阶段

Snap新款AR眼镜Specs发布：售价2195美元，体验究竟如何？

Xreal Aura AR眼镜将于今秋发布，搭载全新高通芯片

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: