大多数企业AI项目失败并非因为技术缺乏,而是因为所使用的模型无法理解其业务。这些模型通常在互联网上进行训练,而非基于数十年的内部文档、工作流程和机构知识。
法国AI初创公司Mistral正是看中了这一空白。周二,该公司宣布推出Mistral Forge平台,让企业能够使用自有数据构建定制模型。Mistral在英伟达年度技术大会GTC上发布了这一平台,今年的大会重点关注企业AI和智能体模型。
对于Mistral而言,这是一个明确的战略举措。该公司专注于企业客户,而竞争对手OpenAI和Anthropic则在消费者采用方面遥遥领先。CEO Arthur Mensch表示,Mistral对企业市场的专注正在奏效:公司有望在今年实现超过10亿美元的年度经常性收入。
加倍投入企业市场的重要组成部分是为公司提供对其数据和AI系统的更多控制权。
"Forge的作用是让企业和政府能够根据其特定需求定制AI模型,"Mistral产品负责人Elisa Salamanca告诉TechCrunch。
企业AI领域的多家公司已经声称提供类似能力,但大多数专注于微调现有模型,或通过检索增强生成(RAG)等技术在模型之上叠加专有数据。这些方法并不从根本上重新训练模型,而是在运行时使用公司数据对其进行调整或查询。
相比之下,Mistral表示其正在让公司能够从头开始训练模型。理论上,这可以解决更常见方法的一些限制——例如,更好地处理非英语或高度特定领域的数据,以及对模型行为的更大控制。它还可以让公司使用强化学习训练智能体系统,减少对第三方模型提供商的依赖,避免模型更改或弃用等风险。
Forge客户可以使用Mistral丰富的开放权重AI模型库构建定制模型,其中包括最近推出的Mistral Small 4等小型模型。据Mistral联合创始人兼首席技术官Timothée Lacroix表示,Forge可以帮助从其现有模型中释放更多价值。
"我们在构建较小模型时所做的权衡是,它们在每个主题上都无法像较大模型那样出色,因此定制它们的能力让我们可以选择强调什么和放弃什么,"Lacroix说。
Lacroix表示,Mistral会就使用哪些模型和基础设施提供建议,但两个决定都由客户做出。对于需要更多指导的团队,Forge配备了Mistral的前沿部署工程师团队,他们直接与客户合作,挖掘正确的数据并适应他们的需求——这一模式借鉴了IBM和Palantir等公司。
"作为产品,Forge已经配备了所有工具和基础设施,因此您可以生成合成数据管道,"Salamanca说。"但了解如何构建正确的评估并确保您拥有正确数量的数据,这是企业通常不具备正确专业知识的地方,这正是前沿部署工程师带来的价值。"
Mistral已经向合作伙伴提供了Forge,包括爱立信、欧洲航天局、意大利咨询公司Reply,以及新加坡的DSO和HTX。早期采用者还包括荷兰芯片制造商ASML,该公司在去年9月以117亿欧元估值(当时约138亿美元)领投了Mistral的C轮融资。
这些合作关系代表了Mistral对Forge主要用例的期望。据Mistral首席营收官Marjorie Janiewicz表示,这些用例包括需要为其语言和文化定制模型的政府;具有高合规要求的金融机构;有定制需求的制造商;以及需要针对其代码库调整模型的科技公司。
Q&A
Q1:Mistral Forge是什么?它有什么特殊功能?
A:Mistral Forge是法国AI公司Mistral推出的企业定制AI平台,让企业能够使用自有数据从头开始训练AI模型,而不只是微调现有模型。它能更好地处理特定领域数据,为企业提供对AI系统的更大控制权。
Q2:Mistral Forge与其他企业AI解决方案有什么不同?
A:大多数企业AI解决方案专注于微调现有模型或使用检索增强生成技术,而Mistral Forge能让企业从头训练模型。这种方法能更好地处理非英语或高度特定领域的数据,并提供对模型行为的更大控制。
Q3:哪些企业已经在使用Mistral Forge?
A:早期合作伙伴包括爱立信、欧洲航天局、意大利咨询公司Reply、新加坡的DSO和HTX,以及荷兰芯片制造商ASML。这些企业涵盖了电信、航天、金融和制造等多个行业。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。