总部位于巴黎的人工智能初创公司 Mistral AI 近天宣布推出一款新模型 —— Mistral Medium 3。该公司表示,该模型的性能远超竞争对手,而成本却大幅降低。
公司还推出了面向企业客户的全新版本企业级 AI 助手 Le Chat Enterprise,该助手由 Medium 3 提供支持,具备企业搜索、智能代理构建和工具连接器等功能。
在性能方面,Mistral 表示,新模型的表现超越了例如 Meta Platform Inc. 的 Llama 4 Maverick 等模型,以及 Cohere Inc. 的 Command A 等企业级模型。而在价格上,其成本远低于 DeepSeek v3,通过应用程序接口和自部署系统均展现出较低的费用优势。
对于企业应用,该公司表示,其基准测试性能可达到或超过 Anthropic PBC 的 Claude 3.7 Sonnet 的 90%,但成本仅为其八分之一:每百万输入 Token 为 40 美分,每百万输出 Token 为 20.80 美元,而 Sonnet 则分别为每输入 Token 3 美元和每输出 Token 15 美元。
Mistral 进一步指出,Medium 3 是一款面向前沿应用场景设计的模型,在专业应用场景中表现尤为出色,尤其是在编程、科学、技术、工程和数学任务领域中,其性能逐步缩小了与规模更大且响应更慢的竞争对手之间的差距。
Mistral 表示,用户不必在通过 API 进行微调和自部署、从零开始定制模型行为之间做出选择;Medium 3 为企业系统提供了一条全面整合智能的途径。
企业客户可以持续对模型进行预训练、全面微调,并将其融合进知识库中以进行领域专属训练,同时使其适应公司文化和信息系统。Mistral 表示,来自金融服务、能源和医疗保健领域的 Beta 客户,已利用该模型个性化业务流程、改进工作流,并对复杂数据集进行分析。
新模型今日起可通过公司平台 Mistral La Plateforme 以及 Amazon SageMaker 的 API 使用。不久后,它还将登陆 IBM watsonx、Nvidia NIM、Azure AI Foundry 和 Google Cloud Vertex。
Le Chat Enterprise AI 助手
Le Chat Enterprise 在公司现有的 AI 聊天助手基础上构建,重点整合了企业生产力工具和安全特性,形成统一的 AI 平台。
该平台为企业团队提供了丰富的功能,包括企业搜索、AI 代理构建器、自定义数据和工具连接器、文档库、自定义 AI 模型以及混合部署能力。
企业团队能够通过 Le Chat Enterprise 将所有常用的生产力应用(例如 Google Drive、Google Calendar、Gmail 以及 Microsoft SharePoint 和 OneDrive)集成于一处 —— 后续还将增加更多连接器。利用这些信息,系统可以帮助整理外部数据源、文档和网页资源,从而提供相关答案,并为业务相关内容的快速上手提供便捷途径。
借助代理构建器,员工可以通过连接各类应用和业务工具,实现常规任务的自动化。
Mistral 表示:“Le Chat 将使您的团队能够轻松构建符合自身需求的定制助手 —— 无需编码。”
公司强调,面向企业的 Le Chat 以隐私为先,可在任何地方部署,无论是公有云、私有云,还是托管在 Mistral 云上的服务。所有与企业工具的数据连接器均保持充分保护,并符合访问控制要求。
Le Chat Enterprise 现已在 Google Cloud Marketplace 上面向企业团队推出,不久后也将在 Azure AI 和 AWS Bedrock 上上线。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。