近日,蚂蚁集团智能体开发平台“百宝箱”正式推出企业版,面向文旅、出行、会展、高校、零售、餐饮等服务业场景,提供蚂蚁百灵大模型、通义千问大模型、DeepSeek 等主流大模型的一站式接入,并配套支付 MCP、营销 MCP 等支付宝特色能力,帮助企业在最短时间内完成“AI+业务”的闭环落地,加速服务业数智化升级。

与通用智能体平台不同,百宝箱企业版强调“AI×行业场景”。一方面,平台内置多个垂直行业智能体专业模板、70余款行业垂类插件及卡片,企业可一键克隆复用;另一方面,平台通过低代码工作流、RAG 知识库、可视化评测中心,支持企业将私域知识与大模型快速结合,最快 1 天即可上线专属智能体。
据透露,平台自去年启动行业智能体标准化战略以来,已在文旅行业率先跑通“技术沉淀—场景验证—持续增长”路径,携手行业打造了“杭小忆”“沪小游”“黄山智能体”等智能体产品,服务超 100 家文旅企业,累计接待游客突破 60 万人次。在会展场景,参会观众通过“碰一下+AI 智能体”即可实现无纸化签到、AR 导览、商机留存,实现便捷参会、经济办会。在校园场景,支付宝校园智能体依托百宝箱低代码能力,仅用 1天便上线“AI 辅导员”,覆盖教务、科研、心理、生活高频场景。此次企业版的上线,意味着这一方法论将全面向更多服务业场景开放。

“百宝箱不只是提供对话机器人,而是把智能体做成企业新的服务入口。”蚂蚁百宝箱企业版相关负责人介绍,借助支付宝支付 MCP、营销 MCP,企业可以把智能体直接嵌入支付宝App的支付成功页、小程序首页腰封、消费券频道等中心化流量位,实现一键发券、一键核销;同时也可以通过 API/SDK 将 AI 能力接入用户已有的 APP、小程序,真正做到“一次构建,多端分发”,形成从获客、交易到复购的完整数据闭环。
据了解,2025 年内百宝箱企业版计划覆盖 1000 家以上行业客户,并开放 100 个生态伙伴名额,共同打磨更全面的行业解决方案。业内人士认为,随着高性能开源模型成本持续下探,百宝箱企业版“低门槛+高可用”的组合拳,有望把智能体从“概念验证”推进到“规模化普及”阶段,成为服务业数字化的新基础设施。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。