Snowflake近期发布了Cortex Code智能体,这是一款基于AI的编程智能体,旨在将AI辅助功能从SQL生成和对话式分析扩展到数据与应用开发任务。
据Snowflake产品执行副总裁Christian Kleinerman在新闻发布会上介绍,Cortex Code具备理解企业数据上下文的核心能力,包括数据结构、治理规则、计算约束和生产工作流程。
这一能力使开发人员和数据团队可以使用自然语言构建、优化和部署数据管道、分析、机器学习工作负载和智能体应用。Kleinerman补充说,这大大简化了复杂数据开发工作的流程。
Snowflake现有的AI功能(如Cortex AISQL和Snowflake Intelligence)主要帮助用户查询和分析数据。而Cortex Code的出现,标志着该公司在AI辅助开发领域的重要进展。
分析师认为,这种原生编程智能体能够帮助企业团队更快地从实验阶段转向可扩展的数据和应用部署。与通用编程智能体不同,Cortex Code理解关键上下文信息,比如哪些表格是敏感的、哪些数据转换成本高昂、哪些管道对生产环境至关重要,以及分析、机器学习和智能体应该如何协同工作。
HyperFRAME Research AI技术栈实践负责人Stephanie Walter表示,这种上下文理解能力可以减少从实验想法转向可靠、受管治且适合企业级运行的解决方案所需的手动工作。这一点尤为重要,因为企业面临的真正风险不是代码质量问题,而是违反治理规则、成本过高或无法扩展的代码。
为了进一步帮助企业扩展生产级数据和AI应用,Cortex Code不仅在Snowsight中提供服务,还通过VS Code和Cursor等代码编辑器以命令行界面工具的形式提供。
Moor Insights and Strategy首席分析师Robert Kramer指出,CLI工具的部署将帮助开发人员保留企业的数据上下文(特别是存储在Snowflake中的数据),同时仍能在本地机器上使用他们选择的代码编辑器。
在代码编辑器层面保留上下文非常重要,因为大多数开发工作都从那里开始。Kramer说,由于企业上下文在本地试点阶段就已内置,当代码进入生产环境或数据仓库时失败的可能性更小。
"同一个了解Snowflake的智能体既能在本地开发工作流中帮助你制作原型,也能将工作延续到Snowflake工作空间、笔记本和生产管道中。这种连续性减少了重写和重新验证的步骤,而许多AI试点项目正是在这些环节停滞不前。"
竞争对手的数据仓库和数据云服务提供商也在采用类似策略,将AI辅助功能更深入地嵌入到数据和应用开发工作流程中。
Kramer指出,Databricks更专注于以笔记本为中心的开发和平台内助手,而非本地优先的工作流程;Google Cloud则通过BigQuery、Looker和Gemini专注于分析师驱动的发现,更强调平台内体验而非Snowflake式的跨环境连续性;Teradata则优先考虑智能体编排、治理和控制,而非开发人员的人机工效学。
"正确的选择取决于组织最大的瓶颈是实验、治理,还是大规模操作AI,"Kramer表示。
Snowflake表示,Cortex Code在Snowsight(Snowflake的Web界面)中的功能即将全面发布,CLI版本已经可用。
Q&A
Q1:Cortex Code与普通编程智能体有什么区别?
A:Cortex Code最大的优势是深度理解企业数据上下文,包括数据结构、治理规则、计算约束和生产工作流程。它知道哪些表格敏感、哪些数据转换成本高、哪些管道对生产关键,以及各组件如何协同工作,而普通智能体缺乏这些企业级上下文理解。
Q2:如何使用Cortex Code进行开发?
A:开发人员可以通过两种方式使用Cortex Code:一是在Snowflake的Web界面Snowsight中直接使用;二是通过VS Code、Cursor等代码编辑器的命令行界面工具在本地使用。支持自然语言构建、优化和部署数据管道、分析和机器学习工作负载。
Q3:Cortex Code如何帮助企业加速AI项目落地?
A:Cortex Code通过减少从实验想法转向生产级解决方案的手动工作来加速项目落地。由于在试点阶段就内置了企业上下文,可以减少重写和重新验证步骤,降低代码在生产环境中失败的风险,帮助企业更快地从实验转向可扩展部署。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。