Google在其开源软件工程智能体Gemini CLI中新增了计划模式功能,该智能体在命令行环境下运行。
Gemini CLI计划模式特性介绍
3月11日发布的计划模式,让Gemini CLI首先专注于分析请求,规划复杂更改,并在只读模式下理解代码库或依赖关系,避免意外更改或执行带来的风险。计划模式还会在提出策略供用户审查之前,通过提问来明确目标。据Google介绍,计划模式现已默认为所有用户启用。用户可以随时通过在输入框中输入"/plan"、按Shift+Tab键循环切换审批模式,或直接要求智能体"启动计划"来进入计划模式。
计划模式安全机制与功能
Google表示,计划模式将Gemini CLI限制为只读工具子集,如read_file、grep_search和glob等,用于验证假设。在该模式下,智能体可以浏览代码库、搜索模式和阅读文档,但除了自己的内部计划外,不能修改任何文件。用户可以要求Gemini CLI"研究如何迁移此数据库"或"规划新功能",系统会映射依赖关系并提出解决方案,而不存在急于更改代码的风险。新引入的ask_user工具允许智能体暂停研究,提出针对性问题来明确用户目标或收集缺失信息。
Q&A
Q1:Gemini CLI的计划模式有什么作用?
A:计划模式让Gemini CLI在只读模式下分析请求、规划复杂更改并理解代码库依赖关系,避免意外修改风险。它会先通过提问明确目标,然后提出策略供用户审查,确保安全的代码分析和规划过程。
Q2:如何进入Gemini CLI的计划模式?
A:用户可以通过三种方式进入计划模式:在输入框中输入"/plan"、按Shift+Tab键循环切换审批模式,或直接要求智能体"启动计划"。该模式现已默认为所有用户启用。
Q3:计划模式下Gemini CLI能执行哪些操作?
A:在计划模式下,智能体只能使用只读工具如read_file、grep_search和glob等,可以浏览代码库、搜索模式和阅读文档,但不能修改任何文件。新增的ask_user工具还允许智能体提问以明确用户需求。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。