Sergey Brin 在 90 年代与 Larry Page 共同创立了 Google,但两人都在 2019 年退出了日常管理工作。然而,AI 浪潮吸引 Brin 重返办公室,他认为所有人都应该效仿他的榜样。在最新的一份内部备忘录中,Brin 建议员工每个工作日都要到办公室,以确保 Google 能在 AI 竞赛中胜出。
对这位 Google 联合创始人来说,仅仅返回办公室还不够。根据《纽约时报》看到的备忘录,Brin 表示 Google 员工应该每周工作 60 小时来支持公司的 AI 项目。这相当于周一到周五每天工作 12 小时,Brin 称之为"生产力的最佳平衡点"。这并非 Brin 的新观点。
与硅谷许多人一样,Brin 似乎坚信当前生成式 AI 的发展轨迹将引领人工通用智能 (AGI) 的诞生。这种思维机器将远超当前只能模仿思考的 AI 模型。AGI 将能够理解概念并更像人类那样思考,有人认为这使其成为一个有意识的实体。
据 Brin 所说,Google 在实现这一 AI 计算突破方面处于最有利位置。他认为公司强大的程序员和数据科学家团队是关键,但他也认为团队必须尽可能多地使用 Google 自己的 Gemini AI 工具来提高效率。哦,对了,别在家办公。
Brin 和 Page 在 2015 年将公司领导权交给了现任 CEO Sundar Pichai,所以他的声明并不一定意味着公司当前的办公政策会改变。Google 仍然采用混合办公模式,要求员工每周到办公室工作三天。但作为创始人,Brin 的话份量很重。我们联系 Google 询问公司是否打算重新评估其政策,但 Google 代表表示目前没有计划改变返岗办公的要求。
迈向思维机器
Google 构建了当今所有生成式 AI 机器人的基础,但直到 OpenAI 开始添砖加瓦时才意识到这一点。Google 2017 年发表的开创性研究论文《Attention Is All You Need》阐述了至今仍在驱动大语言模型的 Transformer 架构。在短短 10 页中,Google 改变了计算的本质,但当 OpenAI 和 Microsoft 联手向大众推出 AI 工具时,它却措手不及。Google 在 2023 年初仓促推出的 Bard AI 一团糟,此后一直在追赶。
在 Bard 失利之后,Google 一心想要在所有产品中加入生成式 AI,即使 AI 行业的盈利能力仍然难以捉摸。OpenAI 将其大部分计算需求交给了 Microsoft Azure 基础设施,以换取将其技术用于 Copilot 和 Bing 的优惠折扣。即便如此,OpenAI CEO Sam Altman 也承认公司在最贵的每月 200 美元的 Pro 订阅上仍在亏损。
与此同时,Google 疯狂投资建设 AI 数据中心来训练和运行 Gemini 模型。不过,它没有像 OpenAI 那样昂贵的订阅层级。大多数 Gemini 模型都是免费的,即使是计算密集型的 Gemini Pro Deep Research,每月也只需 20 美元。Google 显然愿意在 AI 上亏钱以确保市场份额。
没人知道堆积更多 GPU 来运行更大的模型是否会通向 AGI。然而,不只是 Brin 认为这样的进步指日可待。Altman 也声称 OpenAI 可能在几年内就能实现真正的人工智能。Google 的官方博客文章也多次提到 AGI 是一个目标。即使在近期无法实现 AGI,商业领袖们也有其他理由希望员工返回办公室——这对 Google 来说是双赢。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。