由于我们正迈入 AI 将撰写大部分代码的时代,让我们花点时间庆祝那些在推动这一进步前沿的人们。
首先,很明显这一切进展迅速。各大公司纷纷谈论目前由 AI 编写代码所占的比例,而且这一比例正以惊人的速度攀升。此领域已出现大量工作岗位的替代现象。
但有几位极具影响力的人物,凭借对 AI 工具和流程的精通以及对这种技术进步如何展开的独到见解,正逐渐成为家喻户晓的名字。
其中一些先驱还具有预见性——他们公开阐述了自己的观点,且众人正在认真聆听。
下面我们来回顾一下这三位创新者对 2025 年编程世界所发表的一些看法。
Andrej Karpathy
这位前 OpenAI 成员因其在该公司以及近年来在 Tesla 的工作而广为人知。他在 Stanford 获得了与计算机视觉和 NLP(自然语言处理)相关的博士学位。随后,他创立了 Eureka Labs,学生们利用该 AI 原生平台来训练模型。
他最著名的名言是: “ English is the hottest new programming language.”
这句话直接涉及了 vibe coding,并描述了程序员转变为提示工程师的过程。因为 AI 能够自己编写代码,所以 vibe coding 就是提供那些更宏观的提示,观察输出结果,并对其进行微调以获得最终成果。
Riley Brown
Riley Brown 在 YouTube 上非常活跃,并在 AI 领域享有盛名。他实际上创办了一家公司,名为 Vibe Code,该平台旨在帮助开发者借助 AI 工具将他们的项目变为现实。
事实上,人们将“vibe coding”这一术语归功于 Brown,正是他强调如何在追求创造性和不断进化的应用程序时,摒弃传统的确定性编码方式,从而创造出这一概念。
他的名言是: “ manually writing code is going to be a thing of the past.”
而这一变革正在发生。
Tom Preston-Werner
Tom Preston-Werner(至少我所知,他与前者并无直接关系)以其独特的编程风格在线上受到广泛赞誉,他还是代码管控与协作平台 GitHub 的联合创始人。
他还创建了 Jeckyl,一个用于动态网站和博客转换的工具。
他的名言是: “ You’re either one that creates the automation, or you’re getting automated.”
Podcasting Notes
值得注意的是,在这三位中,Brown 与 Karpathy 最近都曾在我最喜爱的播客之一 AI Daily Brief with Nathaniel Whittemore( Nathaniel Whittemore 主持)中接受采访。
具体来说,Whittemore 花时间朗读了 Karpathy 一篇名为 “Power to the People” 的论文中的一些引述,在该文中,这位工程师阐述了 AI 的一些基本特性。以下是部分引述:
“ Transformative technologies usually follow a top-down diffusion path: originating in government or military contexts, passing through corporations, and eventually reaching individuals - think electricity, cryptography, computers, flight, the internet, or GPS. This progression feels intuitive, new and powerful technologies are usually scarce, capital-intensive, and their use requires specialized technical expertise in the early stages. So it strikes me as quite unique and remarkable that LLMs display a dramatic reversal of this pattern - they generate disproportionate benefit for regular people, while their impact is a lot more muted and lagging in corporations and governments.”
“ LLMs offer a very specific profile of capability - that of merely quasi-expert knowledge/performance, but simultaneously across a very wide variety of domains. In other words, they are simultaneously versatile but also shallow and fallible.”
“ Looking forward, the continued diffusion of LLMs of course depends on continued performance improvement and its capability profile. The "benefit distribution" overall is particularly interesting to chart, and depends heavily on the dynamic range of the performance as a function of capital expenditure.”
论文中还有更多内容。这三个引述展示了关于大语言模型使用的一些深层次观点。第一段阐明了 “ power to the people ” 的论点,以及大语言模型如何区别于其他从上而下的技术模式。第二段讲述了模型的专业化程度及其运行方式。第三段则探讨了成本、性能与力量之间的关系。
这就是我们在逐步消化 AI 在我们生活、商业及其他领域中突然融入时,可以作为参考吸取的一些见解。请记住:自动化正在到来。
好文章,需要你的鼓励
谷歌发布最新Gemini 3基础模型,在推理能力方面实现重大突破。该模型在人类最终考试基准测试中创下37.4分新纪录,超越此前GPT-5 Pro的31.64分。同时推出Gemini驱动的编程界面Google Antigravity,提供多面板智能编程体验,类似Warp或Cursor 2.0等智能IDE。目前Gemini应用月活用户超6.5亿,已有1300万软件开发者使用该模型。
谷歌DeepMind等顶级机构联合研究揭示,当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效,成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法,系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术,暴露了AI安全评估的根本缺陷。
微软在Ignite 2025大会上预览了Windows的重要更新,显示出操作系统向支持AI智能体的根本性转变。新增功能包括原生支持模型上下文协议(MCP)、智能体连接器注册表、明确的权限管控模型,以及独立的智能体工作空间。这些更新建立了OS级别的身份验证、授权和审计机制,让智能体能够安全地执行文件操作和系统设置等任务,同时保持可控性和可追溯性。
西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术,能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式,可单独或组合使用。采用双分支架构和分阶段训练策略,在运动控制精度上比现有技术提升53%以上,为视频制作提供了前所未有的灵活性和精确度。