由于我们正迈入 AI 将撰写大部分代码的时代,让我们花点时间庆祝那些在推动这一进步前沿的人们。
首先,很明显这一切进展迅速。各大公司纷纷谈论目前由 AI 编写代码所占的比例,而且这一比例正以惊人的速度攀升。此领域已出现大量工作岗位的替代现象。
但有几位极具影响力的人物,凭借对 AI 工具和流程的精通以及对这种技术进步如何展开的独到见解,正逐渐成为家喻户晓的名字。
其中一些先驱还具有预见性——他们公开阐述了自己的观点,且众人正在认真聆听。
下面我们来回顾一下这三位创新者对 2025 年编程世界所发表的一些看法。
Andrej Karpathy
这位前 OpenAI 成员因其在该公司以及近年来在 Tesla 的工作而广为人知。他在 Stanford 获得了与计算机视觉和 NLP(自然语言处理)相关的博士学位。随后,他创立了 Eureka Labs,学生们利用该 AI 原生平台来训练模型。
他最著名的名言是: “ English is the hottest new programming language.”
这句话直接涉及了 vibe coding,并描述了程序员转变为提示工程师的过程。因为 AI 能够自己编写代码,所以 vibe coding 就是提供那些更宏观的提示,观察输出结果,并对其进行微调以获得最终成果。
Riley Brown
Riley Brown 在 YouTube 上非常活跃,并在 AI 领域享有盛名。他实际上创办了一家公司,名为 Vibe Code,该平台旨在帮助开发者借助 AI 工具将他们的项目变为现实。
事实上,人们将“vibe coding”这一术语归功于 Brown,正是他强调如何在追求创造性和不断进化的应用程序时,摒弃传统的确定性编码方式,从而创造出这一概念。
他的名言是: “ manually writing code is going to be a thing of the past.”
而这一变革正在发生。
Tom Preston-Werner
Tom Preston-Werner(至少我所知,他与前者并无直接关系)以其独特的编程风格在线上受到广泛赞誉,他还是代码管控与协作平台 GitHub 的联合创始人。
他还创建了 Jeckyl,一个用于动态网站和博客转换的工具。
他的名言是: “ You’re either one that creates the automation, or you’re getting automated.”
Podcasting Notes
值得注意的是,在这三位中,Brown 与 Karpathy 最近都曾在我最喜爱的播客之一 AI Daily Brief with Nathaniel Whittemore( Nathaniel Whittemore 主持)中接受采访。
具体来说,Whittemore 花时间朗读了 Karpathy 一篇名为 “Power to the People” 的论文中的一些引述,在该文中,这位工程师阐述了 AI 的一些基本特性。以下是部分引述:
“ Transformative technologies usually follow a top-down diffusion path: originating in government or military contexts, passing through corporations, and eventually reaching individuals - think electricity, cryptography, computers, flight, the internet, or GPS. This progression feels intuitive, new and powerful technologies are usually scarce, capital-intensive, and their use requires specialized technical expertise in the early stages. So it strikes me as quite unique and remarkable that LLMs display a dramatic reversal of this pattern - they generate disproportionate benefit for regular people, while their impact is a lot more muted and lagging in corporations and governments.”
“ LLMs offer a very specific profile of capability - that of merely quasi-expert knowledge/performance, but simultaneously across a very wide variety of domains. In other words, they are simultaneously versatile but also shallow and fallible.”
“ Looking forward, the continued diffusion of LLMs of course depends on continued performance improvement and its capability profile. The "benefit distribution" overall is particularly interesting to chart, and depends heavily on the dynamic range of the performance as a function of capital expenditure.”
论文中还有更多内容。这三个引述展示了关于大语言模型使用的一些深层次观点。第一段阐明了 “ power to the people ” 的论点,以及大语言模型如何区别于其他从上而下的技术模式。第二段讲述了模型的专业化程度及其运行方式。第三段则探讨了成本、性能与力量之间的关系。
这就是我们在逐步消化 AI 在我们生活、商业及其他领域中突然融入时,可以作为参考吸取的一些见解。请记住:自动化正在到来。
好文章,需要你的鼓励
科技专家Sungjoo Yoon在TED演讲中提出"偏好原理",认为了解用户喜好信息越多,就能创造更强大的技术。他将市场变化比作"地壳运动",从1969年命令行界面到80年代GUI,再到90年代网络界面,技术发展都遵循这一规律。自然语言处理能建立信任,而AI智能体时代的到来意味着非人类参与者将在人类主导的世界中发挥作用。
德国图宾根大学研究团队发现现代AI视觉模型具备强大的图像排序能力,能够理解年龄、美观程度等连续属性并进行准确排序。研究测试了7种AI模型在9个数据集上的表现,发现CLIP模型表现最佳,且仅需极少样本就能学会排序。这一突破为照片管理、电商展示、社交媒体等领域提供了新的技术方案。
微软推出了Copilot Vision AI新功能,该技术能够扫描和分析用户屏幕上的所有内容。这项AI视觉技术可以实时理解用户正在查看的信息,包括文本、图像和应用程序界面,为用户提供更加智能化的交互体验和个性化建议。此功能的推出标志着AI助手向更深层次的用户体验集成迈进。
KAUST团队开发UnMix-NeRF技术,首次实现3D场景重建与材料识别的同步。该系统利用光谱成像技术,能够识别物体的材料特性,不仅重建逼真3D场景,还可自动分离不同材料区域。技术在多个数据集上表现优异,为机器人、增强现实、工业检测等领域带来新突破。