Databricks联合创始人兼首席技术官马泰·扎哈里亚(Matei Zaharia)险些错过了那封改变他生活的邮件——那封邮件告知他,他将荣获2026年度ACM计算奖。"确实是个惊喜,"他在接受TechCrunch采访时表示。
2009年,扎哈里亚在加州大学伯克利分校攻读博士期间,在著名教授Ion Stoica的指导下,开发出一项开创性技术,并将其命名为Spark——一个开源项目。Spark的诞生极大地提升了当时处理大数据的效率,打破了大数据处理缓慢、笨重的僵局。那个年代,大数据之于产业界,正如今日AI之于科技世界。这位年仅28岁的年轻人,凭借这一成果迅速成为科技圈的明星人物。
此后,扎哈里亚一直主导Databricks的工程方向,将其发展为云存储领域的巨头,并逐步转型为AI与智能体的数据基础平台。迄今为止,公司已累计融资逾200亿美元,估值达1340亿美元,年营收突破54亿美元,堪称硅谷创业神话的完美诠释。
本周三,美国计算机协会(ACM)正式向扎哈里亚颁发这一奖项,以表彰他在计算机科学领域的杰出贡献。该奖项附带25万美元奖金,他表示将全数捐献给慈善机构,具体受益方尚未确定。
身兼Databricks首席技术官与加州大学伯克利分校副教授两职,扎哈里亚始终将目光投向未来。与硅谷众多人士一样,他所描绘的未来,AI无处不在。
"AGI其实已经到来,只是还不是我们所期待的那种形态,"他对TechCrunch说道。"更重要的一点是:我们应该停止用人类的标准去衡量AI模型。"
他举例说明:一个人只有在积累了大量知识之后,才能通过律师资格考试;而AI可以轻易吸收海量信息。但如果AI能够正确回答知识性问题,这并不等同于它拥有通用知识能力。
将AI拟人化的倾向,可能带来深远的负面影响。他以广受关注的AI智能体OpenClaw为例指出:"一方面,它非常强大,可以自动完成大量任务。"然而另一方面,它也是"一场安全噩梦"——因为它被设计成模拟一个受信任的人类助手,用户甚至会将密码等敏感信息托付给它,这就带来了被黑客攻击的风险,或者因浏览器处于登录状态,智能体擅自动用用户银行账户进行消费。
"它不是一个小小的人类,"他直言道。
作为学者与产品工程师,扎哈里亚对AI最感兴趣的方向,是如何用AI实现科研自动化——无论是生物学实验,还是数据整合。
就像"氛围编程"(Vibe Coding)让原型开发和编程变得触手可及一样,他相信,准确、无幻觉的AI驱动研究工具,终将走进每个人的日常生活。
"并不是所有人都需要开发应用程序,但几乎每个人都需要理解信息,"他说。未来,通过发挥AI的真正优势来为人类服务:诊断汽车的每一声异响,扫描超越文字与图像的无线电波、微波信号,或者正如他在学生群体中观察到的那样,模拟分子层面的变化并预测其效果。
"我最兴奋的事情,是我所说的'AI搜索',但具体来说,是面向科研或工程领域的深度研究,"他说。
Q&A
Q1:ACM计算奖是什么?为什么扎哈里亚能获得这个奖项?
A:ACM计算奖是由美国计算机协会颁发的权威技术奖项,附带25万美元奖金。扎哈里亚获此殊荣,是因为他在计算机科学领域的系列杰出贡献,其中最具代表性的是他在博士期间开发的开源大数据处理框架Spark,该项目极大地提升了大数据处理效率,深刻影响了整个科技行业的发展走向。
Q2:扎哈里亚说的"AGI已经到来"是什么意思?
A:扎哈里亚认为,AGI(通用人工智能)在某种形式上已经存在,只是还不符合人们的预期想象。他的核心观点是,我们不应该用人类的标准去评价AI,因为AI处理信息的方式与人类本质不同。例如,AI可以轻松吸收海量知识,但这并不代表它具备真正的通用智能,两者不能简单画等号。
Q3:扎哈里亚认为AI智能体目前最大的安全风险是什么?
A:扎哈里亚以AI智能体OpenClaw为例指出,当前AI智能体被设计成模拟受信任的人类助手,用户往往会将密码等敏感信息托付给它。这种拟人化设计带来了显著的安全隐患:一旦遭到黑客攻击,或者智能体在用户浏览器登录状态下自行操作,就可能造成账户资金被未经授权使用等严重后果。
好文章,需要你的鼓励
AI软件开发自动化初创公司8090 Solutions宣布完成1.35亿美元A轮融资,由Salesforce Ventures领投。8090由知名风险投资人Chamath Palihapitiya于2024年创立,其核心产品"Software Factory"是一款AI平台,通过自然语言文档帮助企业加速应用开发,支持现有程序现代化改造及全新应用构建。此次融资将用于扩充团队规模和基础设施建设。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。