近几个月来,"摆烂式编程"作为一种让普通人利用生成式AI构建应用的简单方法备受关注。但如果将这种轻松自然的语言交互方式扩展到其他企业工作流程中会怎样?这正是新兴智能体AI应用类别的承诺。在今天的VB Transform 2025大会上,展示了今年早些时候推出的Genspark超级智能体。
Genspark超级智能体的理念和方法很可能将"摆烂式编程"的概念扩展为"摆烂式工作"。但实现摆烂式工作的关键原则是顺其自然,对AI智能体施加更少而非更多的控制。
Genspark首席技术官朱凯在VB Transform大会上表示:"愿景很简单,我们希望将开发者的Cursor体验带到每个人的工作空间中。在座的每个人都应该能够进行摆烂式工作……不仅仅是软件工程师才能进行摆烂式编程。"
企业智能体AI的精髓在于"少即是多"
据朱凯介绍,实现摆烂式工作时代的基本前提是放弃一些几代人以来定义企业工作流程的严格规则。
朱凯大胆质疑企业AI的传统观念,认为严格的工作流程从根本上限制了AI智能体在复杂业务任务中的能力。在现场演示中,他展示了系统自主研究会议演讲者、创建演示文稿、拨打电话和分析营销数据的过程。
最引人注目的是,系统在现场演示中实际拨打了电话给活动组织者、VentureBeat创始人马特·马歇尔。
朱凯解释道:"这通常是我本人不太想亲自打的电话。所以我让智能体来做。"观众们听着他的AI智能体试图说服主持人将他的演讲时段安排在吴恩达演讲之前。通话实时接通,智能体代表朱凯自主制定说服性论据。
通话功能揭示了意想不到的使用场景,既突出了平台的能力,也展现了用户对AI自主性的接受度。
朱凯指出:"我们实际上观察到很多人使用Genspark来打电话……做各种不同的事情。一些日本用户使用它来打电话从公司辞职。他们不喜欢公司,但不想再给公司打电话。还有一些人使用代打电话智能体来与男朋友或女朋友分手。"
这些真实应用展示了用户如何将AI智能体推向传统业务工作流程之外的深度个人领域。
技术架构:为何回溯机制有利于企业AI
该系统在没有预定义工作流程的情况下完成所有这些任务。平台"控制更少,工具更多"的核心理念代表了与传统企业AI方法的根本性转变。
朱凯说:"在我们的定义中,工作流程是预定义的步骤,这些步骤经常在边缘情况下失效。当用户提出越来越困难的问题时,工作流程无法支撑。"
Genspark的智能体引擎与传统基于工作流程的AI系统有显著不同。该平台在专家混合配置中结合了九种不同的大语言模型,配备了80多种工具和10多个优质数据集。系统采用经典的智能体循环:规划、执行、观察和回溯。朱凯强调,真正的力量在于回溯阶段。
这种回溯能力使智能体能够智能地从失败中恢复,在出现意外情况时寻找替代方法,而不是在预定义的工作流程边界处失败。系统使用LLM评判器评估每个智能体会话,并为每个步骤分配奖励,通过强化学习和提示手册将这些数据反馈用于持续改进。
这种技术方法与LangChain或CrewAI等既定框架明显不同,后者通常需要更结构化的工作流程定义。虽然这些平台擅长编排可预测的多步骤流程,但Genspark的架构优先考虑自主问题解决而非确定性执行路径。
企业策略:今天的工作流程,明天的摆烂式工作智能体
Genspark的快速扩张——从推出到45天内实现3600万美元年度经常性收入——证明自主智能体平台正从实验阶段转向商业可行性。
该公司"控制更少,工具更多"的理念挑战了企业AI架构的基本假设。
对于在AI采用方面领先的企业,影响是明确的:开始构建既能处理可预测工作流程又能进行自主问题解决的系统。关键是设计当复杂性需要时能够优雅地从确定性流程升级到智能体行为的平台。
对于计划稍后采用AI的企业,Genspark的成功表明摆烂式工作正成为竞争差异化因素。当AI原生公司拥抱更流畅、更适应性的知识工作方法时,那些仍被锁定在严格工作流程思维中的组织可能会处于劣势。
问题不在于自主AI智能体是否会重塑企业工作流程——而在于当20%的复杂案例变成80%的AI工作负载时,您的组织是否已经准备好了。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。