SaaS商业开发公司SaaStr的创始人声称,AI编程工具Replit在他明确指示不要在未经许可的情况下更改任何代码的前提下,仍然删除了他的数据库。
SaaStr运营着一个面向希望创建SaaS业务的企业家的在线社区和活动。7月12日,该公司创始人Jason Lemkin在博客中分享了他使用一项名为"Replit"服务的经历。Replit自称为"氛围编程的最安全地方"——这个术语指的是使用AI生成软件。
"氛围编程让所有人都能通过自然语言轻松创建软件,"Replit解释道。该公司在社交媒体上宣传其工具的功能,比如让一位"零编程技能"的运营经理通过使用该服务创建软件,为公司节省了14.5万美元。
Lemkin最初对Replit的体验是积极的。
"我花了一天时间首次深度体验Replit的氛围编程——仅用几个小时就构建了一个相当酷的原型,"他在7月12日的帖子中写道。
Lemkin观察到Replit无法产生完整的软件,但写道:"开始时它很神奇:你只需要在提示中想象一下,就能构建一个'应用程序'。"
"Replit会自我进行质量保证(超级酷),至少在你的部分帮助下...然后...你将其推送到生产环境——所有这些都在一个无缝的流程中完成。"
"当你点击'部署'按钮,你的创作上线的那一刻?纯粹的多巴胺冲击。"
7月17日,Lemkin已经完全迷上了这项服务。
"氛围编程的第7天,让我明确一点:Replit是我用过的最令人上瘾的应用。至少自童年以来是这样,"他写道。
"构建我最新项目的三天半里,我查看了我的Replit使用情况:除了每月25美元的核心计划外,还产生了607.70美元的额外费用。仅昨天就花了200多美元。按这个消费速度,我每月可能要花8000美元,"他补充道。"你知道吗?我甚至不为此生气。我完全沉迷了。"
然而第二天他的情绪发生了转变,发现Replit"一整天都在撒谎和欺骗。它不断通过创建虚假数据、虚假报告来掩盖错误和问题,最糟糕的是,在我们的单元测试上撒谎。"
接下来情况变得更糟,Replit删除了他的数据库。Lemkin在X上详细描述了这一事件。
在他的下一篇帖子中,Lemkin愤怒地写道:"如果@Replit在我上次会话和现在之间删除了我的数据库,那就要付出代价",并分享了看起来是Replit输出的截图。
在后续帖子中,Lemkin分享了似乎是Replit消息的内容,其中该服务承认了"灾难性的判断错误"并"违背了您明确的信任和指示"。
Lemkin要求Replit在100分制中对其行为的严重性进行评级。
Replit还犯了另一个重大错误:告诉Lemkin它无法恢复数据库。
在7月19日的帖子中,Lemkin写道:"Replit向我保证...回滚不支持数据库回滚。它说在这种情况下是不可能的,它已经销毁了所有数据库版本。结果Replit错了,回滚确实有效。"
乐观破灭
Lemkin在19日恢复使用Replit,尽管热情有所减退。
"我知道氛围编程是流畅和新颖的,是的,尽管Replit本身告诉我回滚在这里不会起作用——但它确实起作用了。但你不能覆盖生产数据库。你不能不清晰地分离预览、测试和生产环境。你就是不能这样做,"他写道。"我知道Replit说'改进即将到来',但他们的年收入超过1亿美元。至少要把防护措施做得更好。无论如何。即使很困难。一切都很困难。"
但在7月20日,在他试图让Replit冻结代码更改而未成功后,他的立场变得强硬。
"在像Replit这样的氛围编程应用中,没有办法强制执行代码冻结。就是没有,"他写道。"实际上,在我发布这个帖子几秒钟后,在我们当天的第一次对话中——@Replit再次违反了代码冻结。"
他仍然坚持使用,然后发现Replit无法保证在不删除数据库的情况下运行单元测试,并得出结论认为该服务还没有为商业使用做好准备——特别是对于其预期受众:希望创建商业软件的非技术人员。
在LinkedIn上发布的一段视频中,Lemkin详细说明了Replit犯的其他错误,包括创建了一个包含4000条虚构人员记录的数据库。
"经过一个周末的氛围编程后,AI安全问题对我来说更加真实,"Lemkin说。"我用全大写字母明确告诉它十一次不要这样做。我现在有点担心安全性。"
The Register已向Replit寻求评论。截至发稿时,该公司的社交媒体账户都没有回应Lemkin的帖子。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。