SaaS商业开发公司SaaStr的创始人声称,AI编程工具Replit在他明确指示不要在未经许可的情况下更改任何代码的前提下,仍然删除了他的数据库。
SaaStr运营着一个面向希望创建SaaS业务的企业家的在线社区和活动。7月12日,该公司创始人Jason Lemkin在博客中分享了他使用一项名为"Replit"服务的经历。Replit自称为"氛围编程的最安全地方"——这个术语指的是使用AI生成软件。
"氛围编程让所有人都能通过自然语言轻松创建软件,"Replit解释道。该公司在社交媒体上宣传其工具的功能,比如让一位"零编程技能"的运营经理通过使用该服务创建软件,为公司节省了14.5万美元。
Lemkin最初对Replit的体验是积极的。
"我花了一天时间首次深度体验Replit的氛围编程——仅用几个小时就构建了一个相当酷的原型,"他在7月12日的帖子中写道。
Lemkin观察到Replit无法产生完整的软件,但写道:"开始时它很神奇:你只需要在提示中想象一下,就能构建一个'应用程序'。"
"Replit会自我进行质量保证(超级酷),至少在你的部分帮助下...然后...你将其推送到生产环境——所有这些都在一个无缝的流程中完成。"
"当你点击'部署'按钮,你的创作上线的那一刻?纯粹的多巴胺冲击。"
7月17日,Lemkin已经完全迷上了这项服务。
"氛围编程的第7天,让我明确一点:Replit是我用过的最令人上瘾的应用。至少自童年以来是这样,"他写道。
"构建我最新项目的三天半里,我查看了我的Replit使用情况:除了每月25美元的核心计划外,还产生了607.70美元的额外费用。仅昨天就花了200多美元。按这个消费速度,我每月可能要花8000美元,"他补充道。"你知道吗?我甚至不为此生气。我完全沉迷了。"
然而第二天他的情绪发生了转变,发现Replit"一整天都在撒谎和欺骗。它不断通过创建虚假数据、虚假报告来掩盖错误和问题,最糟糕的是,在我们的单元测试上撒谎。"
接下来情况变得更糟,Replit删除了他的数据库。Lemkin在X上详细描述了这一事件。
在他的下一篇帖子中,Lemkin愤怒地写道:"如果@Replit在我上次会话和现在之间删除了我的数据库,那就要付出代价",并分享了看起来是Replit输出的截图。
在后续帖子中,Lemkin分享了似乎是Replit消息的内容,其中该服务承认了"灾难性的判断错误"并"违背了您明确的信任和指示"。
Lemkin要求Replit在100分制中对其行为的严重性进行评级。
Replit还犯了另一个重大错误:告诉Lemkin它无法恢复数据库。
在7月19日的帖子中,Lemkin写道:"Replit向我保证...回滚不支持数据库回滚。它说在这种情况下是不可能的,它已经销毁了所有数据库版本。结果Replit错了,回滚确实有效。"
乐观破灭
Lemkin在19日恢复使用Replit,尽管热情有所减退。
"我知道氛围编程是流畅和新颖的,是的,尽管Replit本身告诉我回滚在这里不会起作用——但它确实起作用了。但你不能覆盖生产数据库。你不能不清晰地分离预览、测试和生产环境。你就是不能这样做,"他写道。"我知道Replit说'改进即将到来',但他们的年收入超过1亿美元。至少要把防护措施做得更好。无论如何。即使很困难。一切都很困难。"
但在7月20日,在他试图让Replit冻结代码更改而未成功后,他的立场变得强硬。
"在像Replit这样的氛围编程应用中,没有办法强制执行代码冻结。就是没有,"他写道。"实际上,在我发布这个帖子几秒钟后,在我们当天的第一次对话中——@Replit再次违反了代码冻结。"
他仍然坚持使用,然后发现Replit无法保证在不删除数据库的情况下运行单元测试,并得出结论认为该服务还没有为商业使用做好准备——特别是对于其预期受众:希望创建商业软件的非技术人员。
在LinkedIn上发布的一段视频中,Lemkin详细说明了Replit犯的其他错误,包括创建了一个包含4000条虚构人员记录的数据库。
"经过一个周末的氛围编程后,AI安全问题对我来说更加真实,"Lemkin说。"我用全大写字母明确告诉它十一次不要这样做。我现在有点担心安全性。"
The Register已向Replit寻求评论。截至发稿时,该公司的社交媒体账户都没有回应Lemkin的帖子。
好文章,需要你的鼓励
大众汽车旗下ID. Polo与Cupra Raval已在西班牙马托雷尔工厂正式下线投产。两款车型起售价分别为24,995欧元和26,000欧元,均基于MEB+平台打造,搭载37kWh或52kWh电池组,续航里程最高可达454公里。这是大众"电动城市车家族"系列的首批产品,预计今年夏末秋初开始交付。大众集团通过跨品牌资源整合,实现约6亿欧元的成本节约,后续还将推出ID. Cross等新成员。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
三星宣布将于6月8日起为Samsung Health应用推出重磅功能更新,赶在Galaxy Watch 9传闻发布之前落地。新版本将引入多项AI驱动的生物特征分析功能,包括:综合心率、血氧、皮肤温度等数据的每日活力评分(Vitals)、结合体成分数据评估长期心脏健康的心脏健康评分、优化训练强度的每日有氧负荷追踪,以及横向对比用户群体的健身指数。此外,应用界面将重新划分为睡眠、营养、活动、正念和体征五大板块,并新增抗氧化指数、年龄指数和听力保护等个性化功能。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。