浪费时间是一个主观概念。有人觉得花一个下午为乐高死星模型做最后润色是享受,另一人可能觉得这是令人头脑麻木的苦差事。还有投资成本的考虑。你可能花费两周时间和一笔巨款,最后发现制作微缩船模并不能真正激起你的兴趣。
模型火车、跑步俱乐部、机器人技术和编程课程听起来都很有趣——直到你意识到自己更想飞翔,跑鞋的价格远超应有水平,而且你不是前端/后端开发人员,更像是"Java有多无聊就有多无止境"那类人。
我使用完全相同的提示词询问了三个不同的AI系统——Claude AI、Google Gemini和ChatGPT——关于我配偶下一个爱好应该是什么,结果令人惊讶。
Claude:精准洞察
以下是我写的提示词:"我是一名39岁的英国裔美国男性。我住在加利福尼亚州洛杉矶,已婚,养了一只狗和一只猫。我住在有后院空间的房子里。我喜欢旅行、阅读、玩电子游戏,现在想在活动清单中添加一个新爱好。我也喜欢淘便宜货,因为这是我职业相关的。你能推荐三个我应该考虑的爱好吗?请告诉我所需的经济和时间投入,以及你认为每个爱好的优缺点。我有固定的朝九晚五工作,所以需要在这个限制下进行。"
园艺是许多人只有到了黄金年龄才开始欣赏的爱好,但三个AI系统都推荐它作为一种轻松消磨时间、投入最少且花费不多的方式。
第二个建议是转售和淘选古董物品,第三个是自制啤酒、苹果酒或蜂蜜酒。它详细介绍了时间和经济投入、优缺点,以及为什么认为这些爱好适合我丈夫基于那个简短的提示。
Claude AI在迎合提示者需求和性格方面特别周到,指出园艺可能是省钱的好方法——也许是认识到找便宜货是我这个小气鬼丈夫根深蒂固的性格特征。
Gemini:兴趣结合
Gemini建议寻找和转售老式电子游戏、书籍和其他老媒体作为消遣,这可以与使用积分旅行很好地配对。它还推荐酿造啤酒作为在已经种满植物的后院消磨时间的方式(除了"高产城市果园园艺")。
Gemini善于使用我配偶提示中的细节来指导建议,创造了一个包装精美、整体性的方法,说明他如何在繁忙的朝九晚五工作之余度过空闲时间。
ChatGPT:夜晚活动
除了后院园艺(再次),ChatGPT是唯一建议夜间爱好的AI系统:业余天文学。其他大多数系统专注于在周末去庭院拍卖会或在家消磨时间的方式。
观星可能是度过周五夜晚的有趣方式,但我们住在洛杉矶。头顶的许多"星星"实际上可能是卫星,找到一个好的观测点可能意味着要勇敢面对交通拥堵和在城市天际线上自拍的人群。
ChatGPT的另一个建议是在我们的后院养蜂:
考虑到原始提示中没有提到对食物、昆虫或任何与蜜蜂复杂照料相关的兴趣——或蜂法,养蜂似乎完全偏离了主题。根据ChatGPT的说法,时间投入每月只需两到四个小时(尽管当地养蜂人可能对此有争议)。
总体而言,ChatGPT的推荐与提示者的真实兴趣最不相关,该工具用来解释为什么做出这些推荐的逻辑非常薄弱。
我就是不能相信"许多全职专业人士"在享受电子游戏的同时还会副业养蜂。
希望AI能为你提供一些创造性的时间消磨想法,不需要购买全身防护服。
Q&A
Q1:三个AI系统在推荐爱好方面有什么不同表现?
A:Claude AI最周到,能精准迎合用户需求和性格特征,如推荐园艺时考虑到省钱需求。Gemini善于结合用户的多个兴趣点,创造整体性方案。ChatGPT的建议最不相关,逻辑薄弱,如推荐养蜂这种与用户兴趣无关的活动。
Q2:为什么园艺成为了所有AI系统的共同推荐?
A:三个AI系统都推荐园艺,认为它是一种轻松消磨时间、投入最少且花费不多的爱好。对于有后院空间、喜欢省钱的用户来说,园艺既实用又经济,符合朝九晚五工作者的时间安排。
Q3:ChatGPT推荐的养蜂爱好为什么不合适?
A:养蜂推荐完全偏离了用户兴趣,原始提示中没有提到对食物、昆虫或蜜蜂照料的兴趣。而且作者质疑ChatGPT声称"许多全职专业人士"会在玩电子游戏之余养蜂的逻辑,认为这种关联性很薄弱。
好文章,需要你的鼓励
大众汽车旗下ID. Polo与Cupra Raval已在西班牙马托雷尔工厂正式下线投产。两款车型起售价分别为24,995欧元和26,000欧元,均基于MEB+平台打造,搭载37kWh或52kWh电池组,续航里程最高可达454公里。这是大众"电动城市车家族"系列的首批产品,预计今年夏末秋初开始交付。大众集团通过跨品牌资源整合,实现约6亿欧元的成本节约,后续还将推出ID. Cross等新成员。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
三星宣布将于6月8日起为Samsung Health应用推出重磅功能更新,赶在Galaxy Watch 9传闻发布之前落地。新版本将引入多项AI驱动的生物特征分析功能,包括:综合心率、血氧、皮肤温度等数据的每日活力评分(Vitals)、结合体成分数据评估长期心脏健康的心脏健康评分、优化训练强度的每日有氧负荷追踪,以及横向对比用户群体的健身指数。此外,应用界面将重新划分为睡眠、营养、活动、正念和体征五大板块,并新增抗氧化指数、年龄指数和听力保护等个性化功能。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。