相信很多人都有过搜索自己名字的习惯,但如今这种操作似乎已经不再像以前那么有意义了。随着越来越多的人开始通过聊天机器人了解他人,网络搜索已不再是获取信息的唯一权威来源。
正是基于这一观察,Thomas Dimson 和 Joey Flynn 共同创建了一个名为 In the Weights 的网站。所谓"权重"(Weights),指的是决定 AI 模型训练过程与输出结果的数值参数。这个网站的目标,是衡量"一个 AI 模型在不借助网络搜索工具的情况下,能够在多大程度上回忆起某个人的信息"。
正如该网站所言:"进入权重,意味着你的存在在构建超级人工智能的过程中被认定是重要的。"
In the Weights 的运作方式是:向多个主流 AI 模型(包括 Grok、Gemini、多个版本的 GPT、Claude、Llama 以及一些较为小众的模型)提出类似这样的问题:"某某是谁?请列出最多 10 条结果,每条附带简短描述和置信度。"随后,网站会将相似的描述归类合并,并生成一个综合"强度评分"。
以文章作者本人为例,其强度评分为 641 分,位于所有被搜索名字的前 6%。不过,当他发现多位 TechCrunch 的同事得分更高时,这份自豪感便打了折扣。此外,排行榜也在不断变动——《小鬼当家》主演麦考利·卡尔金目前以 988 分的高分暂居榜首,与歌剧演唱家卢恰诺·帕瓦罗蒂几乎并驾齐驱。
搜索结果还会显示哪些模型对特定名字给出了哪些答案,并标注潜在的"幻觉"问题。例如,GPT-4.5 Mini 就将"Anthony Ha"解读为"一个可能指多个姓名缩写为 A.H.A. 的人的模糊名字形式"。
在回应 TechCrunch 的询问时,Dimson 表示,他和 Flynn 在离开 OpenAI 之后(两人均通过旗下设计初创公司 Global Illumination 被收购后加入 OpenAI),希望重新激发创作热情,因此萌生了这一想法。
Dimson 提到,他一直在思考"随着更多流量向大语言模型迁移,谷歌自我搜索在 2026 年已经不再是正确的目标",以及"无数人的生命以某种方式被编码在 AI 大脑中的一堆浮点数里"。他还表示,网站的整体方向受到了一篇戏谑性博客文章的启发,该文章将 AI 权重与 Terry Bisson 的经典科幻短篇小说《他们是肉做的》相结合。
"目前的反响非常热烈,我们原本以为这只是一个小众的趣味项目,没想到它触动了很多人想知道自己是否在超级智能中'永生'的心理——当然,能和别人比较分数这一点也功不可没!"Dimson 补充道。
尽管"被聊天机器人记住"是否真的等同于某种形式的永生仍存疑问,但不可否认的是,这个结果既令人着迷,又不免让人产生攀比心理——尤其是当一切都被量化成一个便于对比的分数时。AI 评论人 Anthony Moser 则调侃说,这"实际上就是让 13 个聊天机器人告诉你你是谁"。当然,网站采用的可爱复古任天堂风格设计,也为其加分不少。
Dimson 表示,他计划进一步研究:为何同一系列的不同模型会给出不同结果、哪些模型对特定类型的人存在偏见,以及哪些人"应该拥有维基百科词条却还没有"。
Q&A
Q1:In the Weights 是什么网站,它是如何工作的?
A:In the Weights 是由 Thomas Dimson 和 Joey Flynn 创建的网站,用于衡量 AI 模型在不借助网络搜索的情况下对某个人的"记忆程度"。网站会向 Grok、Gemini、GPT、Claude、Llama 等多个主流 AI 模型提问,询问某人是谁,并将各模型返回的结果归类合并,生成一个"强度评分",分数越高代表该人在 AI 模型中的"存在感"越强。
Q2:In the Weights 的强度评分是怎么算出来的?
A:网站向多个 AI 模型提出"某某是谁?请列出最多 10 条结果,每条附带简短描述和置信度"这类问题,再将各模型返回的相似描述归类合并,最终生成一个综合强度评分。分数越高,说明该名字在 AI 模型的训练权重中被记录得越充分、越准确。目前排行榜实时更新,不同名字的排名会随时变动。
Q3:In the Weights 为什么会标注"幻觉"问题?
A:AI 模型有时会对同一个名字给出不准确或自相矛盾的描述,这种现象被称为"幻觉"。In the Weights 会在结果中高亮标注这类情况,帮助用户识别哪些模型对某个名字的理解存在偏差。例如,GPT-4.5 Mini 就曾将"Anthony Ha"描述为"可能指多个人的模糊名字形式",这显然是一种典型的幻觉输出。
好文章,需要你的鼓励
今天讲的出海案例是依米康,这家数据中心温控与液冷设备厂商正在把泰国纳入海外交付体系,并用生产线、总装车间和焓差实验室承接算力设施订单。
BioMatrix是首个将分子序列、分子三维结构、蛋白质序列、蛋白质三维结构和自然语言统一在单一语言模型中的生物基础模型,在80项任务中77项达到最优或第二优。
Salesforce正式推出Help Agent,这是基于Agentforce平台的预封装AI客服智能体,可在数分钟内连接企业知识库、操作功能及网页、短信、语音等沟通渠道。该产品同步推出按解决率计费模式,每次成功自主解决客户问题收费2美元,无需按token或操作次数计费。Help Agent支持低代码构建,内置测试功能,并配备全新客户服务门户。该产品预计于2026年7月正式上线。
浙江大学提出SKILLHARNESS框架,通过为AI电脑助手的每项技能附加安全边界,从成功、失败和风险三类经历中学习,使AI在动态危险环境中安全高效地完成任务。