“就算死了,我也依然是英雄……”
这句托尼·斯塔克的遗言在《蜘蛛侠:英雄远征》中响彻墓园。缩写同样拼作 EDITH,即铁人曾经用来对抗灭霸等恶势力的超级智能助手 JARVIS 的 AI 后继者的名称。
EDITH 以增强现实 (AR) 眼镜的形式作为礼物降临在彼得·帕克手中。但这些眼镜究竟有多强大?当一个名叫布拉德的对手威胁要将一张彼得的私密照片发给他的暗恋对象 MJ 时,彼得下令 EDITH “干掉他”。
这位 AI 伴侣照单全收。EDITH 对命令执行得极为字面化,向他们所乘的校车发射了致命导弹,几乎将布拉德灭口,幸好彼得及时制止了无人机的攻击。
抛开浪漫的插曲,EDITH 赋予了彼得对卫星网络、监控工具以及武装无人机的控制权。仿佛彼得本就未曾享受过所有高中生只能梦想的那些绝佳特权。戴上 EDITH 眼镜后,他瞬间拥有了如上帝般的操作界面。只需语音指令,便能听命于命,俨然一根神奇魔杖,与另一部代表性文化作品——《哈利·波特》中的魔杖异曲同工。
能否通过 AI 获得超能力?
然而,在这场超级英雄的冒险背后,隐藏着一个更深的幻想:我们能够某种程度上操控生活的“作弊码”。这正是 Cluely AI 所承诺的——一个智能辅助平台,实时为你提供提示,助你更自信地导航生活,就仿佛你一直戴着 AR 眼镜一样。
不同于 EDITH,Cluely AI 并非出自亿万富豪花花公子兼发明家的异想天开。它的诞生源于一件再平常不过的事——据称是 21 岁前哥伦比亚大学学生李宗钦(绰号 Roy)的学术舞弊行为。
据 Medium 报道:“李宗钦的旅程始于一个大胆的想法:打造一款在面试中为求职者提供优势的 AI 工具。在哥伦比亚期间,他研发了 Interview Coder,该工具能在编程面试中实时提供答案,结果他因此因学术不端行为被停学。李宗钦并未就此退却,而是将初衷加倍努力,重新定位其愿景,将之更名为 Cluely,一个在关键时刻低声传递答案的多功能 AI 助手。”
不断失败中前行
李宗钦并没有因这一耻辱性的挫折退缩,而是一心坚持他的初衷。他的初创公司不久便获得了数百万美元的种子资金,同时也因其大胆采用 AI 辅助表现的模式而引起了广泛关注——其中既有正面的评价,也有不少争议的声音。
正如 NDTV 所描述:“Cluely 的 AI 在一个隐藏的浏览器窗口里悄无声息地运行,在考试、销售通话以及面试中提供实时帮助。该公司将这种做法与计算器和拼写检查功能相提并论,辩称那些最初被视为作弊的工具,随着时间的推移终将被普及。”
Cluely AI 最具争议的方面之一在于其公司发布的视频,由李宗钦在约会时使用该应用录制而成。李宗钦在 X(前身为 Twitter)上发布视频时附上了这样一句意味深长的描述:“Cluely 已上线。无所不作弊。”
Cluely AI 的争议性病毒视频
对于还没看过视频的人来说,画面设定在一家高档餐厅。李宗钦与他的约会对象对坐。浪漫的邂逅突然出现转折,因为很明显 Cluely AI 正在实时向李宗钦提供信息——与 EDITH AR 眼镜可能向彼得预警周围危险异曲同工。
他的约会对象全然不知,李宗钦正从一个隐藏的浮层中获得提示,其中包含诸如她的兴趣爱好等细节。让人联想到电影《洛克珊娜》( Roxanne )中,口才出众的史蒂夫·马丁为一位语塞的傻瓜提供浪漫机智的话语,Cluely AI 为李宗钦提供问题回答建议,试图俘获她的芳心。
尽管 Cluely AI 的智慧建议助他不少,但局面依然岌岌可危,当他的约会对象询问他的年龄时(李宗钦假装自己已 30 岁——结果被侍应质问要求出示身份证)。即便如此,Cluely AI 仍及时“救场”,又编出一个看似合理的谎言。
我们是否正生活在《黑镜》的一集中?
自然,评论家们对这项技术忧心忡忡。不少人将其比作《黑镜》中的情节,设想未来世界中,人人都可以借助不正当的技术“作弊”,从而在感情中获得成功。对此,李宗钦的公司则声称,这些工具不过是时代潮流的产物,毕竟越来越多人依赖像 ChatGPT 这样先进的 AI 工具,从写作文到情感建议,无所不能。
不论你对 Cluely AI 持何种看法,不可否认,这项技术满足了人类一个基本需求——对确定性的渴望。在爱情领域,这无不让人联想到那些众多约会策略书籍,如罗伯特·格洛弗博士的《不再做好好先生》和马克·曼森的《模型:以诚实吸引女性》。
无论是《洛克珊娜》还是一堆浪漫自助手册,都蕴含着一个共同的梦想:停止对自己的无限猜测,全力以赴展现最好的一面,尤其在形势危急时。再引用一个流行文化的例子,让我想起了《宋飞传》中的那集 “咖啡馆”。在那集中,乔治为了博取女友青睐,竟劝说伊莱恩替他参加智商测试。可想而知,计划最终落得一场空。
信心即服务
同样,许多简单却再熟悉不过的烦恼,正源于我们希望自己能更好地展示自我,被视为更聪明、更幽默、更有趣。为此,Cluely AI 利用 AI 技术,协助提升你的表现。
让我们举个例子来体验这种能力。想象你正在 Zoom 上进行一次实时销售电话,你非常渴望达成交易,但苦于找不到合适的措辞。这时,Cluely AI 能够提供实时的建议,包括语气、节奏,甚至是表达方式,助你锁定客户并促成交易。
面对这一不断提升的能力,有人担心未来一代人会越来越依赖此类工具,尤其在社交方面。事实上,我们已经生活在一个人们将许多原本需要亲力亲为的生活和工作技能外包给 AI 的时代,从导航到招聘决策无所不包。从更宏观的角度看,AI 正在逐渐模糊学术诚信的界限。就在本月,《纽约时报》就刊登了一篇关于教授在校园内使用 ChatGPT 的普遍现象的文章。
回顾这些发展,我们应不忘人的一个终极需求:超越自我。这一需求支撑着无数以彼得·帕克和托尼·斯塔克为主角的漫威电影。尽管人人都希望拥有超强能力成为超级英雄,但生活真正的挑战不仅仅是提升能力,而是与自身局限搏斗,以及在摘下“高科技眼镜”后,记住真实的自我。
好文章,需要你的鼓励
这项由华盛顿大学和新加坡国立大学研究团队提出的ScaleKV技术,针对视觉自回归模型中的内存瓶颈问题提供了创新解决方案。研究发现不同变压器层具有不同的缓存需求,将它们分为需要大量历史信息的"起草者"和专注于当前细节的"精细器",实现了尺度感知的KV缓存分配。实验表明,该方法能将Infinity-8B模型的内存需求从85GB减少到8.5GB,同时保持生成质量几乎不变,为高分辨率AI图像生成的普及应用铺平了道路。
这项研究提出了一种名为INTUITOR的创新方法,让大语言模型无需外部奖励即可自主学习推理能力。研究者利用模型自身的"自我确定性"作为唯一奖励信号,替代传统需要人工标注或答案验证的方法。实验表明,该方法在数学推理上与使用标准答案的方法相当,并在代码生成等跨领域任务上展现出更好的泛化能力。这为开发能在缺乏外部验证的情况下自我提升的AI系统开辟了新途径,对未来自主学习AI具有深远影响。
新加坡科技设计大学和字节跳动研究团队提出了"语音反向翻译"方法,解决语音识别中的数据稀缺问题。研究表明,仅用几十小时的标注语音数据就能训练TTS模型生成数万小时高质量合成语音,将数据扩充数百倍。他们引入归一化可理解度指标评估合成语音质量,确定了合成数据能有效增强ASR性能的质量阈值。将方法扩展到十种语言,生成了50万小时合成语音,对Whisper-large-v3模型进行预训练,平均降低错误率30%,对低资源语言尤其有效,错误率降低46%。
WINA是一种由微软等机构研究人员开发的训练无关稀疏激活框架,它通过同时考虑隐藏状态大小和权重矩阵的列式l2范数来加速大型语言模型推理。与仅基于隐藏状态选择神经元的现有方法不同,WINA能更精确识别影响模型输出的关键神经元,在理论上提供更紧的误差界限。实验证明,WINA在相同稀疏度下比最先进方法表现更优(提升最多2.94%),同时减少高达65%的计算量,为资源受限环境中部署大型语言模型提供了高效解决方案。