位于布鲁克林格林波因特社区的一所小学和一家公共图书馆之间,新开了一种“豪华”共享办公空间。
这个被命名为 Chat Haus 的空间拥有许多传统共享办公空间的常见元素:有人在电脑键盘前忙碌敲打,有人在接电话,还有人暂时离开电脑喝一口咖啡。
不过,有一个关键的不同之处:Chat Haus 是专为 AI 聊天机器人设计的共享办公空间,而其中的一切——包括“人员”——都是由纸板制成。
具体来说,Chat Haus 是布鲁克林艺术家 Nim Ben-Reuven 的一个艺术展览。展览中陈列了少量由小型电机控制动作,在电脑前“工作”的纸板机器人。现场有一块告示牌宣称办公桌位“仅”需每月 1,999 美元,另一块牌子则标注该空间为“专为聊天机器人打造的豪华共享办公空间”。
Ben-Reuven 在接受 TechCrunch 采访时表示,他构建这个展览是为了以幽默的方式缓解并调侃这样一个事实:他的大部分工作——主要围绕平面设计和视频制作——正被逐步推向 AI 的领域。他补充道,由于各家公司纷纷转向 AI 工具,他已经开始被拒绝承接自由职业项目。
“这就像是以幽默表达我内心压抑的挫败感,我不想因为行业变化迅速、就在我眼皮底下发生而变得太过苦涩,也不愿意被迫参与这种转变,” Ben-Reuven 说道,“所以我想,用一些我自己也能取笑的滑稽事来反击。”
他表示,也正因如此,他希望这个展览不要显得太过负面,因为那样无法传达正确的信息。他认为,创作出明显负面的艺术作品会让自己陷入被迫辩解的境地。“赋予展览一个‘轻松的调性’也有助于吸引所有年龄段、对 AI 持各类观点的观众。”
当 Ben-Reuven 与我在街对面 Pan Pan Vino Vino 咖啡馆聊天时,不少路人纷纷驻足观看 Chat Haus。三位千禧一代的女士停下来拍照,一群刚放学的小学生也停下向随行的大人提出问题。
Ben-Reuven 还认为,尽管 AI 正在影响他所从事的创意行业,但与当今世界上其他种种恐怖和创伤事件相比,这种情况显得轻得多。
“我的意思是,从创意领域的角度来看,AI 显得轻描淡写。相比之下,世界上发生的战争、恐怖袭击以及无处不在的创伤问题,则要严重得多,”他说。
Ben-Reuven 一直以来都在艺术创作中使用纸板。他在研究生期间曾用纸板制作出一个与真实尺寸相当的机场航站楼模型。在过去十年的自由职业生涯间隙,他不断创作这些纸板机器人,或如他所称的“纸板小孩”。因此,选用纸板机器人作为展示媒介既是一种自然而然的选择——他打趣说这也是为了找个理由把它们搬出公寓——同时,这种材质也为他对 AI 的看法提供了另一种隐喻。
“纸板材料的短暂性,以及哪怕受到极小负重就容易坍塌的特性,正如同我对 AI 与创意产业互动的感受,”他说,“人们可以用 Midjourney 制作出在 Instagram 上看起来非常出色且能让 12 岁的孩子们兴奋不已的图像,但经过任何程度的审视,这些作品其实都是垃圾;而我觉得,只要你细看这些纸板制品,就会发现它们同样脆弱,随时可能在任何重量下坍塌。”
不过,他也理解消费者为何会被某些 AI 生成的艺术作品所吸引。他将这种现象比作垃圾食品——那种在摄入后迅速带来快感,但随即又被迅速消化掉的体验。
目前,Chat Haus 作为一个临时展览进行展示,所在建筑正在等待翻新许可的批准。Ben-Reuven 希望至少能将展览维持至五月中旬,如果可能,他还计划将展览迁移至更大的画廊。他希望能在此基础上不断增加展览内容——只是担心展览结束后,他在公寓里还能放置额外材料的地方究竟在哪里。
“我只是觉得,用这个方式来表现这样一个想法会非常有趣:在某个仓库里,一大群既可爱又带点阴森的机器人宝宝因为我们的 ChatGPT 提示而不停敲击键盘,它们日以继夜地工作,消耗的电力相当于瑞士一年用电量那样巨大,” Ben-Reuven 说道。
Chat Haus 目前在纽约布鲁克林格林波因特社区 121 Norman Avenue 的前窗展出。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。