《根特祭坛:神秘的羔羊》油画,由十五世纪画家Jan Van Eyck于1425年至1429年为比利时根特的圣巴夫大教堂所创作。在画作的中下部,牧师与羔羊的崇拜者们围在祭坛四周。
AI技术既代表着未来,也昭示着过往。除了在最近几年乃至未来几年十中具有巨大的发展潜力,AI也有望揭开人类历史中具有重大意义的关键时刻。伦敦大学学院与杜克大学的研究人员们于今年8月底发表的一项研究,就生动地描绘出这种力量。他们设法利用人工智能技术,将绘制在同一张画板两侧的图像各自提取成独立的画面。
他们是怎么做到的?答案是将X光图像与深度神经网络算法结合起来。更具体地讲,他们利用X射线成像技术将十五世纪著名画作《根特祭坛画》的外板面拍摄下来。由于得到的图像同时包含板面两侧,所以叠加后的图像组合之前一直难以分析。但凭借着最新设计出的神经网络算法,该团队成功将这些图像拆分成两个独立的部分,从而单独对内容加以研究,最终整理出关于Hubert与Jan van Eyck两兄弟画作的更多全新见解。
来自伦敦大学学院电子与电气工程系的学者Miguel Rodrigues博士表示,“这种方法证明,以深度学习为驱动力的人工智能技术有望解决艺术品研究当中出现的挑战。”
虽然研究人员们并没有具体介绍他们构建神经网络的具体方法,但据估计他们很可能采取了提供已知画作并对图像进行相互叠加以进行训练的方法。通过这样的过程,神经网络越来越擅长预测绘画分离后的外观效果,从而准确地预测叠加后《根特祭坛画》的真实面貌。
相信大家也能够想到,这种方法适用于任何类型的绘画或者基于图像的艺术作品,这也让我们有望揭开艺术世界中更多埋藏多年的秘密。正如Rodrigues解释的那样,“我们希望看到其它类似的AI方法帮助我们揭开绘画中更多隐藏的特征,包括埋藏在当前颜料层下方的早期设计痕迹。”
除了艺术史之外,其它领域也能够从AI的强大预测能力中受益。正如伦敦大学学院发表的新闻稿所指出,类似的深度学习方法已经被广泛应用于解决“医疗保健、金融科技、国防以及安全等领域的各类长期问题。”
举例来说,AI技术已经被用于修复损坏的照片。牛津大学与莫斯科斯科尔科活科学技术研究所的团队在2017年开发出Deep Image Prior,这是一套神经网络,能够在无需利用大规模数据集进行训练的前提下填补图像中的空白部分。同样的,另一套AI神经网络于同年接受了训练,以学习如何区分伪造品与真品。它最终取得了良好的成绩,能够准确识别出任何特定艺术家在作品当中表现出的独特特征。
除了艺术与图像处理之外,研究人员还利用AI技术准确地模拟了霸王龙的运动姿态,利用该技术模拟重建因时间流逝或战争活动所破坏的历史遗址,甚至开始尝试破译古代文本。
当然,虽然AI揭开历史神秘面纱的强大能力令人振奋人,但在实际应用时仍需要保持谨慎的心态。因为我们无法假设机器学习技术在对绘画、动物或者历史遗址的样貌做出预测时,能够达到百分之百的准确度。去年就出现了这样一例令人震惊的事件:IBM公司一直努力向全球医院销售的Watson产品,被证明一直在推荐某种“不安全且不正确”的癌症治疗方法。
不可否认,Watson的问题很大程度上源自训练数据集中包含大量“假设”患者这一前提。尽管如此,此次事件仍然警示我们,过度依赖AI技术有可能带来巨大的潜在风险,而且AI确实经常对女性以及少数族裔产生偏见。正因为如此,即使机器学习能够帮助我们有效重建过去,我们仍然需要根据自己掌握的宝贵知识检查其工作质量,而万不可偏听偏信。
注:《根特祭坛画》作为油画的开山之作,分上、下两层,是一个由12幅独立的绘画作品组成的大祭坛画。而且翼画可开合,其后面仍有绘画,画面总计为20个。下层中央部分,描绘的是《圣经·启示录》中所述的“神秘的羔羊”,描绘的是在圣人们主持下对神秘的羔羊的礼拜和对全人类灵魂的拯救。这件比利时国宝长期高挂于中世纪名城根特的圣巴夫大教堂。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。