人类拥有独一无二的文化、历史和语言。在日益全球化的当下,我们必须充当这一独有文化遗产、人类身份基石的守护者。
各种新技术正在帮助我们完成这项艰巨的任务,其中,人工智能在保护我们独特文化遗产方面一枝独秀。
刚刚成立仅一年时间,人工智能初创公司IVOW肩负着“将讲故事这一古老艺术带入你的智能家居设备”的使命,开发了一个记录和分享用户故事的聊天机器人。
“我们意识到,在定义人类未来的人工智能算法中存在一个巨大的漏洞——缺乏关于文化和遗产的丰富的创造性内容。人工智能与文化叙事的有效融合,将有助于减少算法识别的偏见,让人工智能软件更具包容性,”IVOW创始人Iran Davar Ardalan这样表示。他曾经作为记者在NPR News工作了20多年,之后创立了IVOW公司。
这涉及到用不同图像训练IVOW“对文化敏感的深度学习模型”,以便模型就图片的详细说明文字给出建议,由自然语言处理算法生成,反映出一张图片中包含的文化元素。
“我们要确保那些弱势群体和信息闭塞的人都能够用他们的眼睛和声音讲述他们的故事,这一点非常重要。看看人工智能在这个过程中扮演者什么角色是至关重要的,” Management Systems International (MSI)副总裁Ellen Yount在由摩根州立大学和IVOW于2018年4月共同主办的文化研讨会上曾这样表示。
研究人员们也在研究人工智能将如何塑造历史故事的叙事方式。
参与“时间机器”(Time Machine)开源项目的国际研究小组不仅将目前存储在档案馆和博物馆中的大量信息做了数字化处理,同时还通过一种“大规模历史模拟器”(Large Scale Historical Simulator)用人工智能对这些数据进行分析以重建2000年的欧洲历史。该项目刚刚从欧盟那里获得了100万欧元的资金,作为时间胶囊来推动探索欧洲城市的文化、经济和历史发展,大大强化我们目前对历史的理解。
EPFL数字人文实验室主任Frédéric Kaplan表示:“任何2000年前保存记录基本都不复存在了,因为我们无法查看这些记录。我们迫切地需要将我们的档案带入数字时代,不能与历史失去联系。”
Kaplan负责的“威尼斯时间机器”(Venice Time Machine)项目,对威尼斯这个城市1000年的历史、贸易路线、艺术、对欧洲其他地区历史和文化的影响进行了分析。
为了将数百万份手稿数字化,由多个学科研究人员组成的团队开发了半自动扫描仪、机器人页面翻转器、甚至是自动手写识别系统来进行转录注释。最终你可以在一个名为Canvas的引擎中搜索到这些数据,授权用户还可以编辑扫描中出现的错误,提高信息的准确性。
除了威尼斯之外,阿姆斯特丹、纽伦堡、巴黎、耶路撒冷、布达佩斯和那不勒斯等城市也纷纷开始实施数字化计划,开发他们自己的“时间机器”。
阿姆斯特丹大学遗产与数字文化教授Julia Noordegraaf正在研究属于阿姆斯特丹的时间机器。她说:“遗产是我们的文化DNA:物质遗产(艺术品、纪念碑)和非物质遗产(价值观、观念)是本地、国家或者跨国身份的基本组成部分,对于为不确定的未来做好准备的个人和社会来说,是不可或缺的。”
AI甚至可以为我们的后代保护建筑遗产。
中国长城绵延2万多公里,这给建筑学家和历史学家的保护工作带来了严峻的挑战。某些地区人迹罕至很难到达,对墙体进行人工检查是非常繁琐的。最近英特尔与中国文化遗产保护基金会(China Foundation for Cultural Heritage Conservation)合作,利用最新的无人机技术收集数千张照片,然后用人工智能分析这些数据,找出墙体上需要修复的准确区域。
英特尔全球品牌和思想领导力营销副总裁Alyson Griffin解释说:“通过获取修复位置和修复方法的精确信息,可以让修复工作更快速、更高效、更具成本效益地完成。”
这项技术也可以应用于商业项目中。英特尔副总裁、无人机集团总经理Anil Nanduri解释说:“我们关注的重点是自动化和商业应用,需要收集和分析大量数据的场景,例如对桥梁、炼油厂、传输塔等难以到达、环境复杂的基础设施进行工业检查。”
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
大模型时代,玛丽·米克尔(Mary Meeker)的名字可能大家不一定熟悉,但是在互联网时代,这位被可被誉为“互联网女皇”的。她是美国风险投资家和前华尔街证券分析师,专注于互联网及新兴技术领域。玛丽·米克尔(Mary Meeker)发了一份340页的《人工智能趋势报告》,粗粗看了一下,并没有非常轰动的观点,但是数据比较全面
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。