2月2-9日,AAAI 2021于线上隆重召开。AAAI(美国人工智能协会)作为人工智能领域的主要学术组织之一,其主办的年会被列为国际人工智能领域的 A 类顶级会议。深兰科技DeepBlueAI团队首次参加AAAI挑战赛,便在NLP(自然语言处理)领域的“首字母缩写词消歧”赛道中与阿里巴巴等知名机构同台竞技,并获得冠军。而深兰科技自研的智能数据标注平台、自动化机器学习平台和AI开放平台中,都已对NLP的进行了有效应用。

NLP是人工智能中最困难的问题之一。“首字母缩写词消歧”是词义消歧的一种,用于确定多义词在给定上下文语境中的意义,也是NLP领域中重要的研究课题。它在许多英文文献和文档中,特别是在科学和医疗领域十分常见,且在诸多领域都具有实际应用价值。
首字母缩写词可用于信息检索,能实现在搜索文档时,查询结果中不仅包含缩写词内容,同时也包含缩写词对应扩展全称的内容,反之亦然;可用于机器翻译,当文本从一种语言翻译至另一种语言时,如果源文本包含首字母缩写词,那么其对应含义也能够被正确翻译;也可应用于阅读理解,当理解缩写词的正确扩展全称时,能够使上下文的语义理解更为准确;还可应用于文本摘要,通过使用正确的缩写词实现更精简的摘要。
DeepBlueAI团队在竞赛中,根据预训练模型BERT,融合了多种训练策略,提出一种基于二分类思想的模型,有效解决了首字母缩写词消歧的问题。团队选用SCIBERT作为基础预训练模型,然后利用任务自适应预训练方式得到新的预训练模型,在此模型上再利用动态负采样技术和对抗训练的方式得到二分类模型。随后,利用该分类模型对未标注的数据集进行伪标签判断,得到新的可以加入训练的数据,再以此为新的训练集重复上述训练过程,得到最终的二分类模型。
语言是人类智慧的结晶,而NLP正是人工智能工具与人类进行交流的重要桥梁,深兰科技自成立以来始终厚植科研沃土,已在CVPR、ICCV、ECCV、NeurIPS、KDD等多个人工智能国际顶会上拔得头筹。今后,将继续秉持“人工智能,服务民生”的理念,矢志不渝地从事人工智能核心技术的基础研究,为人工智能应用落地持续注入强劲能量。
好文章,需要你的鼓励
微软宣布未来四年将在阿联酋投资152亿美元,包括首次向该国运输最先进的英伟达GPU芯片。美国已授权微软向阿联酋出口英伟达芯片,使该国成为美国出口管制外交的试验场和地区AI影响力锚点。这笔投资包括2023年以来的73亿美元支出和2026-2029年的79亿美元计划投入,涵盖数据中心建设、人才培训和AI基础设施扩展,目标到2027年培训100万当地居民。
NVIDIA联合多伦多大学开发的ChronoEdit系统通过将图像编辑重新定义为视频生成问题,让AI具备了物理常识。该系统引入时间推理机制,能够想象编辑的完整变化过程,确保结果符合物理规律。在专业测试中,ChronoEdit超越了所有开源竞争对手,特别在需要物理一致性的场景中表现突出,为自动驾驶、机器人等领域的应用提供了重要技术突破。
OpenAI与亚马逊云服务签署七年380亿美元协议,在微软Azure之外增加另一个超大规模云服务商来满足其不断增长的AI计算需求。该协议将让OpenAI立即获得AWS EC2 UltraServers访问权限,计算能力将在未来七年内扩展至数千万个CPU。AWS还将为OpenAI构建基于英伟达Blackwell芯片的定制基础设施。尽管签署了这一大额协议,OpenAI仍将继续依赖微软Azure作为其主要云计算合作伙伴。
这项研究提出了MITS框架,使用信息论中的点互信息指导AI推理过程,解决了传统树搜索方法计算成本高、评估标准模糊的问题。通过动态采样和加权投票机制,MITS在多个推理数据集上显著超越现有方法,同时保持高效的计算性能,为AI推理技术开辟了新方向。