不少人都有过这样的“心动”体验:上班路上打开网易新闻,推荐内容恰好是自己最近关注的行业动态;下班途中打开网易云音乐,惊喜的发现了几个小众宝藏歌手,忍不住直呼“网易云真是太懂我了!”
个性化的推荐机制像一个贴心的朋友,在互联网的海量信息中,总能捕捉到最合你心意的那个。
个性化推荐机制的背后:多模态大模型保驾护航
作为国内专业从事游戏与泛娱乐AI研究和应用的顶尖机构,网易伏羲于2021年起着力打造“玉知”多模态理解大模型。基于图片-文本双塔结构,先后训练了2亿、4亿、9亿参数的“玉知”版本。同时,利用网易伏羲开源的EET高效推理框架,对模型压缩、算法适配、硬件底层等方面进行优化,使其推理速度提升4倍,满足了线上的高并发需求,降低了部署资源的损耗。
在业务数据集的zero-shot评测中,“玉知”多模态理解大模型优于Chinese-CLIP的CN-CLIPViT-H/14。
“玉知”多模态理解大模型目前已在网易的多个业务场景中落地验证,为个性化推荐机制保驾护航:网易新闻基于“玉知”构建的图文内容表征,在推荐环节采用基于该图文向量的dropoutnet召回优化,对召回源、列表页视频试投、列表页试投整体等效果明显改进,实现视频和整体大盘的业务指标提升;网易云音乐基于“玉知”构建的内容表征引擎和内容相似检索引擎,在云音乐视频、长音频、广告等多个业务中,实现了对内容冷启动效率、CTR预估模型的优化,带来显著收益。
网易+昇腾AI:创造1+1>2的智能体验
为了更好的使能大模型应用创新,昇腾AI构建了从规划、开发到产业化的大模型全流程使能体系,并于2022年正式发布了昇腾AI大模型开发使能平台,打通了大模型从开发到部署的全流程。
在大模型的开发上,通过昇思MindSpore提供的自动混合并行API来加速训练过程,利用高阶的Transformer API,百行代码实现千亿级参数的模型开发,同时获得更好的模型性能;为加速大模型场景化适配,打造了丰富的微调套件,已成功应用于紫东太初大模型开放服务平台建设,支持小样本训练和模型一键微调;在大模型的推理部署上,昇腾AI提供的模型压缩工具,在精度基本无损的情况下,降低了70%计算量,提升了20%以上的推理性能。
为了给用户带来更好的智能体验,网易伏羲联合昇思MindSpore及华为诺亚团队,充分分析互联网行业数据集特性,对多模态模型结构进行优化,优选合适编码器并采用多阶段训练模式,基于昇腾AI大模型开发使能平台,共同打造了玉知-悟空图文理解大模型。
玉知-悟空图文理解大模型可广泛应用在互联网推荐搜索等业务中,通过提取图文的特征进行相关的检索。在网易视频推荐业务的应用中,玉知-悟空图文理解大模型在核心算法指标中得到近5%的提升,效果远超预期。未来,联合团队将进一步将成果应用到网易新闻、网易云音乐等更丰富的业务场景中,提升最终用户的个性化体验。
当被输入丰富的行业知识时,更精更专的大模型将显现出巨大的应用价值。昇腾AI大模型开发使能平台,已经具备了支持大模型开发所需的各项核心技术,同时提供了一整套高效、易用的大模型使能套件,形成了端到端的使能大模型开发能力。未来,昇腾AI将联合网易以及更多行业伙伴共建共享,助力大模型创新,为繁荣AI产业生态铺就一条信心之路。
好文章,需要你的鼓励
近期有观点认为,大规模使用生成式AI和大语言模型会增强人类左脑的逻辑分析能力,同时削弱右脑的创造力,导致人类社会逐渐成为左脑主导的群体。但研究表明,左右脑功能分工理论缺乏科学依据,大脑两半球在创造性和逻辑性任务中都会协同工作。此外,AI不仅能辅助逻辑思维,同样可用于诗歌创作、图像生成等创意任务。
这项由圣母大学和IBM研究院联合开展的研究,开发出了名为DeepEvolve的AI科学助手系统,能够像人类科学家一样进行深度文献研究并将创新想法转化为可执行的算法程序。该系统突破了传统AI要么只能改进算法但缺乏创新、要么只能提出想法但无法实现的局限,在化学、生物学、数学等九个科学领域的测试中都实现了显著的算法性能提升,为AI辅助科学发现开辟了新的道路。
微软全球AI巡展在迪拜举行,宣布启动Microsoft Elevate UAE项目,计划为超过25万名学生和教育工作者以及5.5万名联邦政府员工提供AI技能培训。该项目是微软152亿美元投资计划的一部分,旨在加强AI基础设施建设,培养本地人才能力。微软还将与G42和JAHIZ平台合作,为联邦公务员提供技术培训,支持阿联酋成为AI领域的区域和全球领导者。
卡内基梅隆大学研究团队通过3331次大规模实验,系统揭示了代码训练如何提升AI推理能力。研究发现,代码的结构特性比语义内容更重要,适当的抽象形式(如伪代码)可以达到与原始代码相同的效果。不同编程语言产生差异化影响:低抽象语言有利于数学推理,Python更适合自然语言任务。这些发现为AI训练数据的科学化设计提供了重要指导。