诸多学者和企业家也公开表示,Sora同样有助于推动人工智能技术在我国的发展。通过研究和应用可以积累更多经验,提升人工智能技术水平,加强国内人工智能产业的竞争力。
在2024年《2月大模型热力榜》中,大模型之家榜单共统计113家大模型及其所属企业,较上月新增8家。其中,百度文心一言再次占据热力榜第一名,李彦宏透露文心大模型推理成本已降至1%。华为跻身热力榜前三名席位。值得注意的是,第一次进入热力榜的月之暗面成立时间还不到一年,并在本月完成了最新一轮10亿美元融资。
2月20日,AI领域内的初创企业月之暗面完成了全新一轮的融资,金额超过10亿美元,一举刷新国内AI领域最大单笔融资记录。据悉,为月之暗面进行投资的资本方众多,包括红杉中国,小红书,美团,阿里等众多资本。
当地时间2月26日下午,在2024世界移动通信大会上,华为举办了全套5.5G产品解决方案发布会,并正式发布通信行业首个大模型,据了解,该大模型的作用包括帮助通信运营商提升运维效率等。同时华为还表示,2024是5G-A(又称5.5G)商用的元年。
2月28日,在百度2023年第四季度及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度文心大模型推理成本已降至1%。李彦宏表示,自发布以来,百度不断降低文心大模型的推理成本,“文心一言”3.5版本的推理成本是3.0版本的1%。通过推理成本的不断降低,越来越多的企业开始愿意在“文心一言”上测试、开发、迭代他们的应用程序。
2月28日,优刻得联合智谱AI,构建超千卡规模推理集群。智谱AI新一代基座大模型GLM-4性能大幅提升,优刻得表示,自2022年起,优刻得就开始为智谱AI提供底层算力支持。当前,优刻得乌兰察布智算中心算力管理规模共计超过3000P。通过智谱大模型与优刻得算力的强强结合,GLM-4稳定、高效运行于云端,并具备大规模实时推理能力,成功实现了成本效益与服务质量的平衡。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。