大模型之家2024年9月热力榜:“快慢”思考引热议,大厂多模态领域齐发力
“慢思考”概念的提出,也引发了全行业的深思。如360两月前便提出的CoE(专家协同)架构。该架构通过整合多个大型模型和专家模型,构建了一个协作网络,实现了“快思考”与“慢思考”的有机结合,进一步提高了推理任务的灵活性和精确度。
本月,OpenAI在其新模型o1-preview发布后,引入了大模型“慢思考”的概念。这一概念模拟人类思维过程,通过多步推理和深度思考,逐步分解并解决问题,以达到精准回答的目的。与传统依赖海量数据训练的方法不同,“慢思考”更注重逻辑推理和问题解决策略,从而提升AI的回应准确性。
“慢思考”概念的提出,也引发了全行业的深思。如360两月前便提出的CoE(专家协同)架构。该架构通过整合多个大型模型和专家模型,构建了一个协作网络,实现了“快思考”与“慢思考”的有机结合,进一步提高了推理任务的灵活性和精确度。
在2024年《9月大模型热力榜》中,大模型之家榜单共收录了207家大型模型及其所属企业,相比上月新增了5家。值得一提的是,百度文心一言本月重返热力榜榜首。众多厂商在多模态领域,尤其是视频生成模型方面,持续进行创新和突破,展现了他们在前沿技术领域的强大实力和广泛影响,同时也为榜单带来了新的变化。
值得注意的是,本月内百度和支付宝相继推出了“文小言”和“支小宝”等一系列以“小”字命名的AI产品。这些产品的出现不禁让人联想到几个月前百川智能发布的“百小应”结合搜索技术与大模型,提供专业知识和个性化服务,这样超前的设计理念也使其在同类产品中脱颖而出。
9月4日,百度文心一言APP升级为“文小言”,定位为“新搜索”智能助手。创新推出富媒体搜索、多模态输入、文本与图片创作、高拟真数字人等“新搜索”功能,以及记忆和自由订阅等新颖功能。被认为是新搜索领域中与大型模型结合最原始和彻底的AI应用。
9月19日,阿里巴巴通义万相平台视频生成功能上线,支持生成5秒、30帧/秒、720P分辨率视频,配有匹配音效。平台提供文生视频和图生视频创作入口。27日,通义App推出翻译助手、视频通话和旅行智能体等功能,结合AI翻译和导游能力,提升用户国庆假期旅行体验。
9月19日,华为副董事长、轮值董事长徐直军提出智能化时代企业应具备“六个A”特征:自适应体验、自演进产品、自治运营、增强员工、全联接资源和智能原生基础设施。他介绍,华为云通过昇腾云服务提供AI算力,ModelArts服务支持主流基础大模型开箱即用。同时,华为云正打造盘古5.0,支持全系列模型,为企业提供更多选择。
9月24日,火山引擎发布豆包视频生成-PixelDance和Seaweed两款大模型,面向企业市场邀测。现场展示的视频生成效果,包括语义理解、复杂交互画面和多镜头切换的一致性,均达业界先进水平。火山引擎总裁谭待表示,豆包模型将持续演进,突破视频生成难关,拓展AI视频创作空间和应用落地。
9月26日,商汤大装置事业群研发总监张行程介绍了商汤大模型基于昇腾原生开发实践。通过软硬优化技术,商汤构建了大规模并行训练加速系统,102B模型训练性能超业界120%,集群规模扩展3倍后线性加速比达97%以上。基于昇腾计算生态,商汤还实现了长序列并行训练加速,4K序列性能提升1倍以上,能处理128K长序列训练。
据弗若斯特沙利文和头豹研究院发布的《中国AI代码生成市场报告》,商汤科技被认定为6家AI代码生成厂商主流玩家之一,且市场综合竞争表现最强。
接下来快和「大模型之家」一起来看看2024年《9月大模型热力榜》中是否有你关注的大模型吧!
0赞好文章,需要你的鼓励
推荐文章
CIO们正面临众多复杂挑战,其多样性值得关注。除了企业安全和成本控制等传统问题,人工智能快速发展和地缘政治环境正在颠覆常规业务模式。主要挑战包括:AI技术快速演进、IT部门AI应用、AI网络攻击威胁、AIOps智能运维、快速实现价值、地缘政治影响、成本控制、人才短缺、安全风险管理以及未来准备等十个方面。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
过去两年间,许多组织启动了大量AI概念验证项目,但失败率高且投资回报率令人失望。如今出现新趋势,组织开始重新评估AI实验的撒网策略。IT观察者发现,许多组织正在减少AI概念验证项目数量,IT领导转向商业AI工具,专注于有限的战略性目标用例。专家表示,组织正从大规模实验转向更专注、结果导向的AI部署,优先考虑能深度融入运营工作流程并产生可衡量结果的少数用例。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。