大模型之家2024年9月热力榜:“快慢”思考引热议,大厂多模态领域齐发力
“慢思考”概念的提出,也引发了全行业的深思。如360两月前便提出的CoE(专家协同)架构。该架构通过整合多个大型模型和专家模型,构建了一个协作网络,实现了“快思考”与“慢思考”的有机结合,进一步提高了推理任务的灵活性和精确度。
本月,OpenAI在其新模型o1-preview发布后,引入了大模型“慢思考”的概念。这一概念模拟人类思维过程,通过多步推理和深度思考,逐步分解并解决问题,以达到精准回答的目的。与传统依赖海量数据训练的方法不同,“慢思考”更注重逻辑推理和问题解决策略,从而提升AI的回应准确性。
“慢思考”概念的提出,也引发了全行业的深思。如360两月前便提出的CoE(专家协同)架构。该架构通过整合多个大型模型和专家模型,构建了一个协作网络,实现了“快思考”与“慢思考”的有机结合,进一步提高了推理任务的灵活性和精确度。
在2024年《9月大模型热力榜》中,大模型之家榜单共收录了207家大型模型及其所属企业,相比上月新增了5家。值得一提的是,百度文心一言本月重返热力榜榜首。众多厂商在多模态领域,尤其是视频生成模型方面,持续进行创新和突破,展现了他们在前沿技术领域的强大实力和广泛影响,同时也为榜单带来了新的变化。
值得注意的是,本月内百度和支付宝相继推出了“文小言”和“支小宝”等一系列以“小”字命名的AI产品。这些产品的出现不禁让人联想到几个月前百川智能发布的“百小应”结合搜索技术与大模型,提供专业知识和个性化服务,这样超前的设计理念也使其在同类产品中脱颖而出。
9月4日,百度文心一言APP升级为“文小言”,定位为“新搜索”智能助手。创新推出富媒体搜索、多模态输入、文本与图片创作、高拟真数字人等“新搜索”功能,以及记忆和自由订阅等新颖功能。被认为是新搜索领域中与大型模型结合最原始和彻底的AI应用。
9月19日,阿里巴巴通义万相平台视频生成功能上线,支持生成5秒、30帧/秒、720P分辨率视频,配有匹配音效。平台提供文生视频和图生视频创作入口。27日,通义App推出翻译助手、视频通话和旅行智能体等功能,结合AI翻译和导游能力,提升用户国庆假期旅行体验。
9月19日,华为副董事长、轮值董事长徐直军提出智能化时代企业应具备“六个A”特征:自适应体验、自演进产品、自治运营、增强员工、全联接资源和智能原生基础设施。他介绍,华为云通过昇腾云服务提供AI算力,ModelArts服务支持主流基础大模型开箱即用。同时,华为云正打造盘古5.0,支持全系列模型,为企业提供更多选择。
9月24日,火山引擎发布豆包视频生成-PixelDance和Seaweed两款大模型,面向企业市场邀测。现场展示的视频生成效果,包括语义理解、复杂交互画面和多镜头切换的一致性,均达业界先进水平。火山引擎总裁谭待表示,豆包模型将持续演进,突破视频生成难关,拓展AI视频创作空间和应用落地。
9月26日,商汤大装置事业群研发总监张行程介绍了商汤大模型基于昇腾原生开发实践。通过软硬优化技术,商汤构建了大规模并行训练加速系统,102B模型训练性能超业界120%,集群规模扩展3倍后线性加速比达97%以上。基于昇腾计算生态,商汤还实现了长序列并行训练加速,4K序列性能提升1倍以上,能处理128K长序列训练。
据弗若斯特沙利文和头豹研究院发布的《中国AI代码生成市场报告》,商汤科技被认定为6家AI代码生成厂商主流玩家之一,且市场综合竞争表现最强。
接下来快和「大模型之家」一起来看看2024年《9月大模型热力榜》中是否有你关注的大模型吧!
0赞好文章,需要你的鼓励
推荐文章
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。