大模型之家2024年12月热力榜:AI技术深耕产业应用,未来竞争格局初显端倪
Scaling Law在这一新阶段被赋予了新的定义,标志着大模型领域的竞争焦点已由单纯的基础模型能力比拼,拓展至对场景应用与商业变现能力的深度挖掘。在此转型过程中,人工智能在产业应用方面展现出的巨大价值愈发凸显。
随着2025年的到来,人工智能领域的发展迈入了全新阶段。Scaling Law在这一新阶段被赋予了新的定义,标志着大模型领域的竞争焦点已由单纯的基础模型能力比拼,拓展至对场景应用与商业变现能力的深度挖掘。在此转型过程中,人工智能在产业应用方面展现出的巨大价值愈发凸显。
在大模型之家《2024年12月大模型热力榜》中,共收录了216家大型模型及其所属企业。其中,百度、商汤、智谱与360等人工智能企业持续领跑榜单。这些企业在智能体构建及原生应用场景的落地实施方面取得了显著进展,引发了行业的高度关注。这不仅体现了行业对大模型与产业深度融合的迫切需求,也彰显了该领域的蓬勃活力。
12月4日早间,商汤集团宣布其已完成重大战略组织架构重组。此次重组旨在更好地应对AI 2.0时代所带来的机遇与挑战,推动公司的持续创新与发展。商汤集团此次重组后建立了全新的“1+X”架构。其中,“1”代表商汤集团的核心业务,致力于打造行业领先的AI云,实现大装置、基础模型和AI应用的无缝集成。同时,商汤集团还将在计算机视觉(CV)领域深耕通用视觉模型,并拓展各个应用场景,以进一步巩固其在AI领域的领先地位。
12月5日,百度副总裁、百度搜索总经理赵世奇在2024百度热AI营销大会上透露,百度文心智能体平台已汇聚15万企业用户。相较于年初,该平台的分发量实现了16倍的增长。这一显著增长不仅彰显了百度文心智能体平台的强大吸引力,也预示着人工智能营销领域的巨大潜力。
12月6日,昆仑万维旗下天工AI推出了全新功能——天工AI彩页。这一功能特别针对结构化知识型内容进行了优化,旨在为用户带来更加极致的阅读体验与创作效能。
12月16日,无问芯穹宣布开源端上智能一体化解决方案中的小模型——端侧全模态理解模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。介绍,Megrez-3B-Omni选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最高领先同精度模型300%。此外,还同时具备图片、音频、文本三种模态数据处理能力,且在三个模态的多种测评基准中取得最优性能,是目前OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像理解模型之一。
12月17日,360集团集结产业上下游合作伙伴、科研机构及最终用户共同在北京成立大模型安全联盟,旨在构建开放协作的大模型安全产业新模式,推进产业生态的全面融合,并推出了多款具有重要行业价值的企业级应用新产品,包括360智脑团队研发的大模型全链路安全检测的“智鉴”、内容安全护航的“智盾”、搜索增强利器“智搜”,以及360数智化团队研发的知识管理平台“智能文档云”和情报监测工具“舆情卫士”。
12月23日,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。罗福莉硕士毕业于北京大学,曾主导开发阿里达摩院的多语言预训练模型VECO。2022年,她离开阿里加入DeepSeek,参与了DeepSeek-V2的开发。据悉,雷军为招募领军小米大模型的人才,亲自出面并支付千万元级别薪酬。此前,小米AI实验室已设立大模型团队,由栾剑担任负责人。结合小米被曝正在着手搭建自己的GPU万卡集群的传闻,雷军对于大模型领域的投入可谓倾尽全力。
同日,百川智能发布全链路领域增强大模型Baichuan4-Finance。其金融专业能力和场景应用能力大幅领先GPT-4o,在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首。
12月25日,阿里云通义千问发布了业界首个开源多模态推理模型QVQ-72B-Preview。该模型在视觉理解和推理能力上展现出色,尤其在解决数学、物理、科学等领域的复杂推理问题上表现突出。QVQ-72B-Preview的发布,为开发者提供了强大的工具,目前,开发者可在魔搭社区和HuggingFace平台上直接体验这一创新模型,探索其在多模态推理领域的广泛应用潜力。
12月26日,百度文心大模型与东方明珠塔联合推出的东方明珠塔智能体“数智塔塔”正式上线。作为文心大模型与文旅行业深度融合的最新成果,“数智塔塔”提供智能导览、中英双语、AI拍照打卡等服务,为游客打造全新的互动式东方明珠塔游览体验,为文旅行业赋予了数字时代的新生命力。
12月31日,百川智能与北京市海淀区卫健委签署战略合作。双方将紧密围绕基层医疗健康事业发展需求,积极探索医疗大模型技术创新与应用,通过“1+2+N”方案(1个多模态医疗大模型,2个AI医生:AI全科医生、AI儿科医生,N个不同场景),共建“AI医生-真人医生双医协同”的医疗服务新模式,切实解决基层高水平医生供给不足、医疗服务范围有限,医疗服务效率不高等痛点问题,打破基层医疗服务的“不可能三角”,将海淀区打造成医疗新质生产力的“样板间”。
同日,GLM技术团队宣布发布其年度最后一个模型——GLM-Zero的初代版本GLM-Zero-Preview。这是智谱首个基于扩展强化学习技术训练的推理模型,标志着GLM技术团队在通往AGI(人工通用智能)的道路上又迈出了重要一步。
0赞好文章,需要你的鼓励
推荐文章
YouTube开始推出肖像检测工具,帮助创作者识别和举报使用其面部特征的AI生成视频。该系统类似于版权检测机制,目前处于测试阶段,仅向部分创作者开放。用户需要提供政府身份证件照片和面部视频来验证身份。系统会标记疑似包含用户肖像的视频,但无法保证100%准确识别AI内容。YouTube将根据多项因素决定是否移除举报的视频。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。
谷歌宣布在AI Studio平台中引入"氛围编程"体验,让编程和非编程用户都能更轻松地开发应用程序。用户可通过简单提示生成可运行的应用,新功能包括应用画廊、模型选择器、安全变量存储等。平台还添加了模块化"超能力"功能和"手气不错"按钮来激发创意。完成的原型应用可一键部署到谷歌云运行平台。此次更新正值业界期待谷歌即将发布Gemini 3.0大语言模型。
中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。