大模型之家2024年12月热力榜:AI技术深耕产业应用,未来竞争格局初显端倪
Scaling Law在这一新阶段被赋予了新的定义,标志着大模型领域的竞争焦点已由单纯的基础模型能力比拼,拓展至对场景应用与商业变现能力的深度挖掘。在此转型过程中,人工智能在产业应用方面展现出的巨大价值愈发凸显。
随着2025年的到来,人工智能领域的发展迈入了全新阶段。Scaling Law在这一新阶段被赋予了新的定义,标志着大模型领域的竞争焦点已由单纯的基础模型能力比拼,拓展至对场景应用与商业变现能力的深度挖掘。在此转型过程中,人工智能在产业应用方面展现出的巨大价值愈发凸显。
在大模型之家《2024年12月大模型热力榜》中,共收录了216家大型模型及其所属企业。其中,百度、商汤、智谱与360等人工智能企业持续领跑榜单。这些企业在智能体构建及原生应用场景的落地实施方面取得了显著进展,引发了行业的高度关注。这不仅体现了行业对大模型与产业深度融合的迫切需求,也彰显了该领域的蓬勃活力。
12月4日早间,商汤集团宣布其已完成重大战略组织架构重组。此次重组旨在更好地应对AI 2.0时代所带来的机遇与挑战,推动公司的持续创新与发展。商汤集团此次重组后建立了全新的“1+X”架构。其中,“1”代表商汤集团的核心业务,致力于打造行业领先的AI云,实现大装置、基础模型和AI应用的无缝集成。同时,商汤集团还将在计算机视觉(CV)领域深耕通用视觉模型,并拓展各个应用场景,以进一步巩固其在AI领域的领先地位。
12月5日,百度副总裁、百度搜索总经理赵世奇在2024百度热AI营销大会上透露,百度文心智能体平台已汇聚15万企业用户。相较于年初,该平台的分发量实现了16倍的增长。这一显著增长不仅彰显了百度文心智能体平台的强大吸引力,也预示着人工智能营销领域的巨大潜力。
12月6日,昆仑万维旗下天工AI推出了全新功能——天工AI彩页。这一功能特别针对结构化知识型内容进行了优化,旨在为用户带来更加极致的阅读体验与创作效能。
12月16日,无问芯穹宣布开源端上智能一体化解决方案中的小模型——端侧全模态理解模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。介绍,Megrez-3B-Omni选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最高领先同精度模型300%。此外,还同时具备图片、音频、文本三种模态数据处理能力,且在三个模态的多种测评基准中取得最优性能,是目前OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像理解模型之一。
12月17日,360集团集结产业上下游合作伙伴、科研机构及最终用户共同在北京成立大模型安全联盟,旨在构建开放协作的大模型安全产业新模式,推进产业生态的全面融合,并推出了多款具有重要行业价值的企业级应用新产品,包括360智脑团队研发的大模型全链路安全检测的“智鉴”、内容安全护航的“智盾”、搜索增强利器“智搜”,以及360数智化团队研发的知识管理平台“智能文档云”和情报监测工具“舆情卫士”。
12月23日,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。罗福莉硕士毕业于北京大学,曾主导开发阿里达摩院的多语言预训练模型VECO。2022年,她离开阿里加入DeepSeek,参与了DeepSeek-V2的开发。据悉,雷军为招募领军小米大模型的人才,亲自出面并支付千万元级别薪酬。此前,小米AI实验室已设立大模型团队,由栾剑担任负责人。结合小米被曝正在着手搭建自己的GPU万卡集群的传闻,雷军对于大模型领域的投入可谓倾尽全力。
同日,百川智能发布全链路领域增强大模型Baichuan4-Finance。其金融专业能力和场景应用能力大幅领先GPT-4o,在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首。
12月25日,阿里云通义千问发布了业界首个开源多模态推理模型QVQ-72B-Preview。该模型在视觉理解和推理能力上展现出色,尤其在解决数学、物理、科学等领域的复杂推理问题上表现突出。QVQ-72B-Preview的发布,为开发者提供了强大的工具,目前,开发者可在魔搭社区和HuggingFace平台上直接体验这一创新模型,探索其在多模态推理领域的广泛应用潜力。
12月26日,百度文心大模型与东方明珠塔联合推出的东方明珠塔智能体“数智塔塔”正式上线。作为文心大模型与文旅行业深度融合的最新成果,“数智塔塔”提供智能导览、中英双语、AI拍照打卡等服务,为游客打造全新的互动式东方明珠塔游览体验,为文旅行业赋予了数字时代的新生命力。
12月31日,百川智能与北京市海淀区卫健委签署战略合作。双方将紧密围绕基层医疗健康事业发展需求,积极探索医疗大模型技术创新与应用,通过“1+2+N”方案(1个多模态医疗大模型,2个AI医生:AI全科医生、AI儿科医生,N个不同场景),共建“AI医生-真人医生双医协同”的医疗服务新模式,切实解决基层高水平医生供给不足、医疗服务范围有限,医疗服务效率不高等痛点问题,打破基层医疗服务的“不可能三角”,将海淀区打造成医疗新质生产力的“样板间”。
同日,GLM技术团队宣布发布其年度最后一个模型——GLM-Zero的初代版本GLM-Zero-Preview。这是智谱首个基于扩展强化学习技术训练的推理模型,标志着GLM技术团队在通往AGI(人工通用智能)的道路上又迈出了重要一步。
0赞好文章,需要你的鼓励
推荐文章
随着AI模型参数达到数十亿甚至万亿级别,工程团队面临内存约束和计算负担等共同挑战。新兴技术正在帮助解决这些问题:输入和数据压缩技术可将模型压缩50-60%;稀疏性方法通过关注重要区域节省资源;调整上下文窗口减少系统资源消耗;动态模型和强推理系统通过自学习优化性能;扩散模型通过噪声分析生成新结果;边缘计算将数据处理转移到网络端点设备。这些创新方案为构建更高效的AI架构提供了可行路径。
清华大学团队开发了CAMS智能框架,这是首个将城市知识大模型与智能体技术结合的人类移动模拟系统。该系统仅需用户基本信息就能在真实城市中生成逼真的日常轨迹,通过三个核心模块实现了个体行为模式提取、城市空间知识生成和轨迹优化。实验表明CAMS在多项指标上显著优于现有方法,为城市规划、交通管理等领域提供了强大工具。
Meta以143亿美元投资Scale AI,获得49%股份,这是该公司在AI竞赛中最重要的战略举措。该交易解决了Meta在AI发展中面临的核心挑战:获取高质量训练数据。Scale AI创始人王亚历山大将加入Meta领导新的超级智能研究实验室。此次投资使Meta获得了Scale AI在全球的数据标注服务,包括图像、文本和视频处理能力,同时限制了竞争对手的数据获取渠道。
MIT研究团队发现了一个颠覆性的AI训练方法:那些通常被丢弃的模糊、失真的"垃圾"图片,竟然能够训练出比传统方法更优秀的AI模型。他们开发的Ambient Diffusion Omni框架通过智能识别何时使用何种质量的数据,不仅在ImageNet等权威测试中创造新纪录,还为解决AI发展的数据瓶颈问题开辟了全新道路。