目前,AGI处于研发阶段,大模型是实现AGI的重要路径。AI大模型通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。在“大数据+大算力+强算法”的加持下,进一步通过“提示+指令微调+人类反馈”方式,实现一个模型应用在很多不同领域。人工智能的发展已经从“大炼模型”逐步迈向了“炼大模型”的阶段,逐渐掀起多模态和多场景革命,重塑AI技术范式,提升模型能力天花板,应用价值显著提升。
大模型现状:GPT引领,百模征战。(1)ChatGPT加速迭代:从GPT-1至GPT3.5跨越4年多时间,ChatGPT发布仅一年,GPT迭代开启“加速度”,现已具备多模态能力,并搭建GPTs生态,将定制化模型从ToB推广到ToC,低门槛、低成本、定制化的特点,使得GPTs具备普及性和颠覆性。(2)国内大模型:科技型企业包括人工智能企业、垂直大模型企业和数据智能服务商相继进场,如商汤科技、度小满和滴普科技等企业,以百度、腾讯和阿里为代表的互联网云厂商占据中国通用大模型行业多数市场份额,在布局时间、基础设施建设、应用场景等方面具备明显优势。(3)爆款应用:基于ChatGPT的火爆和大模型的迭代发展,海内外AI在对话、图像、教育、办公等多个领域出现爆款应用。
大模型未来:应用多点开花,产业智能跃迁。
(1)内容变革:拥有通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征的AI大模型成为了自动化内容生产的“工厂”和“流水线”,随着 GPTstore 的出现, AI 大模型将迎来自己的“APP Store”时代,AIGC 商业应用的前景愈发广阔。
(2)模型演绎:多模态模型核心目标是模拟人类大脑处理信息的方式,以更全面、综合的方式理解和生成信息,底层通用大模型目前成为最受关注、建设和提升迫切性最强的领域,中间层模型国内目前尚未出现相关玩家。
(3)AIGC主流的营收模式可分为四种:MaaS、按产出内容量付费、软件订阅付费、模型定制开发费。目前,按照产出量收费的模式占据主流,但随着底层模型即AIGC生态的建立,最具长期增长潜力并将占据主要市场规模的为MaaS模式。据量子位预测,2023年AIGC不同商业模式规模约170亿元,预期2026将翻一番,2030年有望突破万亿市场规模。
本文来自“大模型专题报告:百模渐欲迷人眼,AI应用繁花开(2024)”,大模型演进:工业革命级的生产力工具;大模型现状:GPT引领,百模征战;大模型未来:应用多点开花,产业智能跃迁。
好文章,需要你的鼓励
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AI虽具备变革企业洞察力的潜力,但成功依赖于数据质量。大多数AI项目失败源于数据混乱分散而非算法局限。谷歌BigQuery云数据AI平台打破数据孤岛,简化治理,加速企业AI应用。通过AI自动化数据处理,实现实时分析,并与Vertex AI深度集成,使企业能够高效处理结构化和非结构化数据,将智能商业转型从愿景变为现实。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。