目前,AGI处于研发阶段,大模型是实现AGI的重要路径。AI大模型通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。在“大数据+大算力+强算法”的加持下,进一步通过“提示+指令微调+人类反馈”方式,实现一个模型应用在很多不同领域。人工智能的发展已经从“大炼模型”逐步迈向了“炼大模型”的阶段,逐渐掀起多模态和多场景革命,重塑AI技术范式,提升模型能力天花板,应用价值显著提升。
大模型现状:GPT引领,百模征战。(1)ChatGPT加速迭代:从GPT-1至GPT3.5跨越4年多时间,ChatGPT发布仅一年,GPT迭代开启“加速度”,现已具备多模态能力,并搭建GPTs生态,将定制化模型从ToB推广到ToC,低门槛、低成本、定制化的特点,使得GPTs具备普及性和颠覆性。(2)国内大模型:科技型企业包括人工智能企业、垂直大模型企业和数据智能服务商相继进场,如商汤科技、度小满和滴普科技等企业,以百度、腾讯和阿里为代表的互联网云厂商占据中国通用大模型行业多数市场份额,在布局时间、基础设施建设、应用场景等方面具备明显优势。(3)爆款应用:基于ChatGPT的火爆和大模型的迭代发展,海内外AI在对话、图像、教育、办公等多个领域出现爆款应用。
大模型未来:应用多点开花,产业智能跃迁。
(1)内容变革:拥有通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征的AI大模型成为了自动化内容生产的“工厂”和“流水线”,随着 GPTstore 的出现, AI 大模型将迎来自己的“APP Store”时代,AIGC 商业应用的前景愈发广阔。
(2)模型演绎:多模态模型核心目标是模拟人类大脑处理信息的方式,以更全面、综合的方式理解和生成信息,底层通用大模型目前成为最受关注、建设和提升迫切性最强的领域,中间层模型国内目前尚未出现相关玩家。
(3)AIGC主流的营收模式可分为四种:MaaS、按产出内容量付费、软件订阅付费、模型定制开发费。目前,按照产出量收费的模式占据主流,但随着底层模型即AIGC生态的建立,最具长期增长潜力并将占据主要市场规模的为MaaS模式。据量子位预测,2023年AIGC不同商业模式规模约170亿元,预期2026将翻一番,2030年有望突破万亿市场规模。
本文来自“大模型专题报告:百模渐欲迷人眼,AI应用繁花开(2024)”,大模型演进:工业革命级的生产力工具;大模型现状:GPT引领,百模征战;大模型未来:应用多点开花,产业智能跃迁。
好文章,需要你的鼓励
随着AI模型参数达到数十亿甚至万亿级别,工程团队面临内存约束和计算负担等共同挑战。新兴技术正在帮助解决这些问题:输入和数据压缩技术可将模型压缩50-60%;稀疏性方法通过关注重要区域节省资源;调整上下文窗口减少系统资源消耗;动态模型和强推理系统通过自学习优化性能;扩散模型通过噪声分析生成新结果;边缘计算将数据处理转移到网络端点设备。这些创新方案为构建更高效的AI架构提供了可行路径。
清华大学团队开发了CAMS智能框架,这是首个将城市知识大模型与智能体技术结合的人类移动模拟系统。该系统仅需用户基本信息就能在真实城市中生成逼真的日常轨迹,通过三个核心模块实现了个体行为模式提取、城市空间知识生成和轨迹优化。实验表明CAMS在多项指标上显著优于现有方法,为城市规划、交通管理等领域提供了强大工具。
Meta以143亿美元投资Scale AI,获得49%股份,这是该公司在AI竞赛中最重要的战略举措。该交易解决了Meta在AI发展中面临的核心挑战:获取高质量训练数据。Scale AI创始人王亚历山大将加入Meta领导新的超级智能研究实验室。此次投资使Meta获得了Scale AI在全球的数据标注服务,包括图像、文本和视频处理能力,同时限制了竞争对手的数据获取渠道。
MIT研究团队发现了一个颠覆性的AI训练方法:那些通常被丢弃的模糊、失真的"垃圾"图片,竟然能够训练出比传统方法更优秀的AI模型。他们开发的Ambient Diffusion Omni框架通过智能识别何时使用何种质量的数据,不仅在ImageNet等权威测试中创造新纪录,还为解决AI发展的数据瓶颈问题开辟了全新道路。