目前,AGI处于研发阶段,大模型是实现AGI的重要路径。AI大模型通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。在“大数据+大算力+强算法”的加持下,进一步通过“提示+指令微调+人类反馈”方式,实现一个模型应用在很多不同领域。人工智能的发展已经从“大炼模型”逐步迈向了“炼大模型”的阶段,逐渐掀起多模态和多场景革命,重塑AI技术范式,提升模型能力天花板,应用价值显著提升。
大模型现状:GPT引领,百模征战。(1)ChatGPT加速迭代:从GPT-1至GPT3.5跨越4年多时间,ChatGPT发布仅一年,GPT迭代开启“加速度”,现已具备多模态能力,并搭建GPTs生态,将定制化模型从ToB推广到ToC,低门槛、低成本、定制化的特点,使得GPTs具备普及性和颠覆性。(2)国内大模型:科技型企业包括人工智能企业、垂直大模型企业和数据智能服务商相继进场,如商汤科技、度小满和滴普科技等企业,以百度、腾讯和阿里为代表的互联网云厂商占据中国通用大模型行业多数市场份额,在布局时间、基础设施建设、应用场景等方面具备明显优势。(3)爆款应用:基于ChatGPT的火爆和大模型的迭代发展,海内外AI在对话、图像、教育、办公等多个领域出现爆款应用。
大模型未来:应用多点开花,产业智能跃迁。
(1)内容变革:拥有通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征的AI大模型成为了自动化内容生产的“工厂”和“流水线”,随着 GPTstore 的出现, AI 大模型将迎来自己的“APP Store”时代,AIGC 商业应用的前景愈发广阔。
(2)模型演绎:多模态模型核心目标是模拟人类大脑处理信息的方式,以更全面、综合的方式理解和生成信息,底层通用大模型目前成为最受关注、建设和提升迫切性最强的领域,中间层模型国内目前尚未出现相关玩家。
(3)AIGC主流的营收模式可分为四种:MaaS、按产出内容量付费、软件订阅付费、模型定制开发费。目前,按照产出量收费的模式占据主流,但随着底层模型即AIGC生态的建立,最具长期增长潜力并将占据主要市场规模的为MaaS模式。据量子位预测,2023年AIGC不同商业模式规模约170亿元,预期2026将翻一番,2030年有望突破万亿市场规模。
本文来自“大模型专题报告:百模渐欲迷人眼,AI应用繁花开(2024)”,大模型演进:工业革命级的生产力工具;大模型现状:GPT引领,百模征战;大模型未来:应用多点开花,产业智能跃迁。
好文章,需要你的鼓励
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
英国政府研究显示,神经多样性员工从AI聊天机器人中获得的收益远超普通同事。在Microsoft 365 Copilot试点中,神经多样性员工满意度达90%置信水平,推荐度达95%置信水平,均显著高于其他用户。患有ADHD和阅读障碍的员工表示AI工具为他们提供了前所未有的工作支持,特别是在报告撰写方面。研究表明,AI工具正在填补传统无障碍技术未能解决的职场差距,为残障人士提供了隐形的工作辅助。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。