目前,AGI处于研发阶段,大模型是实现AGI的重要路径。AI大模型通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。在“大数据+大算力+强算法”的加持下,进一步通过“提示+指令微调+人类反馈”方式,实现一个模型应用在很多不同领域。人工智能的发展已经从“大炼模型”逐步迈向了“炼大模型”的阶段,逐渐掀起多模态和多场景革命,重塑AI技术范式,提升模型能力天花板,应用价值显著提升。
大模型现状:GPT引领,百模征战。(1)ChatGPT加速迭代:从GPT-1至GPT3.5跨越4年多时间,ChatGPT发布仅一年,GPT迭代开启“加速度”,现已具备多模态能力,并搭建GPTs生态,将定制化模型从ToB推广到ToC,低门槛、低成本、定制化的特点,使得GPTs具备普及性和颠覆性。(2)国内大模型:科技型企业包括人工智能企业、垂直大模型企业和数据智能服务商相继进场,如商汤科技、度小满和滴普科技等企业,以百度、腾讯和阿里为代表的互联网云厂商占据中国通用大模型行业多数市场份额,在布局时间、基础设施建设、应用场景等方面具备明显优势。(3)爆款应用:基于ChatGPT的火爆和大模型的迭代发展,海内外AI在对话、图像、教育、办公等多个领域出现爆款应用。
大模型未来:应用多点开花,产业智能跃迁。
(1)内容变革:拥有通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征的AI大模型成为了自动化内容生产的“工厂”和“流水线”,随着 GPTstore 的出现, AI 大模型将迎来自己的“APP Store”时代,AIGC 商业应用的前景愈发广阔。
(2)模型演绎:多模态模型核心目标是模拟人类大脑处理信息的方式,以更全面、综合的方式理解和生成信息,底层通用大模型目前成为最受关注、建设和提升迫切性最强的领域,中间层模型国内目前尚未出现相关玩家。
(3)AIGC主流的营收模式可分为四种:MaaS、按产出内容量付费、软件订阅付费、模型定制开发费。目前,按照产出量收费的模式占据主流,但随着底层模型即AIGC生态的建立,最具长期增长潜力并将占据主要市场规模的为MaaS模式。据量子位预测,2023年AIGC不同商业模式规模约170亿元,预期2026将翻一番,2030年有望突破万亿市场规模。
本文来自“大模型专题报告:百模渐欲迷人眼,AI应用繁花开(2024)”,大模型演进:工业革命级的生产力工具;大模型现状:GPT引领,百模征战;大模型未来:应用多点开花,产业智能跃迁。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。