根据 Capgemini 研究院的报告,如果企业能为其用例"选择合适的模型"并在整个生命周期中实施可持续实践,生成式人工智能 (GenAI) 系统带来的环境影响可以显著降低。Capgemini 的《开发可持续生成式 AI》报告指出,对于最新的生成式预训练 Transformer (GPT) 模型,仅训练阶段就消耗相当于 5,000 个美国家庭一年的能源,而在业务环境中运行模型还需要"相同或更多的能源"。
这意味着对大语言模型 (LLM) 的一次查询所需的电力是 Google 搜索的 10 倍。
报告补充说,在一年时间里,将生成式 AI 集成到产品和服务中的组织数量从 6% 上升到 24%。此外,预计到 2026 年,生成式 AI 将占组织温室气体排放总量的 4.8%,高于目前的 2.6%。
Capgemini 还表示,使用 LLM 运行 20 到 50 次查询每次需要约 500 毫升水,到 2030 年,生成式 AI 可能产生 120 万到 500 万公吨的电子垃圾,约为 2023 年电子垃圾产量的 1000 倍。
Capgemini 集团可持续发展业务加速器负责人 Vincent Charpiot 表示:"生成式 AI 驱动的能源消耗激增导致排放量显著增加,预计两年内将在组织碳足迹中所占份额翻倍。企业迫切需要将可持续性纳入其 AI 战略。通过利用更小的模型、可再生能源以及 AI 和生成式 AI 供应商的透明实践,我们可以在推动创新和可持续发展的同时减轻环境影响。"
环境影响
从生产图形处理单元 (需要开采稀土金属) 到训练模型以运行庞大的数据中心,所有这些步骤都显著影响环境。
对大多数组织来说,生成式 AI 产品和服务的使用属于其范围 3 排放——指发生在公司运营之外但仍是其活动结果的间接温室气体排放。
然而,Capgemini 表示,在模型生命周期的各个阶段做出正确选择——包括选择硬件、模型架构、数据中心电源和最终用例——可以显著降低环境影响。
该报告还补充说,在某些情况下,如果可以使用资源效率更高的模型获得类似结果,企业应该考虑是否真的需要能源密集型的生成式 AI 技术。
Microsoft 生成式 AI 总监 Vishal Singhvi 表示:"每个人都想用生成式 AI 做点什么,但很多时候你根本不需要它。你可以用传统 AI 很好地完成工作,它消耗的计算能力和工作负载要少得多。"
小语言模型
因此,组织应该考虑是否可以使用小语言模型 (SLM) 来完成任务。与 LLM 相比,小语言模型使用更小且更具体的数据集进行训练。
Capgemini 表示,这不仅可以显著减少排放,还能降低成本。Mistral AI 的 CEO Arthur Mensch 表示:"更小的模型意味着应用程序运行成本更低,更重要的是,如果你有一个小 100 倍的模型,你可以用相同的成本调用它 100 次,每次调用都能为你的应用带来更多智能。"
对于英国 Orchard Hill College and Academy Trust 的董事会成员 Mauli Tikkiwal 来说,组织必须意识到他们使用生成式 AI 如何导致负面环境影响。她说:"首先,你必须识别影响,这样才能追踪和减少它。"
然而,虽然监测和追踪排放至关重要,但 Capgemini 调查的受访者中只有 14% 表示其公司测量和追踪其生成式 AI 足迹。
四分之三的高管将供应商的"有限透明度"视为测量环境影响的挑战。报告称:"他们期望科技行业在实现这一目标方面发挥带头作用。"
尽管存在这些趋势,Capgemini 强调了一些科技公司如何可持续地应对这项技术。
例如,报告指出,Nvidia 最新的 GPU 比前代产品效率高 30 倍;MIT 衍生初创公司 LiquidAI 开发了"自适应且能耗更低"的算法技术;Microsoft 在其 LLM 中引入了能源监测功能。
报告还强调了 Meta 签署协议为其美国数据中心购买地热能,以及 Google Carbon Sense Suite,这是"一系列功能的集合,可以轻松准确地报告你的碳排放并减少排放"。
在 2024 年 6 月的伦敦 AI 峰会上,可持续发展专家表示,虽然这项技术可以通过多种方式帮助企业变得更加环保,但必须认识到它目前对地球造成的明显负面影响。
他们表示,虽然它可以通过连接数据源并使其更易读来帮助企业更好地管理其范围 3 排放,但由于组织收集、管理和共享数据的方式不同,这些排放可能难以追踪。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。