除了教育、通信、金融、医疗之外,能源行业也逐步凸显出对于大模型的拥抱。
据亿欧网统计,2024年前三季度,能源行业大模型公开招标项目超过80个,除了通用大模型企业阿里、百度、智谱参与之外,能源企业、工业IT服务商业对于行业大模型的研发与投入也同样积极。
随着全球能源结构向清洁能源转型,大模型正逐步成为能源行业的关键推动力。
大模型技术能够利用深度学习和先进的数据分析方法,实现高精度的发电预测、电网调度优化及电力市场交易支持。在电力领域,不仅改变了传统系统的运作方式,更为能源行业的智能化升级带来了全新的商业化机遇。
2024年6月,拾贝云发布能源大模型CyberwLLM;9月,羚羊工业迭代大模型2.0;10月14日,中国海油联合科大讯飞、中国电信正式发布“海能”人工智能模型;10月15日,国能日新“旷冥”大模型发布;2023年发布能源大模型的乐创能源也在今年进行了储能AI相关解决方案的更迭。
AI大模型的新能源场景应用
早在2022年,华为就公开展望了智能光伏发展十大趋势。预测到2027年,95%以上的光伏电站实现全面数字化,应用AI技术的比例将达到70%以上。
世界经济论坛总结,AI主要在两方面对新能源产业发展起到积极作用。一是提升设备发电效率。二是保障绿色电力平稳输送至电网。现在,AI大模型在新能源领域的应用场景,包括但不限于以下方面。
精准发电预测:通过分析天气预报、历史发电数据和实时条件,预测风能和太阳能等可再生能源的产生,更好平衡供需。
实现智能储能:优化可再生能源的存储和分配,考虑需求、供应、价格和电网条件,确定存储能量的最佳时间、释放能量的时机以及分配量。
光储解决方案:针对不同应用场景,通过集成核心技术,实现全场景光储零碳发电,提升电网稳定性和系统安全。
优化绿电交易:AI技术在电力现货价格预测、交易决策软件、交易策略服务等方面的应用,为发电、售电、用电企业提供决策支持。
开发运维增效:远程指挥自动化、智能化机器,节约开发建设和运维环节投入的资金、时间和人工成本,预测潜在故障,优化电网运行策略,提高电网的灵活性和韧性。
据分析,运用AI后,光伏发电站预测性维护效率可提升25%,故障率减少70%,运维成本降低了25%。
国能日新“旷冥”大模型
具备在新能源发电领域的高适应性,采用动态图神经网络、大气分层结构、时序注意力机制等前沿技术。
在风/光功率预测、极端天气预测和电力现货市场预测领域均有出色表现。
一方面能更精准地进行风、光的超短期、短期、中长期功率预测,引领新能源功率预测技术升级;
另一方面,对大风、台风、覆冰、沙尘等极端天气事件的命中率和精准率均有提升,还能结合电力市场特征,提供准确的气象资源预测、日前/实时电价预测、负荷预测等,为电力交易提供支持。
中国海油“海能”人工智能模型
依托讯飞星火大模型的底座能力,结合中国海油的数据资源、行业知识,以及中国电信的云计算和大数据支持。
覆盖专业和通用场景的11个场景模型,主要在提升海上油田的稳产增产、安全钻井等专业业务的数智化水平上赋能,同时在企业业务流程上推动提效,如智能会议、智能写作、智能翻译等通用应用赋能。
羚羊能源大模型
以讯飞星火大模型的通用能力为核心技术底座。具有能源内容生成、能源知识问答、能源理解计算、能源任务规划、能源多模态5大核心能力。
涵盖设备运检、电力问数、电力营销客服、辅助电力交易、新能源功率预测、安全生产等6大“大模型+能源”场景应用。
拾贝问道能源大模型
推出主体是中能拾贝(原广州健新科技),主要应用模块:包括巡检大模型、技术监督大模型、检修大模型、作业风险大模型、两票大模型等五大应用模块,为能源电力行业提供一站式的智能化解决方案。
更懂“行”,能深入理解电力行业业务场景,提供可溯源的智能问答服务;更有“数”,可通过自然语言交互自动生成查询并提供数据可视化;更“智”能,能快速响应业务变化,自动生成任务规划和执行方案。
结尾:
大模型的开发和应用通常经历七个关键阶段:数据收集与预处理、模型架构设计、预训练与调优、评估与测试、环境搭建与部署、日常监控与维护,以及反馈与优化。
这一过程对数据质量、算法精度和计算资源提出了极为苛刻的要求,需要大量的资金和领先的技术作支撑。
未来,随着新能源大模型技术的不断迭代与进步,智能电网、虚拟电厂等新兴产业将进一步发展,推动电力系统更加灵活高效,实现真正的源荷互动和实时动态调节。
通过这些技术与产业的协同发展,大模型将在全球清洁能源转型中发挥至关重要的作用。
内容来源于:大力财经:新能源头部企业,正疯狂卷向大模型;亿欧网:新能源大模型:2024遍地开花;证券日报:国能日新发布“旷冥”新能源大模型;海报新闻:海报储能 | AI “铸就”零碳:国能日新「旷冥」新能源大模型正式发布;经济精选:拾贝问道能源大模型:开启能源智能化的新纪元
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。