去年夏天,矿业初创公司 KoBold 在赞比亚发现了十多年来全球最大的铜矿床之一,引起了广泛关注。
现在,另一家初创公司 Earth AI 向 TechCrunch 独家透露了他们的重大发现:在澳大利亚一些被其他矿业公司忽视了数十年的地区发现了具有前景的关键矿产。虽然目前还不清楚这些矿藏是否像 KoBold 的发现那样规模庞大,但这一消息表明,未来关键矿产的供应很可能来自于人工智能解析实地数据的综合成果。
"(矿业领域的) 真正前沿并不在于地理位置,而在于技术," Earth AI 的创始人兼首席执行官 Roman Teslyuk 在接受 TechCrunch 采访时表示。
Earth AI 在北领地发现了铜、钴和黄金矿床,在新南威尔士另一处距离悉尼西北 500 公里 (310 英里) 的地点发现了银、钼和锡矿床。
Earth AI 在澳大利亚两个此前被忽视的地区发现了具有前景的关键矿产。
Earth AI 源于 Teslyuk 的研究生学习经历。来自乌克兰的 Teslyuk 在悉尼大学攻读博士学位期间,深入了解了澳大利亚的矿业行业。在澳大利亚,政府拥有矿产资源的所有权,并以六年为期进行租赁。他表示,自 1970 年代以来,勘探公司必须将其数据提交到国家档案库。
"出于某些原因,没有人使用这些数据," 他说。"如果我能建立一个算法来吸收所有这些知识,并从过去数百万地质学家的失败和成功中学习,我就能更好地预测未来在哪里可以找到矿产。"
Teslyuk 最初将 Earth AI 创建为一家专注于预测潜在矿床的软件公司,然后寻找可能对进一步勘探感兴趣的客户。但客户们对投资持谨慎态度,部分原因是他们不愿意在一个未经验证的技术的预测上投入数百万资金。
"矿业是一个非常保守的行业," Teslyuk 说。"任何超出既定准则的东西都被视为异端。"
因此,Earth AI 决定开发自己的钻探设备,以证明其软件所识别的地点确实如预测的那样具有前景。该公司入选了 Y Combinator 2019 年春季批次,并在接下来的几年里不断完善其硬件和软件。今年 1 月,Earth AI 完成了 2000 万美元的 B 轮融资。
虽然该公司像 KoBold 一样使用人工智能寻找矿产,但 Teslyuk 表示他们采用了不同的方法。他说,Earth AI 的算法经过训练,能够快速高效地扫描大面积区域,发现可能被忽视的矿床。
"过去在 20 世纪寻找金属的方式耗时非常长,需要几十年才能找到一些东西," Teslyuk 说。"以现代世界的发展速度,你根本无法等待那么长时间。"
好文章,需要你的鼓励
这篇研究揭示了大语言模型强化学习中的"熵崩塌"现象——模型在训练早期迅速失去探索能力,导致性能达到可预测的上限。研究者发现验证性能和策略熵之间存在精确的数学关系:R = -a·exp(H) + b,并深入分析了熵变化的内在机制。基于这些发现,他们提出了两种简单有效的方法(Clip-Cov和KL-Cov)来缓解熵崩塌问题,显著提升了模型性能,特别是在困难任务上。这项研究为大模型强化学习的规模化应用提供了关键指导。
Skywork OR1是昆仑公司AI团队开发的开源推理大模型,通过创新的强化学习方法显著增强了语言模型的推理能力。该研究基于DeepSeek-R1-Distill模型系列,采用名为MAGIC的训练方法,在AIME24、AIME25和LiveCodeBench三大基准测试中实现了显著性能提升,32B模型平均准确率提高15.0%,7B模型提高13.9%。研究团队通过系统研究策略熵崩塌现象,提出了有效的缓解策略,并开源了全部代码、数据和模型权重,为AI社区提供了宝贵资源。
上海交通大学研究团队发现多模态大语言模型中的"啊哈时刻"(自我反思模式)虽存在但并不意味着推理能力提升。他们提出了"冷启动强化学习"两阶段方法:先用监督微调建立推理模式,再通过强化学习优化。实验表明,这种方法在多个多模态数学推理基准上表现卓越,使3B参数模型达到接近甚至超越部分7B模型的性能,为增强多模态AI推理能力提供了有效路径。
MBZUAI研究团队开发的SVRPBench是首个模拟真实物流环境的随机车辆路径问题基准测试平台。它通过建模时间依赖的交通拥堵、概率性延误和客户特定时间窗口,为500多个包含最多1000客户的测试实例注入真实世界的不确定性。实验结果显示,先进的强化学习算法在分布变化时性能下降超过20%,而传统方法表现更为稳健。该开源平台通过GitHub和Hugging Face发布,旨在推动更适应现实世界不确定性的路由算法研究。