市值610亿美元的Databricks联合创始人兼首席执行官阿里·高德思(Ali Ghodsi)参加了风险投资公司Redpoint举办的访谈节目,在与主持人洛根·巴特利特(Logan Bartlett)对话中,他详细分析了人工智能的炒作周期,并对未来做出了大胆预测,他还分享了将Databricks扩展为市场领导者过程中最大的运营经验,以及他人生旅途中的关键时刻。
高德思在访谈中提到,AI的发展速度和成本问题是一个复杂的话题。随着AI模型的不断进步,它们的成本也在不断上升,下一代模型的开发变得更加昂贵,这种成本的增加将会导致AI发展速度的放缓。如果未来的AI模型能够显著降低成本,比如GPT-5模型的成本大幅下降,那么将会看到AI技术的加速发展,但在当前的情况下,由于成本的上升和对模型的谨慎态度,AI的发展会比预期的要慢。
他还谈到了AI的炒作周期,目前正处于这个周期的顶部,未来我们将会看到越来越多的公司在AI领域表现不佳,这可能会导致一种观点的出现,即AI技术被过度宣传,实际上并没有达到预期的效果,这种观点将会引发公众对AI技术的质疑和失望。他认为,在这种质疑之后,我们可能会看到一些真正具有革命性的应用出现,这些应用将彻底改变人类的生活,他强调,目前可能面临挑战,但AI技术的潜力仍然巨大,未来的应用将更加专注于特定任务的优化,而不是追求通用的人工智能。未来AI的应用将会更加专业化和细分化,他预测,将会有越来越多的公司专注于构建特定领域的AI应用,这些应用将能够解决具体的业务问题,并为用户带来实际价值,这种趋势将会让AI技术在各个行业中的广泛应用,从而推动整个社会的技术进步。
高德思还提到了复合AI系统的概念,这是指将多个专门化的AI组件组合在一起,以解决更复杂的问题。这种系统能够针对特定的任务进行优化,并且可以通过迭代改进来不断提高性能,这种复合AI系统将是未来AI技术发展的一个重要方向。在这种系统中,每个组件都负责处理特定的数据或任务,而整个系统则通过协调这些组件来实现更高级的功能,这种方法可以对系统中的每个部分进行单独的优化和改进,从而使得整个系统的性能得到提升。
高德思对超级智能(Super AGI)的看法则更为谨慎。有些人对于实现Super AGI抱有很大的期望,但他个人对此持怀疑态度,高德思认为,要实现Super AGI,需要一种递归自改进的循环,但目前的AI模型开发成本高昂,需要大量的人力和资源,目前的发展趋势并非朝着快速迭代和自改进的方向发展,而是越来越专注于需要一整年时间精心构建的专用数据中心和模型。因此,他预测在未来很多年内,我们仍然需要人类参与到AI的决策过程中,以确保AI技术的发展方向是正确的,并且能够为人类的工作提供加速,而不是偏离正确的轨道。他认为,对于AI技术的发展,我们需要更多的专门化和可验证的系统,而不是寻求一个能够解决所有问题的通用解决方案。
AI的可解释性也是一个关键议题。随着AI模型变得越来越复杂,理解其决策过程和结果变得更加困难。高德思指出,为了建立用户对AI系统的信任,提高模型的透明度和可解释性也非常重要,这不仅有助于用户理解AI系统的工作原理,还能在出现问题时进行有效的调试和修正,比如在医疗和金融,可解释性尤其重要,因为这些决策可能对人们的生活产生重大影响。
在AI技术的商业化和货币化策略方面,高德思认为,AI不仅仅是一个技术概念,更是一个能够推动业务增长和创新的驱动力,企业需要理解AI技术如何与他们的业务目标相结合,以及如何利用这些技术来优化流程、提高效率和创造新的收入来源。AI的商业化不仅仅是关于开发一个产品或服务,而是要构建一个完整的生态系统,包括数据管理、模型训练和部署,以及持续的监控和优化,在这个生态系统中,企业可以利用AI来分析大量数据,从而获得深入的业务分析,这些分析可以转化为战略决策和行动计划。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。