随着AI技术的发展速度远超企业缓慢的采购周期,许多公司都在努力采用合适的AI工具。
企业信用卡公司Brex也面临同样的挑战。这家初创公司发现自己与其他企业同行面临相同的问题。结果是:Brex彻底改变了其软件采购方式,以确保不会落后于时代。
Brex首席技术官James Reggio在3月份的HumanX AI会议上告诉TechCrunch,公司最初试图通过常规采购策略评估这些软件工具。但这家初创公司很快发现,其长达数月的试点流程根本行不通。
"在ChatGPT发布后的第一年,当所有这些新工具涌现时,采购流程本身耗时如此之长,以至于请求采购工具的团队在我们完成所有必要的内部控制流程时,已经对该工具失去了兴趣,"Reggio说。
正是在那时,Brex意识到必须彻底重新思考其采购流程。
Reggio表示,公司首先为引入AI工具制定了新的数据处理协议框架和法律验证程序。这使Brex能够更快地审核潜在的AI工具,并更迅速地将它们交到测试人员手中。
Reggio说,公司使用"超人级产品市场匹配测试"来确定哪些工具值得在试点项目之外继续投资。这种方法让员工在决定公司应该采用哪些工具方面发挥更大作用,基于他们发现价值的地方。
"我们与从工具中获得最大价值的人员深入合作,以确定该工具是否真正独特到值得保留,"Reggio说。"我们基本上已经进入这个新时代大约两年了,公司内部有1000种AI工具。我们确实已经取消并未续约可能5到10个不同的大型部署。"
Brex为其工程师提供每月50美元的预算,让他们从批准清单中选择想要的软件工具。
"通过将支出权限委托给将要使用这些工具的个人,他们能够为优化工作流程做出最佳决策,"Reggio说。"这实际上非常有趣,我们没有看到趋同现象。我认为这也验证了让人们轻松尝试各种不同工具的决定是正确的,因为我们没有看到每个人都冲进来说'我想要Cursor'。"
这种方法还帮助公司根据更准确的工程师使用情况统计,确定在哪些软件上需要更广泛的许可协议。
总的来说,Reggio表示,在他看来,企业应对当前AI创新周期的最佳方式是"拥抱混乱",并认识到确定采用哪些工具将是一个颠簸的过程,这是可以接受的。
"知道你不会总是在一开始就做出正确的决定,这对确保你不会落后至关重要,"Reggio说。"我认为我们可能犯的一个错误是过度思考,花费六到九个月时间在部署前非常仔细地评估一切。而你不知道九个月后世界会是什么样子。"
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试,专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现,即使是GPT-5和Claude Opus 4.1等最先进模型,在处理看似简单的格式要求时准确率也不超过80%,揭示了AI在实际应用中的重要局限性。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型,仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略,先进行全局布局分析再做局部精细识别,计算效率提升一个数量级。通过重新定义任务标准和构建高质量数据引擎,MinerU2.5能准确处理旋转表格、复杂公式、多语言文档等挑战性内容,为文档数字化提供了高效解决方案。