随着AI技术的发展速度远超企业缓慢的采购周期,许多公司都在努力采用合适的AI工具。
企业信用卡公司Brex也面临同样的挑战。这家初创公司发现自己与其他企业同行面临相同的问题。结果是:Brex彻底改变了其软件采购方式,以确保不会落后于时代。
Brex首席技术官James Reggio在3月份的HumanX AI会议上告诉TechCrunch,公司最初试图通过常规采购策略评估这些软件工具。但这家初创公司很快发现,其长达数月的试点流程根本行不通。
"在ChatGPT发布后的第一年,当所有这些新工具涌现时,采购流程本身耗时如此之长,以至于请求采购工具的团队在我们完成所有必要的内部控制流程时,已经对该工具失去了兴趣,"Reggio说。
正是在那时,Brex意识到必须彻底重新思考其采购流程。
Reggio表示,公司首先为引入AI工具制定了新的数据处理协议框架和法律验证程序。这使Brex能够更快地审核潜在的AI工具,并更迅速地将它们交到测试人员手中。
Reggio说,公司使用"超人级产品市场匹配测试"来确定哪些工具值得在试点项目之外继续投资。这种方法让员工在决定公司应该采用哪些工具方面发挥更大作用,基于他们发现价值的地方。
"我们与从工具中获得最大价值的人员深入合作,以确定该工具是否真正独特到值得保留,"Reggio说。"我们基本上已经进入这个新时代大约两年了,公司内部有1000种AI工具。我们确实已经取消并未续约可能5到10个不同的大型部署。"
Brex为其工程师提供每月50美元的预算,让他们从批准清单中选择想要的软件工具。
"通过将支出权限委托给将要使用这些工具的个人,他们能够为优化工作流程做出最佳决策,"Reggio说。"这实际上非常有趣,我们没有看到趋同现象。我认为这也验证了让人们轻松尝试各种不同工具的决定是正确的,因为我们没有看到每个人都冲进来说'我想要Cursor'。"
这种方法还帮助公司根据更准确的工程师使用情况统计,确定在哪些软件上需要更广泛的许可协议。
总的来说,Reggio表示,在他看来,企业应对当前AI创新周期的最佳方式是"拥抱混乱",并认识到确定采用哪些工具将是一个颠簸的过程,这是可以接受的。
"知道你不会总是在一开始就做出正确的决定,这对确保你不会落后至关重要,"Reggio说。"我认为我们可能犯的一个错误是过度思考,花费六到九个月时间在部署前非常仔细地评估一切。而你不知道九个月后世界会是什么样子。"
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。