支付巨头 Stripe 在周四发布的年度信函中宣布,从其数据来看,"AI 正在蓬勃发展",数据显示人工智能创业公司的增长速度远超传统 SaaS 公司的历史水平。
通过一张图表,Stripe 展示了 2024 年排名前 100 的 AI 公司 (按收入计算) 在 24 个月内就实现了 500 万美元的年化收入,相比之下,2018 年排名前 100 的 SaaS 公司用了 37 个月才达到同样的里程碑。
Stripe 的 CEO 兼联合创始人 Patrick 和 John Collison 写道:"我们 2024 年的数据显示,这些创业公司正以创纪录的速度发展业务。"
具体而言,联合创始人举例说明了这次 AI 热潮:AI 驱动的编程助手 Cursor 收入超过 1 亿美元,Lovable 在短短 3 个月内实现 1700 万美元的年度经常性收入 (ARR),而 Bolt 在两个月内达到 2000 万美元的 ARR。
他们写道:"就像 SaaS 从水平发展到垂直发展 (先是 Salesforce,然后是 Toast),我们在 AI 领域看到了类似的发展趋势:我们从 ChatGPT 开始,现在正在看到行业特定工具的激增。有些人称这些创业公司为'大语言模型包装器',但这些人没有抓住重点。"
Stripe 表示,新的行业特定 AI 工具正在帮助这些参与者"真正实现大语言模型的经济价值,而且上下文、数据和工作流程的整合将证明其持久的价值。"
作为证据,联合创始人指出,像 Abridge、Nabla 和 DeepScribe 等创业公司正在帮助改造患者和医疗护理,而建筑师则在使用 SketchPro。
同样,Stripe 对垂直 SaaS 仍然非常看好,特别是在小企业方面。数据显示,在 Stripe 平台上运营的垂直 SaaS 支持的中小企业中,有 6.3% 在第一年就实现了 100 万美元的总收入,比某个基准对照组高出近 60%。
信函还指出,2024 年支付额增长至 1.4 万亿美元,同比增长 38%。周四,公司还确认了一项收购要约,投资者将以 915 亿美元的估值从员工手中购买股份。Stripe 表示将作为交易的一部分回购股份。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。