面向小型开发团队的云基础设施提供商 DigitalOcean Holdings Inc. 最近加入了代理型 AI 的潮流,推出了全新的 GenAI 平台,让团队能在几分钟内构建和部署 AI 代理。
AI 代理是当今人工智能行业最热门的趋势之一,它指的是能够代表人类用户自主执行操作,并在最小监督下进行复杂决策或分析的生成式 AI 模型。AI 代理能够随时间学习新知识,使其表现随着经验的积累而不断提升。
代理型 AI 的潜力巨大,尽管可能需要多年时间才能充分认识到它的全部能力,但 DigitalOcean 已将其视为云基础设施提供商的关键竞争领域。
该公司是 Amazon Web Services Inc. 和 Microsoft Corp. 等公共云巨头的竞争对手,提供竞争性的云基础设施即服务平台。但它并未直接与这些巨头竞争,而是通过其面向个人开发者的"开发者云",为小型企业开辟了独特的市场定位。
它以简化的界面和具有竞争力的价格脱颖而出,推崇以部署速度为重点的用户友好体验。其无服务器基础设施使应用程序只需几次简单点击就能部署到生产环境,符合其保持云计算简单性的目标。
DigitalOcean 认为构建 AI 代理也应该简单,其新的 GenAI 平台可以帮助开发者在无需 AI 或机器学习专业技能的情况下快速部署。
DigitalOcean 的产品和技术总监 Bratin Saha 在公司年度客户会议 Deploy 上发布了 GenAI 平台,他解释说这一切都是为了让小型公司也能使用 AI 代理。"生成式 AI 是一个具有挑战性的概念,但我们的团队不懈努力,创建了一个易用的平台,可以无缝集成到客户现有的基础设施中,并且对任何经验水平的开发者都具有较低的入门门槛。"
为了简化流程,该平台提供了创建 AI 代理的蓝图,用户只需从专门用于文档分析、图像生成和语义搜索等任务的基础模型库中进行选择。然后将其连接到专有或公共数据集,实际上就可以开始使用了。所有这些都可以通过 AI 聊天机器人界面完成,用户只需描述他们想要构建的内容即可。
该公司解释说,它使用"函数调用"将 AI 代理连接到用户的数据库或应用程序编程接口,确保它们能够访问最准确和最新的数据。它还提供了安全和可靠性保障,最大限度地降低不准确、不可靠或不当响应的风险。同时也提供私有端点支持。
此外,DigitalOcean 强调了其 GenAI 平台的"框架无关性",支持从 AI 代理创建到部署的无缝过渡。客户还可以利用公司广受欢迎的"GPU Droplets",这是由 Nvidia Corp. 流行的 H100 图形处理单元驱动的虚拟机。这些于去年推出的服务提供灵活的单节点和多节点配置,专门用于支持 AI 工作负载。
Constellation Research Inc. 的副总裁兼首席分析师 Andy Thurai 表示,在当前每个云基础设施公司都在争相支持 AI 代理开发的时候,DigitalOcean 提供的无代码功能可以使 GenAI 平台成为开发者的有力选择。
"它承诺能帮助开发者像其他平台一样快速地构建和部署他们的 AI 代理,甚至更快,"他说。
分析师表示,DigitalOcean 的主要优势似乎在于能够访问特定上下文、语言和客户特定数据的定制 AI 代理,尽管它们可能仅限于相对简单的工作流程。
"构建复杂的工作流程会更困难,但该平台对于 AI 和机器学习知识有限的开发者来说很有用,"Thurai 补充道。"他们还可以利用 GPU Droplets,根据任务使用情况调整 GPU 基础设施的规模,并支持使用更优化的大语言模型。"
工业自动化公司 Autonoma Inc. 有幸提前接触到 DigitalOcean 的 GenAI 平台,用它构建和部署了一个能够为每个客户创建和管理大量文档的 AI 代理。
"我们能够快速创建理解每个客户特定上下文和语言的智能 AI 代理,"Autonoma 总经理 Florian Bauernfeind 解释说。"它让我们更容易阅读大量文档并搜索各种内容。"
该公司表示,其 GenAI 平台自去年以来一直处于测试阶段,现在向所有客户全面开放。但尽管现已可用,它还远未完成。
DigitalOcean 表示计划逐步增强平台的功能,其产品路线图包括支持 URL 作为数据源、代理评估、持续集成和部署管道、知识库自动索引以及模型微调等功能。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。