面向小型开发团队的云基础设施提供商 DigitalOcean Holdings Inc. 最近加入了代理型 AI 的潮流,推出了全新的 GenAI 平台,让团队能在几分钟内构建和部署 AI 代理。
AI 代理是当今人工智能行业最热门的趋势之一,它指的是能够代表人类用户自主执行操作,并在最小监督下进行复杂决策或分析的生成式 AI 模型。AI 代理能够随时间学习新知识,使其表现随着经验的积累而不断提升。
代理型 AI 的潜力巨大,尽管可能需要多年时间才能充分认识到它的全部能力,但 DigitalOcean 已将其视为云基础设施提供商的关键竞争领域。
该公司是 Amazon Web Services Inc. 和 Microsoft Corp. 等公共云巨头的竞争对手,提供竞争性的云基础设施即服务平台。但它并未直接与这些巨头竞争,而是通过其面向个人开发者的"开发者云",为小型企业开辟了独特的市场定位。
它以简化的界面和具有竞争力的价格脱颖而出,推崇以部署速度为重点的用户友好体验。其无服务器基础设施使应用程序只需几次简单点击就能部署到生产环境,符合其保持云计算简单性的目标。
DigitalOcean 认为构建 AI 代理也应该简单,其新的 GenAI 平台可以帮助开发者在无需 AI 或机器学习专业技能的情况下快速部署。
DigitalOcean 的产品和技术总监 Bratin Saha 在公司年度客户会议 Deploy 上发布了 GenAI 平台,他解释说这一切都是为了让小型公司也能使用 AI 代理。"生成式 AI 是一个具有挑战性的概念,但我们的团队不懈努力,创建了一个易用的平台,可以无缝集成到客户现有的基础设施中,并且对任何经验水平的开发者都具有较低的入门门槛。"
为了简化流程,该平台提供了创建 AI 代理的蓝图,用户只需从专门用于文档分析、图像生成和语义搜索等任务的基础模型库中进行选择。然后将其连接到专有或公共数据集,实际上就可以开始使用了。所有这些都可以通过 AI 聊天机器人界面完成,用户只需描述他们想要构建的内容即可。
该公司解释说,它使用"函数调用"将 AI 代理连接到用户的数据库或应用程序编程接口,确保它们能够访问最准确和最新的数据。它还提供了安全和可靠性保障,最大限度地降低不准确、不可靠或不当响应的风险。同时也提供私有端点支持。
此外,DigitalOcean 强调了其 GenAI 平台的"框架无关性",支持从 AI 代理创建到部署的无缝过渡。客户还可以利用公司广受欢迎的"GPU Droplets",这是由 Nvidia Corp. 流行的 H100 图形处理单元驱动的虚拟机。这些于去年推出的服务提供灵活的单节点和多节点配置,专门用于支持 AI 工作负载。
Constellation Research Inc. 的副总裁兼首席分析师 Andy Thurai 表示,在当前每个云基础设施公司都在争相支持 AI 代理开发的时候,DigitalOcean 提供的无代码功能可以使 GenAI 平台成为开发者的有力选择。
"它承诺能帮助开发者像其他平台一样快速地构建和部署他们的 AI 代理,甚至更快,"他说。
分析师表示,DigitalOcean 的主要优势似乎在于能够访问特定上下文、语言和客户特定数据的定制 AI 代理,尽管它们可能仅限于相对简单的工作流程。
"构建复杂的工作流程会更困难,但该平台对于 AI 和机器学习知识有限的开发者来说很有用,"Thurai 补充道。"他们还可以利用 GPU Droplets,根据任务使用情况调整 GPU 基础设施的规模,并支持使用更优化的大语言模型。"
工业自动化公司 Autonoma Inc. 有幸提前接触到 DigitalOcean 的 GenAI 平台,用它构建和部署了一个能够为每个客户创建和管理大量文档的 AI 代理。
"我们能够快速创建理解每个客户特定上下文和语言的智能 AI 代理,"Autonoma 总经理 Florian Bauernfeind 解释说。"它让我们更容易阅读大量文档并搜索各种内容。"
该公司表示,其 GenAI 平台自去年以来一直处于测试阶段,现在向所有客户全面开放。但尽管现已可用,它还远未完成。
DigitalOcean 表示计划逐步增强平台的功能,其产品路线图包括支持 URL 作为数据源、代理评估、持续集成和部署管道、知识库自动索引以及模型微调等功能。
好文章,需要你的鼓励
谷歌CEO皮查伊在AI竞赛低谷期坚持"信号降噪"原则,顶住压力加倍投入,最终带领谷歌凭借Gemini系列重夺领先。他坚信AI将超越火与电的革命性影响,通过递归自我改进极大降低创意实现门槛,这场"创造力民主化"浪潮或将解锁80亿人的认知潜能。
浙江大学和吉利汽车研究院联合团队提出的FreeTimeGS是一种创新的动态3D场景重建方法。不同于传统方法,它允许高斯基元在任意时空位置自由出现,并赋予每个基元运动功能,使其能够随时间移动到相邻区域。研究通过4D正则化策略解决了高不透明度基元阻碍优化的问题。在多个数据集测试中,该方法在渲染质量和速度上均大幅超越现有技术,特别是在处理复杂动态场景时,使用单个RTX 4090 GPU能以467 FPS的速度实现1080p实时渲染,为电影制作、游戏和虚拟现实等应用提供了新可能。
李飞飞的World Labs以"空间智能"重新定义AI,专注3D物理世界理解,4个月估值飙至10亿美元,获科技巨头集体押注。她揭示语言无法编码物理世界,而DNA双螺旋等突破性发现都源于三维空间的深度认知。
这篇研究介绍了"对角线批处理"技术,该技术解决了循环记忆Transformer模型在处理长文本时的并行计算瓶颈。通过重新编排计算顺序,研究团队实现了在不破坏依赖关系的情况下进行并行计算,使LLaMA-1B模型处理长文本的速度提升3.3倍,同时内存使用减少167.1倍。这种纯运行时优化不需要重新训练模型,为实际应用中的长文本处理提供了高效解决方案。