Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 最新升级其微调平台，支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重，同时新定价更低廉，旨在简化AI模型持续迭代。

Together Computer Inc. 今天推出了其 Fine-Tuning Platform（微调平台）的一项重大更新，旨在让开发者能够以更低廉且便捷的方式，随着时间的推移调整开源大语言模型。

这家以 Together AI 名义运营的初创公司经营着一个针对 AI 模型开发优化的公有云。新增功能支持在浏览器内进行微调，从而无需安装 Python 软件开发工具包或调用应用程序接口。

公司还新增了对直接偏好优化微调的支持，以及通过单个命令从先前运行结果中启动微调作业的功能。同时，其也调整了定价以降低训练成本。

Together AI 表示，这些更新反映了他们的信念： AI 模型不应是静态的，而应与所服务的应用程序共同进化。基于浏览器的界面允许开发者在无需编写任何代码的情况下启动微调作业。此前，这类任务需要额外的设置和专业技能。开发者可以上传数据集、定义训练参数并跟踪实验，从而降低持续微调的门槛。

Together AI 的微调产品负责人 Anirudh Jain 表示：“虽然质量上没有固有提升，因为底层方法与通过 API 进行微调完全相同，但基于浏览器的流程消除了脚本编写的需要，并将整个过程简化为直观的无代码体验。这使得非技术用户也能轻松进行微调，并比手动使用 API 的方法节省大约 50% 的时间。”他还指出，Python SDK 和 API 仍然可用，但并非必需。

Preference-based training 直接偏好优化是一种利用偏好数据训练语言模型的方法，在这种方法中，模型会针对同一提示同时展示一个较优响应与一个较差响应。模型不再仅仅模仿固定答案，而是通过对比损失函数，根据人类反馈学习偏好某些响应。该方法教会模型在其表示空间中将相似内容拉近距离，而将不相似内容推远。

Jain 说：“监督微调（SFT）帮助模型学会应说什么，而直接偏好优化（DPO）则教会模型不该说什么。”在使用标注的输入/输出对时，通常采用监督微调，而当训练数据包含来自人工评分者或 A/B 测试的偏好信息时，则采用 DPO。

与传统的强化学习技术不同，DPO 无需额外构建单独的奖励模型，因此其实现更为简单、迅速且稳定。开发者可以微调模型，使其更加符合用户与应用程序交互的方式，从而提升准确性和可信度。

持续训练允许开发者从先前训练的模型检查点继续进行微调。此功能对于随着时间的推移不断完善模型，或运行结合指令微调与偏好优化等方法的多阶段训练工作流非常有用。调用方式是通过引用先前训练作业的任务 ID，并从上一次任务结束后继续构建。

Jain 表示：“这大幅提升了效率和成本效益，使得模型迭代和改进的速度更快。”

平台的另一个改进允许开发者为对话数据中的消息分配不同权重，从而在不将其完全从训练上下文中移除的前提下，对某些响应进行降低优先级或忽略。同时，全新的余弦学习率调度器为训练动态提供了更大的灵活性和更精细的控制。

公司表示，对平台数据预处理引擎的更新已使大规模训练任务的性能提高最多达 32%，而小规模任务提高约 17%。

为了帮助小团队及独立开发者更便捷地尝试定制的大语言模型，Together AI 现还提供按需付费的定价模式，无最低消费限制。价格会根据模型大小和训练方法而有所不同。

目前，该平台支持对流行的开源模型进行微调，包括 Llama 3、Gemma 和 DeepSeek-R1 变体。公司表示未来计划支持更大规模的模型，如 Llama 4 及未来的 DeepSeek 版本。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Together AI 的增强功能使得 AI 微调更快更便捷

来源：SiliconANGLE

2025

04/18

18:03

分享

点赞

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

《2025 中国企业级 AI 实践调研分析年度报告》：深度剖析与价值洞察

Gartner：在中国构建AI软件工程技能的三大举措

阿联酋MBZUAI发布PAN世界模型，AI仿真技术迎来突破

Nvidia和Google支持的AI代码编辑器Cursor获23亿美元融资

Anthropic披露首例Claude模型参与的AI网络间谍活动

Cadence首款系统芯粒架构成功流片，助力物理AI发展加速

百度发布定制AI加速器响应国产芯片需求

VasEdge试用火热招募，降本增效机遇来袭

Infinidat InfiniBox G4系列升级重塑高端企业存储格局

Avalonia为微软MAUI跨平台应用方案带来Linux和浏览器支持

谷歌DeepMind发布SIMA 2智能体：游戏世界中学习迈向AGI之路

谷歌“Ironwood” TPU Pod与其他AI超级计算机的对比

斯坦福大学出新举措：全面深入解析 AI 在心理健康领域的应用

Google 对决 OpenAI：争夺学生的 AI 战场

OpenAI 最新 AI 模型引入新的安全保障措施以防范生物风险

Microsoft研究人员称开发出可在 CPU 上运行的超高效 AI 模型

404-GEN 整合去中心化 3D 模型生成平台 与 Unity

AI 的人性面：福祉与四重底线

Kraft Group 与 NWN 携手升级 New England Patriots 网络体系

万物皆可AI！“2025年度最值得关注AIGC企业/产品”揭晓

《2025中国AIGC应用全景图谱报告》重磅发布：全面勾勒中国AI创新发展新蓝图

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

404-GEN 整合去中心化 3D 模型生成平台与 Unity