Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 最新升级其微调平台，支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重，同时新定价更低廉，旨在简化AI模型持续迭代。

Together Computer Inc. 今天推出了其 Fine-Tuning Platform（微调平台）的一项重大更新，旨在让开发者能够以更低廉且便捷的方式，随着时间的推移调整开源大语言模型。

这家以 Together AI 名义运营的初创公司经营着一个针对 AI 模型开发优化的公有云。新增功能支持在浏览器内进行微调，从而无需安装 Python 软件开发工具包或调用应用程序接口。

公司还新增了对直接偏好优化微调的支持，以及通过单个命令从先前运行结果中启动微调作业的功能。同时，其也调整了定价以降低训练成本。

Together AI 表示，这些更新反映了他们的信念： AI 模型不应是静态的，而应与所服务的应用程序共同进化。基于浏览器的界面允许开发者在无需编写任何代码的情况下启动微调作业。此前，这类任务需要额外的设置和专业技能。开发者可以上传数据集、定义训练参数并跟踪实验，从而降低持续微调的门槛。

Together AI 的微调产品负责人 Anirudh Jain 表示：“虽然质量上没有固有提升，因为底层方法与通过 API 进行微调完全相同，但基于浏览器的流程消除了脚本编写的需要，并将整个过程简化为直观的无代码体验。这使得非技术用户也能轻松进行微调，并比手动使用 API 的方法节省大约 50% 的时间。”他还指出，Python SDK 和 API 仍然可用，但并非必需。

Preference-based training 直接偏好优化是一种利用偏好数据训练语言模型的方法，在这种方法中，模型会针对同一提示同时展示一个较优响应与一个较差响应。模型不再仅仅模仿固定答案，而是通过对比损失函数，根据人类反馈学习偏好某些响应。该方法教会模型在其表示空间中将相似内容拉近距离，而将不相似内容推远。

Jain 说：“监督微调（SFT）帮助模型学会应说什么，而直接偏好优化（DPO）则教会模型不该说什么。”在使用标注的输入/输出对时，通常采用监督微调，而当训练数据包含来自人工评分者或 A/B 测试的偏好信息时，则采用 DPO。

与传统的强化学习技术不同，DPO 无需额外构建单独的奖励模型，因此其实现更为简单、迅速且稳定。开发者可以微调模型，使其更加符合用户与应用程序交互的方式，从而提升准确性和可信度。

持续训练允许开发者从先前训练的模型检查点继续进行微调。此功能对于随着时间的推移不断完善模型，或运行结合指令微调与偏好优化等方法的多阶段训练工作流非常有用。调用方式是通过引用先前训练作业的任务 ID，并从上一次任务结束后继续构建。

Jain 表示：“这大幅提升了效率和成本效益，使得模型迭代和改进的速度更快。”

平台的另一个改进允许开发者为对话数据中的消息分配不同权重，从而在不将其完全从训练上下文中移除的前提下，对某些响应进行降低优先级或忽略。同时，全新的余弦学习率调度器为训练动态提供了更大的灵活性和更精细的控制。

公司表示，对平台数据预处理引擎的更新已使大规模训练任务的性能提高最多达 32%，而小规模任务提高约 17%。

为了帮助小团队及独立开发者更便捷地尝试定制的大语言模型，Together AI 现还提供按需付费的定价模式，无最低消费限制。价格会根据模型大小和训练方法而有所不同。

目前，该平台支持对流行的开源模型进行微调，包括 Llama 3、Gemma 和 DeepSeek-R1 变体。公司表示未来计划支持更大规模的模型，如 Llama 4 及未来的 DeepSeek 版本。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Together AI 的增强功能使得 AI 微调更快更便捷

来源：SiliconANGLE

2025

04/18

18:03

分享

点赞

IEEE：为何防钓鱼培训难有成效

Perplexity推出电视应用 率先登陆三星智能电视

M5 MacBook Pro评测：优秀但缺乏新意

智能CEO为何追踪"陌生指标"而非传统KPI

29家顶尖机构，联合定义通用人工智能AGI

西门子将八赴进博，以工业AI加速中国企业效率与绿色“双跃迁”

Dell Pro Max搭载GB10重塑AI开发体验

AI赋能 创意新生 —— 2025厦门国际动漫节“金海豚奖”48小时游戏开发大赛圆满收官

戴尔科技推出全新Dell Pro Essential笔记本电脑，专为中小型企业而打造

OpenAI推出浏览器ChatGPT Atlas并秘密培训金融专家

Chrome和Safari浏览器市场统治地位面临挑战 2025年最佳替代浏览器盘点

Google AI Studio推出"氛围编程"助力低门槛应用开发

谷歌“Ironwood” TPU Pod与其他AI超级计算机的对比

斯坦福大学出新举措：全面深入解析 AI 在心理健康领域的应用

Google 对决 OpenAI：争夺学生的 AI 战场

OpenAI 最新 AI 模型引入新的安全保障措施以防范生物风险

Microsoft研究人员称开发出可在 CPU 上运行的超高效 AI 模型

404-GEN 整合去中心化 3D 模型生成平台 与 Unity

AI 的人性面：福祉与四重底线

Kraft Group 与 NWN 携手升级 New England Patriots 网络体系

万物皆可AI！“2025年度最值得关注AIGC企业/产品”揭晓

《2025中国AIGC应用全景图谱报告》重磅发布：全面勾勒中国AI创新发展新蓝图

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Perplexity推出电视应用率先登陆三星智能电视

AI赋能创意新生 —— 2025厦门国际动漫节“金海豚奖”48小时游戏开发大赛圆满收官

404-GEN 整合去中心化 3D 模型生成平台与 Unity