创造出病毒级虚拟助手 Maya 的初创公司 Sesame 发布基础 AI 模型

AI 公司 Sesame 开源了支持其逼真语音助手 Maya 的基础模型。这个名为 CSM-1B 的 10 亿参数模型采用 Apache 2.0 许可证，可用于商业用途。该模型能从文本和音频输入生成"RVQ 音频编码"，使用了 Meta 的 Llama 模型作为主干。Sesame 提醒开发者谨慎使用，避免未经同意复制他人声音或制作虚假内容。

AI 公司 Sesame 发布了为其令人印象深刻的语音助手 Maya 提供支持的基础模型。

这个拥有 10 亿参数 ("参数"指模型的各个组成部分) 的模型采用 Apache 2.0 许可证，这意味着它可以在很少限制的情况下进行商业使用。根据 Sesame 在 AI 开发平台 Hugging Face 上的描述，这个名为 CSM-1B 的模型可以从文本和音频输入生成"RVQ 音频代码"。

RVQ 指"残差向量量化"，这是一种将音频编码为离散 token (称为代码) 的技术。RVQ 被用于多项最新的 AI 音频技术中，包括 Google 的 SoundStream 和 Meta 的 Encodec。

CSM-1B 使用 Meta 的 Llama 系列模型作为其主干，并配备了音频"解码器"组件。Sesame 表示，CSM 经过微调的变体为 Maya 提供支持。

Sesame 在 CSM-1B 的 Hugging Face 和 GitHub 仓库中写道："这里开源的模型是一个基础生成模型。它能够产生各种声音，但尚未针对任何特定声音进行微调...由于训练数据的污染，该模型对非英语语言有一定的处理能力，但效果可能不会很好。"

目前尚不清楚 Sesame 使用了什么数据来训练 CSM-1B。该公司对此没有说明。

值得注意的是，该模型实际上没有任何安全保障措施。Sesame 采用诚信系统，仅仅是敦促开发者和用户不要在未经本人同意的情况下使用该模型模仿他人的声音，不要创建误导性内容如假新闻，或从事"有害"或"恶意"活动。

我尝试了 Hugging Face 上的演示，克隆我的声音不到一分钟。之后，我可以轻松地生成任何想要的语音，包括关于选举和俄罗斯宣传等争议性话题。

Consumer Reports 最近警告说，市面上许多流行的 AI 驱动的声音克隆工具都没有"有意义的"保障措施来防止欺诈或滥用。

Oculus 联合创始人 Brendan Iribe 共同创立的 Sesame 在 2 月底因其助手技术而走红，这项技术几乎突破了恐怖谷效应。Maya 和 Sesame 的另一个助手 Miles 会呼吸，说话时会有停顿，而且可以像 OpenAI 的 Voice Mode 一样在说话时被打断。

Sesame 已从 Andreessen Horowitz、Spark Capital 和 Matrix Partners 获得未披露金额的投资。除了开发语音助手技术外，该公司表示正在开发"设计用于全天佩戴"的 AI 眼镜原型，这些眼镜将配备其定制模型。

来源：Techcrunch

0赞

好文章，需要你的鼓励

创造出病毒级虚拟助手 Maya 的初创公司 Sesame 发布基础 AI 模型

来源：Techcrunch

2025

03/14

15:56

分享

点赞

NVIDIA 与世界领先企业共同加速无人驾驶出租车的全球部署

当AI数学助手开始说谎：INSAIT和ETH揭示大语言模型在定理证明中的谄媚陷阱

由“术”及“道”：戴尔科技定义现代化“网络韧性”新范式

亚马逊云科技第三期创业加速器圆满收官 助力初创释放Agentic AI潜力 加速全球化进程

iPhone Air续航测试：实验室和真实使用均可支撑一天使用

苹果明年或将推出五款全新Home产品

Hammerspace加入英伟达AI数据平台阵营提供数据基础支撑

新唐科技在微控制器中集成微型AI功能

智能体AI技术或将淘汰命令行界面技能

OpenAI非营利机构将运营尚未盈利的营利性公司

Skyworks与Qorvo合并，将打造市值220亿美元的美国高性能

借助 NVIDIA技术，Akamai Inference Cloud实现 AI 从核心到边缘的扩展

通往主动式 AI 的阶梯：探索企业 AI 的下一个前沿

Priscilla Chan 认为细胞 AI 模型是生物医学领域的下一个重大突破

AI 能否担任花样滑冰裁判？

Nvidia GTC 主题演讲将重点关注 AI 而非游戏

苹果的下一步最佳选择可能是举办现场 WWDC 主题演讲

新技术帮助大语言模型控制思维链长度，在不增加计算成本的情况下优化推理能力

Cohere 发布仅需两块 GPU 的低成本 AI 模型

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

亚马逊云科技第三期创业加速器圆满收官助力初创释放Agentic AI潜力加速全球化进程