创造出病毒级虚拟助手 Maya 的初创公司 Sesame 发布基础 AI 模型

AI 公司 Sesame 开源了支持其逼真语音助手 Maya 的基础模型。这个名为 CSM-1B 的 10 亿参数模型采用 Apache 2.0 许可证，可用于商业用途。该模型能从文本和音频输入生成"RVQ 音频编码"，使用了 Meta 的 Llama 模型作为主干。Sesame 提醒开发者谨慎使用，避免未经同意复制他人声音或制作虚假内容。

AI 公司 Sesame 发布了为其令人印象深刻的语音助手 Maya 提供支持的基础模型。

这个拥有 10 亿参数 ("参数"指模型的各个组成部分) 的模型采用 Apache 2.0 许可证，这意味着它可以在很少限制的情况下进行商业使用。根据 Sesame 在 AI 开发平台 Hugging Face 上的描述，这个名为 CSM-1B 的模型可以从文本和音频输入生成"RVQ 音频代码"。

RVQ 指"残差向量量化"，这是一种将音频编码为离散 token (称为代码) 的技术。RVQ 被用于多项最新的 AI 音频技术中，包括 Google 的 SoundStream 和 Meta 的 Encodec。

CSM-1B 使用 Meta 的 Llama 系列模型作为其主干，并配备了音频"解码器"组件。Sesame 表示，CSM 经过微调的变体为 Maya 提供支持。

Sesame 在 CSM-1B 的 Hugging Face 和 GitHub 仓库中写道："这里开源的模型是一个基础生成模型。它能够产生各种声音，但尚未针对任何特定声音进行微调...由于训练数据的污染，该模型对非英语语言有一定的处理能力，但效果可能不会很好。"

目前尚不清楚 Sesame 使用了什么数据来训练 CSM-1B。该公司对此没有说明。

值得注意的是，该模型实际上没有任何安全保障措施。Sesame 采用诚信系统，仅仅是敦促开发者和用户不要在未经本人同意的情况下使用该模型模仿他人的声音，不要创建误导性内容如假新闻，或从事"有害"或"恶意"活动。

我尝试了 Hugging Face 上的演示，克隆我的声音不到一分钟。之后，我可以轻松地生成任何想要的语音，包括关于选举和俄罗斯宣传等争议性话题。

Consumer Reports 最近警告说，市面上许多流行的 AI 驱动的声音克隆工具都没有"有意义的"保障措施来防止欺诈或滥用。

Oculus 联合创始人 Brendan Iribe 共同创立的 Sesame 在 2 月底因其助手技术而走红，这项技术几乎突破了恐怖谷效应。Maya 和 Sesame 的另一个助手 Miles 会呼吸，说话时会有停顿，而且可以像 OpenAI 的 Voice Mode 一样在说话时被打断。

Sesame 已从 Andreessen Horowitz、Spark Capital 和 Matrix Partners 获得未披露金额的投资。除了开发语音助手技术外，该公司表示正在开发"设计用于全天佩戴"的 AI 眼镜原型，这些眼镜将配备其定制模型。

来源：Techcrunch

0赞

好文章，需要你的鼓励

创造出病毒级虚拟助手 Maya 的初创公司 Sesame 发布基础 AI 模型

来源：Techcrunch

2025

03/14

15:56

分享

点赞

生命科学计算测试专委会正式成立，BioProfile框架引领行业标准建设

超智算完成北京核心智算中心资产收购，加速构筑“3+X”全国算力网络新格局

走出“参数崇拜”：联想用“一体多端”重塑“人的尺度”

从“单点突破”到“一体多端”：拆解天禧AI 3.5进化背后三年的进化哲学

openGauss Summit 2025在京召开，加速行业智能化变革，共建繁荣数据库生态

2025联想天禧AI生态伙伴大会：天禧AI一体多端，与开发者共建个人AI生态

西班牙病毒如何将谷歌带到马拉加

LangChain核心库曝出严重漏洞，AI智能体机密信息面临泄露风险

Mill如何与亚马逊和全食超市达成合作协议

TechCrunch创业大赛中的9家顶尖生物技术初创公司

2025年印度科技领域十大重要发展

中科大发布Live Avatar：AI数字人无限聊天不翻车

通往主动式 AI 的阶梯：探索企业 AI 的下一个前沿

Priscilla Chan 认为细胞 AI 模型是生物医学领域的下一个重大突破

AI 能否担任花样滑冰裁判？

Nvidia GTC 主题演讲将重点关注 AI 而非游戏

苹果的下一步最佳选择可能是举办现场 WWDC 主题演讲

新技术帮助大语言模型控制思维链长度，在不增加计算成本的情况下优化推理能力

Cohere 发布仅需两块 GPU 的低成本 AI 模型

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: