据报道,AI 创业公司 Anthropic 正在为其 AI 驱动的聊天机器人 Claude 开发语音功能。
公司首席产品官 Mike Krieger 在接受英国《金融时报》采访时表示,Anthropic 计划推出能让用户与其 AI 模型进行语音对话的功能。
"我们正在研究如何让桌面版 Claude 进化...... 如果它要操作你的电脑,那么更自然的用户界面可能是 (通过语音) 与它交谈,"Krieger 说。"我们将在内部开发语音功能...... 这是一个有用的交互模式。我们已经有了原型。"
报道还指出,Anthropic 已经与该公司的主要投资者和合作伙伴 Amazon,以及专注于语音的 AI 创业公司 ElevenLabs 进行了会谈,可能为 Claude 的未来语音功能提供支持。但据《金融时报》报道,目前尚未达成任何最终协议。
Krieger 向该媒体表示,Anthropic 已经与"多个合作伙伴"进行了讨论,以期加快语音交互功能的推出。
好文章,需要你的鼓励
香港大学联合多家顶尖机构开发出推测性雅可比降噪解码技术,巧妙融合扩散模型降噪与自回归并行处理,将AI图像生成速度提升2-5倍。该方法通过训练模型处理噪声输入并预测干净标记,实现多位置同时生成,在保持图像质量的同时大幅缩短等待时间,为AI创作应用带来革命性改善。
谷歌推出类似苹果私有云计算的新平台,让用户在享受先进AI功能的同时保护数据隐私。该平台将复杂AI请求转移到云端处理,确保敏感数据仅用户可见,连谷歌也无法访问。随着AI工具需要更强计算能力,这一方案平衡了隐私保护与性能需求。Pixel 10手机将获得更智能的Magic Cue建议和更多语言的录音转录功能。
韩国大学等机构研究团队提出TAG方法,解决AI绘画中的"幻觉"问题。该方法通过放大扩散过程中的切线分量来引导AI生成更真实图像,无需重训练模型且计算成本极低。实验显示TAG能显著改善图像质量,减少不合理细节如多指手等,同时可与现有引导技术结合使用,为AI绘画领域提供了简单有效的优化方案。