Yelp 本周二表示,正在部署由 AI 驱动的 “语音助手” 来帮助服务提供商和餐厅处理电话、解答基本问题,并完成诸如将客户加入餐厅等候名单等任务。
Yelp 指出,其语音助手无需复杂的设置或 API 集成,可以利用现有元数据以及商户提供的数据(例如发音指南、定制语音问候和电话转接规则)。举例来说,对于餐厅,Yelp 的语音助手可以连接至餐厅的管理软件,在通话结束后向顾客发送预订详情。
此外,Yelp 的语音助手还能处理自动垃圾电话过滤和通话数据分析等任务。对于较为复杂的请求,语音助手会将通话交由人工处理,并在通话结束后向企业提供通话摘要、文字记录和录音。
Yelp 首席产品官 Craig Saldanha 在接受 TechCrunch 采访时表示,“通常情况下,专业人士在恶劣的工作环境下可能无法接听电话,我们希望开发一款能帮助转化那些通常可能错失的潜在客户的产品。”
Yelp 正在使用 OpenAI 的 Realtime API 来实现端到端通话管理。这使得 Yelp 的语音助手在公司知识图谱的辅助下,能够提出并回答后续问题。
Yelp 表示,为了在延迟、语音识别准确性以及整体客户体验方面达到最佳效果,公司正在不断评估并采用新模型。
Saldanha 认为,随着时间的推移,语音技术将逐步普及,而差异化的关键将是底层数据以及 AI 如何处理客户查询的方式。他补充道,在这些方面,Yelp 相较于竞争对手具备一定优势。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。