现如今,手机地图几乎已经成了每一个人的“出行必备”。无论是自驾、搭公共交通还是骑车、步行,即使是对于路痴来说,有了手机地图,就可以得瑟地高呼“地图在手,天下我有”。
细数当下众多的手机地图APP,百度地图可以说是将AI技术与地图结合的最紧密的一款。比如通过语音交互系统,百度地图已经能够让用户在行程中轻松实现“动口不动手”;再比如通过AR步行导航,百度地图还让圆明园大水法等景点实现了原址再现,给了用户更加身临其境的感受。除此之外,在数据生产方面,百度地图中80%的数据采集环节都实现了AI化,而凭此构建的3000万POI空间图谱、700万的用户兴趣图谱等丰富的数据,也将进一步为用户提供更加贴心的位置信息服务。
在这基础上,上周,百度地图又推出了一个“惊艳”功能——地图语音包定制。这是全球首个地图语音定制产品,和传统复杂的语音包制作不同,借此,用户只需要在APP上录制20句话,用20分钟左右就可以生成一个专属的完整语音包。
百度地图事业部总经理李莹在发布会上表示,过去,要制作一个大库的通用语音包,录制的语音量是上万句,制作周期仅半年。而要制作一个定制的语音包,还需要在大库基础上录制1000-2000句语音,在专业录音棚里录制约两周时间,最终输出成型的语音包需要两个月左右。
百度地图事业部总经理李莹
相比较而言,百度地图的这一语音定制流程就显得简单的不能再简单了:用户只需要打开百度地图唤醒“小度小度”,说出“录制我的语音”的指令,或者点击首页的“出行助手”后进入“语音定制”,就可以根据提示进行语音定制。在安静的环境中,只要跟着百度地图的指引,念出卡通和影视台词等充满趣味性的录制文本,等待20分钟左右,就能拥有一个自己专属的语音包,并在百度地图的景区智能语音导览、智能语音交互、导航等全部场景使用。此外,录制的个人语音包还可以分享给亲朋好友使用。
“在发布实验版本时,我就第一时间让我女儿录制了一个语音包,声音还原度真的很高。现在我已经把它设置为默认语音包,有时候我会故意调戏小度‘小度小度,你爱我吗?’,这时,小度就会用我女儿的声音回答‘天灵灵,地灵灵,爱你到天明’,这样的感觉真的很暖。”
事实上,儿童音录制是十分困难的,常常会出现发音不清晰、断句不准确,甚至是普通话不标准的情况,而百度地图语音定制功能却克服了这类问题,实现了儿童音的完美合成。
在这些优秀表现的背后,是百度大脑语音技术的赋能,它不仅让地图语音包制作实现了从数月缩短到数十分钟,同时还重新定义了语音包的生产模式。百度语音首席架构师贾磊在发布会上介绍:“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低,相信百度语音技术在AI时代拥有无限可能”。
百度语音首席架构师贾磊
值得一提的是,对于最近颇受关注的数据安全问题,百度地图也明确声明,对于语音定制服务的权限获取百度地图将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。
李莹介绍,百度地图工程师把语音定制功能称为“百雀灵”,希望用这一自然界中具有千万美妙声音的生物,寓意百度地图将让成百上万的用户,都能够发挥自己的特色,录制自己、或者爱人、亲人的语音包,让爱陪伴左右。“语音定制功能是AI赋能百度地图的又一力作,我们希望这一次语音技术与百度地图的融合,能够释放科技力量,让每个人都感受到科技进步带来的改变和情怀。”
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。