现如今,手机地图几乎已经成了每一个人的“出行必备”。无论是自驾、搭公共交通还是骑车、步行,即使是对于路痴来说,有了手机地图,就可以得瑟地高呼“地图在手,天下我有”。
细数当下众多的手机地图APP,百度地图可以说是将AI技术与地图结合的最紧密的一款。比如通过语音交互系统,百度地图已经能够让用户在行程中轻松实现“动口不动手”;再比如通过AR步行导航,百度地图还让圆明园大水法等景点实现了原址再现,给了用户更加身临其境的感受。除此之外,在数据生产方面,百度地图中80%的数据采集环节都实现了AI化,而凭此构建的3000万POI空间图谱、700万的用户兴趣图谱等丰富的数据,也将进一步为用户提供更加贴心的位置信息服务。
在这基础上,上周,百度地图又推出了一个“惊艳”功能——地图语音包定制。这是全球首个地图语音定制产品,和传统复杂的语音包制作不同,借此,用户只需要在APP上录制20句话,用20分钟左右就可以生成一个专属的完整语音包。
百度地图事业部总经理李莹在发布会上表示,过去,要制作一个大库的通用语音包,录制的语音量是上万句,制作周期仅半年。而要制作一个定制的语音包,还需要在大库基础上录制1000-2000句语音,在专业录音棚里录制约两周时间,最终输出成型的语音包需要两个月左右。
百度地图事业部总经理李莹
相比较而言,百度地图的这一语音定制流程就显得简单的不能再简单了:用户只需要打开百度地图唤醒“小度小度”,说出“录制我的语音”的指令,或者点击首页的“出行助手”后进入“语音定制”,就可以根据提示进行语音定制。在安静的环境中,只要跟着百度地图的指引,念出卡通和影视台词等充满趣味性的录制文本,等待20分钟左右,就能拥有一个自己专属的语音包,并在百度地图的景区智能语音导览、智能语音交互、导航等全部场景使用。此外,录制的个人语音包还可以分享给亲朋好友使用。
“在发布实验版本时,我就第一时间让我女儿录制了一个语音包,声音还原度真的很高。现在我已经把它设置为默认语音包,有时候我会故意调戏小度‘小度小度,你爱我吗?’,这时,小度就会用我女儿的声音回答‘天灵灵,地灵灵,爱你到天明’,这样的感觉真的很暖。”
事实上,儿童音录制是十分困难的,常常会出现发音不清晰、断句不准确,甚至是普通话不标准的情况,而百度地图语音定制功能却克服了这类问题,实现了儿童音的完美合成。
在这些优秀表现的背后,是百度大脑语音技术的赋能,它不仅让地图语音包制作实现了从数月缩短到数十分钟,同时还重新定义了语音包的生产模式。百度语音首席架构师贾磊在发布会上介绍:“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低,相信百度语音技术在AI时代拥有无限可能”。
百度语音首席架构师贾磊
值得一提的是,对于最近颇受关注的数据安全问题,百度地图也明确声明,对于语音定制服务的权限获取百度地图将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。
李莹介绍,百度地图工程师把语音定制功能称为“百雀灵”,希望用这一自然界中具有千万美妙声音的生物,寓意百度地图将让成百上万的用户,都能够发挥自己的特色,录制自己、或者爱人、亲人的语音包,让爱陪伴左右。“语音定制功能是AI赋能百度地图的又一力作,我们希望这一次语音技术与百度地图的融合,能够释放科技力量,让每个人都感受到科技进步带来的改变和情怀。”
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。