现如今,手机地图几乎已经成了每一个人的“出行必备”。无论是自驾、搭公共交通还是骑车、步行,即使是对于路痴来说,有了手机地图,就可以得瑟地高呼“地图在手,天下我有”。
细数当下众多的手机地图APP,百度地图可以说是将AI技术与地图结合的最紧密的一款。比如通过语音交互系统,百度地图已经能够让用户在行程中轻松实现“动口不动手”;再比如通过AR步行导航,百度地图还让圆明园大水法等景点实现了原址再现,给了用户更加身临其境的感受。除此之外,在数据生产方面,百度地图中80%的数据采集环节都实现了AI化,而凭此构建的3000万POI空间图谱、700万的用户兴趣图谱等丰富的数据,也将进一步为用户提供更加贴心的位置信息服务。
在这基础上,上周,百度地图又推出了一个“惊艳”功能——地图语音包定制。这是全球首个地图语音定制产品,和传统复杂的语音包制作不同,借此,用户只需要在APP上录制20句话,用20分钟左右就可以生成一个专属的完整语音包。
百度地图事业部总经理李莹在发布会上表示,过去,要制作一个大库的通用语音包,录制的语音量是上万句,制作周期仅半年。而要制作一个定制的语音包,还需要在大库基础上录制1000-2000句语音,在专业录音棚里录制约两周时间,最终输出成型的语音包需要两个月左右。
百度地图事业部总经理李莹
相比较而言,百度地图的这一语音定制流程就显得简单的不能再简单了:用户只需要打开百度地图唤醒“小度小度”,说出“录制我的语音”的指令,或者点击首页的“出行助手”后进入“语音定制”,就可以根据提示进行语音定制。在安静的环境中,只要跟着百度地图的指引,念出卡通和影视台词等充满趣味性的录制文本,等待20分钟左右,就能拥有一个自己专属的语音包,并在百度地图的景区智能语音导览、智能语音交互、导航等全部场景使用。此外,录制的个人语音包还可以分享给亲朋好友使用。
“在发布实验版本时,我就第一时间让我女儿录制了一个语音包,声音还原度真的很高。现在我已经把它设置为默认语音包,有时候我会故意调戏小度‘小度小度,你爱我吗?’,这时,小度就会用我女儿的声音回答‘天灵灵,地灵灵,爱你到天明’,这样的感觉真的很暖。”
事实上,儿童音录制是十分困难的,常常会出现发音不清晰、断句不准确,甚至是普通话不标准的情况,而百度地图语音定制功能却克服了这类问题,实现了儿童音的完美合成。
在这些优秀表现的背后,是百度大脑语音技术的赋能,它不仅让地图语音包制作实现了从数月缩短到数十分钟,同时还重新定义了语音包的生产模式。百度语音首席架构师贾磊在发布会上介绍:“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低,相信百度语音技术在AI时代拥有无限可能”。
百度语音首席架构师贾磊
值得一提的是,对于最近颇受关注的数据安全问题,百度地图也明确声明,对于语音定制服务的权限获取百度地图将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。
李莹介绍,百度地图工程师把语音定制功能称为“百雀灵”,希望用这一自然界中具有千万美妙声音的生物,寓意百度地图将让成百上万的用户,都能够发挥自己的特色,录制自己、或者爱人、亲人的语音包,让爱陪伴左右。“语音定制功能是AI赋能百度地图的又一力作,我们希望这一次语音技术与百度地图的融合,能够释放科技力量,让每个人都感受到科技进步带来的改变和情怀。”
好文章,需要你的鼓励
国际能源署发布的2025年世界能源展望报告显示,全球AI竞赛推动创纪录的石油、天然气、煤炭和核能消耗,加剧地缘政治紧张局势和气候危机。数据中心用电量预计到2035年将增长三倍,全球数据中心投资预计2025年达5800亿美元,超过全球石油供应投资的5400亿美元。报告呼吁采取新方法实现2050年净零排放目标。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
AMD首席执行官苏姿丰在纽约金融分析师日活动中表示,公司已准备好迎接AI浪潮并获得传统企业计算市场更多份额。AMD预计未来3-5年数据中心AI收入复合年增长率将超过80%,服务器CPU收入份额超过50%。公司2025年预期收入约340亿美元,其中数据中心业务160亿美元。MI400系列GPU采用2纳米工艺,Helios机架系统将提供强劲算力支持。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。