Gemini应用程序终于扩展至音频文件支持

谷歌Gemini应用迎来重要更新，新增音频文件处理功能。用户现在可以直接在应用中上传和处理各类音频文件，这一功能扩展大大提升了Gemini的多媒体处理能力，为用户提供更加全面的AI助手体验。

谷歌的Gemini应用程序迎来了一项重要更新，终于开始支持音频文件处理功能。这一扩展标志着该AI助手在多媒体内容处理能力上的重要进步。

用户现在可以直接在Gemini应用中上传和处理各种音频文件格式，包括语音记录、音乐片段和其他音频内容。这项新功能使得用户能够更便捷地与AI进行交互，无需再依赖纯文本输入。

此次更新大大拓展了Gemini的应用场景。用户可以上传会议录音让AI进行总结，分析音乐文件获取相关信息，或者通过语音输入更自然地与AI对话。这种多模态的交互方式显著提升了用户体验。

谷歌表示，这项功能的推出是其不断改进AI助手能力的一部分。音频处理功能的加入使Gemini能够更好地理解和响应用户的多样化需求，为用户提供更加智能和全面的服务。

该功能目前正在逐步向全球用户推出，预计将在未来几周内覆盖所有支持地区。用户可以通过更新应用程序来体验这一新功能。

Q&A

Q1：Gemini应用程序新增了什么功能？

A：Gemini应用程序新增了音频文件处理功能，用户现在可以直接在应用中上传和处理各种音频文件格式，包括语音记录、音乐片段和其他音频内容。

Q2：音频功能支持有什么实际用途？

A：用户可以上传会议录音让AI进行总结，分析音乐文件获取相关信息，或者通过语音输入更自然地与AI对话，大大拓展了应用场景。

Q3：这个音频功能什么时候能用？

A：该功能目前正在逐步向全球用户推出，预计将在未来几周内覆盖所有支持地区，用户可以通过更新应用程序来体验。

来源：The Verge

0赞

好文章，需要你的鼓励

苹果注重隐私的年龄验证方案可解决两大难题

美国多州和部分国家要求特定应用进行年龄验证，澳大利亚已禁止16岁以下用户使用社交媒体。新提案《应用商店问责法案》建议由苹果和谷歌负责统一验证用户年龄，而非各开发者单独验证。这将提升用户体验，用户只需向苹果或谷歌验证一次身份。凭借苹果在隐私保护方面的优势，该方案可扩展至Safari浏览器，为需要年龄验证的网站提供确认信息，而无需透露用户个人数据。

训练AI画画，一半数据就够了？港大团队发明“炼金术师“让AI挑食变聪明

香港大学团队开发的"炼金术师"数据筛选系统，能从海量图片中精选一半高价值数据，训练出比使用全量数据更优秀的AI图像生成模型。该方法通过观察模型学习反应判断数据价值，发现适度复杂的图片比简单图片更有训练效果，实现了5倍训练加速和显著性能提升。

AI编程助手Cursor背后的公司Anysphere宣布收购AI代码审查工具初创公司Graphite。据报道收购价远超Graphite今年早些时候B轮融资时2.9亿美元的估值。此次收购具有战略意义，将AI代码生成与AI代码审查工具相结合，可大幅提升从编写到交付的整体效率。Anysphere估值已达290亿美元，近期频繁收购，上月收购技术招聘公司，今年7月还收购AI客户关系管理初创公司Koala的团队。

强化学习

人工智能

新型算法

2025-12-22

AI语言模型训练的“激励难题“：哥伦比亚大学揭示强化学习的探索与利用悖论

哥伦比亚大学等机构研究团队发现，在AI模型的强化学习训练中存在一个悖论现象：阻碍探索和阻碍利用竟然都能提升性能。研究揭示了裁剪技术实际是熵调节器而非学习信号，策略熵与性能无直接因果关系，并提出奖励错配理论解释随机奖励的积极效果，为AI训练方法设计提供了新的理论基础。

Gemini应用程序终于扩展至音频文件支持

来源：The Verge

2025

09/10

14:07

分享

点赞

Cursor通过收购Graphite继续扩张之路

ChatGPT新增个性化设置功能，用户可自定义聊天体验

Kuxiu S3固态电池充电宝替代多款充电器的全能解决方案

Waymo自动驾驶出租车遭遇交通灯故障停摆事件分析

智启未来，共筑开发者生态 AMD携手DataWhale、魔搭社区，共建ROCm开发者生态

千问C端事业群成立后首推平价AI眼镜：低至1999元，搭载千问AI助手

Aqara Hub M200为HomeKit带来Matter支持和新自动化选项

LG智能电视强制安装Copilot快捷方式引发用户不满

Palo Alto Networks与谷歌云签署数十亿美元AI合作协议

OpenAI 获百亿美元融资与AI投资热潮持续升温

Meta计划2026年发布新一代图像视频AI模型

数字孪生联盟推出四个全新测试平台

Firefox推出iPhone"摇动即可总结"功能

苹果发布iPhone 17系列、Watch 11和新款AirPods Pro 3

法国AI独角兽Mistral获ASML领投20亿美元融资

Claude新文件创建功能存在深层安全风险

苹果iPhone 17发布会最"令人惊叹"的部分？AI几乎没被提及

Empromptu推出98%精准度AI应用构建平台

Together AI推出自助式GPU基础设施服务

Monte Carlo推出AI智能体全栈可观测性工具

菁彩Vivid助力电影行业高质量发展，四方战略合作签约仪式在京举行

Databricks完成10亿美元K轮融资，估值突破1000亿美元

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: