微软发布三款AI模型，与OpenAI展开直接竞争

微软发布三款自研机器学习模型的公开预览版，包括语音识别模型MAI-Transcribe-1、语音合成模型MAI-Voice-1和文本生成图像模型MAI-Image-2。这些模型已在Copilot、Bing等产品中应用，现通过Azure AI Foundry平台向开发者开放。此举使微软从OpenAI投资者转变为直接竞争对手，为企业客服、会议字幕、媒体存档等场景提供解决方案。

微软在周四发布了三款自主研发的机器学习模型的公开预览版本，分别专注于语音识别、语音合成和图像生成功能。

这一举措让这家Windows公司看起来更像是OpenAI的直接竞争对手，而非投资者。截至去年10月，微软持有的OpenAI股份价值约为1350亿美元。

这三款模型包括：MAI-Transcribe-1语音识别模型，能够在25种语言中提供企业级准确度，GPU成本比主要竞争对手低约50%；MAI-Voice-1语音生成模型，据称能在单个GPU上不到一秒钟内生成60秒的音频；以及MAI-Image-2文本转图像模型，这可能会加剧数字艺术家的担忧。

值得注意的是，OpenAI恰好也提供自己的语音识别、语音生成和文本转图像模型。

微软的这些模型通过Foundry平台提供，该平台原名Azure AI Studio，是一个用于开发智能体和应用程序的平台。

微软Azure AI Foundry Models产品团队负责人Naomi Moneypenny在博客文章中介绍了这些模型。

"这些模型已经在为我们自己的产品提供支持，如Copilot、Bing、PowerPoint和Azure Speech，现在它们专门在Foundry上提供给开发者使用，"她写道。

这些模型非常适合常见的企业使用场景，比如设计能够识别语音并生成回应的客户支持智能体。Moneypenny建议，这些模型还可用于为大型活动和会议提供字幕，用于媒体字幕制作和存档，用于教育培训，以及从焦点小组收集客户和市场洞察等。

微软已经在内部使用这些模型——Copilot的Audio Expressions功能运行在MAI-Voice-1上，而Copilot的语音模式转录服务使用MAI-Transcribe-1。

开发者可以通过Azure Speech试用这两个模型。

当微软宣布已重新协商与OpenAI的协议时，这家Windows公司表示合作关系将至少持续到2032年，前提是AI市场不会崩溃。但它也强调了竞争领域。"微软现在可以独立或与第三方合作追求人工通用智能，"公司当时表示。仅这一声明就让微软能够在人工通用智能研究的名义下在AI领域独立发展。

微软有一些理由需要对冲风险。今年1月，微软的OpenAI关系显示出紧张迹象，当时微软投资者对公司承受OpenAI大量支出的风险表示不满。根据The Information发布的内部预测，这家AI热潮领导者正在烧钱，预计今年将亏损140亿美元。据报道，一项专注于企业客户的内部精简工作正在进行，上个月底还关闭了耗费大量Token但并不特别有用的视频生成器Sora 2。

两周前，微软首席执行官萨蒂亚·纳德拉宣布了影响公司Copilot产品和超级智能工作的领导层变动。Jacob Andreou被任命领导公司的Copilot体验，担任执行副总裁，负责微软消费者和商业产品，直接向纳德拉汇报。Copilot现在专注于四个领域：Copilot体验、Copilot平台、Microsoft 365应用和AI模型。

据推测，Andreou的AI模型职责不仅仅是与OpenAI联络了解可用模型。如果微软的模型野心还不够明显的话，纳德拉表示Mustafa Suleyman将继续领导微软的AI研究——如果你的野心是继续依赖OpenAI，这完全没有必要。

Q&A

Q1：微软发布的三款AI模型分别有什么功能？

A：微软发布了三款AI模型：MAI-Transcribe-1是语音识别模型，支持25种语言，GPU成本比竞争对手低50%；MAI-Voice-1是语音生成模型，能在单个GPU上不到一秒生成60秒音频；MAI-Image-2是文本转图像模型，可以根据文本描述生成图像。

Q2：这些AI模型可以用在哪些场景？

A：这些模型适合多种企业场景，包括设计客户支持智能体进行语音识别和回应生成、为大型活动和会议提供字幕服务、媒体字幕制作和存档、教育培训，以及从焦点小组收集客户和市场洞察等。微软自己的Copilot产品已在使用这些模型。

Q3：微软为什么要自研AI模型与OpenAI竞争？

A：微软需要对冲风险，因为投资者对公司承受OpenAI大量支出风险表示不满。OpenAI预计今年亏损140亿美元，且微软在重新协商协议时明确表示可以独立或与第三方合作追求人工通用智能，这为微软独立发展AI技术提供了空间。

来源：The Register

0赞

好文章，需要你的鼓励

微软发布三款AI模型，与OpenAI展开直接竞争

来源：The Register

2026

04/03

11:11

分享

点赞

Glean年收入突破3亿美元，削减AI成本成核心卖点

蓝色起源"新格伦"火箭在佛罗里达测试中发生爆炸

智能体AI正在重塑企业架构与Token经济学

堪培拉理工学院如何借助技术革新重塑课堂教学体验

Gemma 4携手Arm：优化端侧AI，加速移动应用体验

制药公司与初创企业如何携手推动AI落地

《星球大战》导演盛赞生成式AI：电影制作的革命性工具

Salesforce借助Informatica布局企业级无头数据管理架构

几乎所有M5 MacBook Air配置现在都降价近200美元

企业用好Agent，关键不在“买一个智能体”｜原点Talk 分享会

大模型评测风向变了，Testin云测如何构建企业级AI质量标尺？

因民事养老金管理失误，英国政府拒绝向Capita授予5.63亿英镑合同

Google发布Gemma 4对抗中国开源模型

微软扩展Copilot功能引发企业AI安全新挑战

AI自动控制Stream Deck按钮功能上线

心理健康AI检测工具获FDA批准困难重重

OpenAI收购TBPN科技脱口秀节目 布局AI传播战略

OpenAI收购热门科技脱口秀TBPN，首次涉足媒体领域

监管缺失威胁企业AI试点项目，支出面临严格审查

Google Gemini推出记忆导入功能，可无缝迁移ChatGPT数据

Kyndryl推出智能体自动化和安全管控服务包

谷歌TurboQuant技术将AI内存需求降低6倍

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

OpenAI收购TBPN科技脱口秀节目布局AI传播战略