Microsoft 新推出的 Phi-4 AI 模型：小巧身材蕴含强大性能

微软推出了新一代高效 AI 模型 Phi-4，可同时处理文本、图像和语音，且计算资源需求大幅降低。其中 Phi-4-Multimodal 仅有 56 亿参数，Phi-4-Mini 仅有 38 亿参数，性能却超越同等规模竞品，甚至在某些任务上媲美两倍大小的模型。这一突破性进展为开发者提供了先进的 AI 能力，有望推动边缘计算和普及 AI 应用。

Microsoft 推出了一类新型高效 AI 模型，可以同时处理文本、图像和语音，同时所需的计算资源显著低于现有系统。今天发布的新 Phi-4 模型在小型语言模型 (SLMs) 的开发领域取得了突破性进展，实现了以往只有更大型 AI 系统才具备的能力。

根据 Microsoft 的技术报告，仅有 56 亿参数的 Phi-4-Multimodal 模型和拥有 38 亿参数的 Phi-4-Mini 模型不仅超越了同等规模的竞争对手，在某些任务上甚至可以匹敌或超越两倍于其规模的模型。

Microsoft 生成式 AI 副总裁 Weizhu Chen 表示："这些模型旨在为开发者提供先进的 AI 能力。Phi-4-multimodal 能够同时处理语音、视觉和文本，为创建创新的、具有环境感知能力的应用开辟了新的可能性。"

这一技术突破恰逢其时，因为企业越来越倾向于寻找能在标准硬件或"边缘设备"上运行的 AI 模型，而不是依赖云数据中心，以降低成本和延迟，同时保护数据隐私。

Microsoft 如何打造全能小型 AI 模型

Phi-4-Multimodal 的独特之处在于其创新的"mixture of LoRAs"技术，使其能在单一模型中处理文本、图像和语音输入。

研究论文指出："通过利用 Mixture of LoRAs，Phi-4-Multimodal 扩展了多模态能力，同时最小化了模态之间的干扰。这种方法实现了无缝集成，确保在涉及文本、图像和语音/音频的任务中保持一致的性能。"

这一创新使得模型在添加视觉和语音识别功能的同时保持其强大的语言处理能力，避免了模型适应多种输入类型时常见的性能下降问题。

该模型在 Hugging Face OpenASR 排行榜上以 6.14% 的词错误率位居榜首，超越了 WhisperV3 等专业语音识别系统。它在图像数学和科学推理等视觉任务上也展现出了极具竞争力的表现。

小巧精悍的 AI：Phi-4-mini 树立新的性能标准

尽管体积小巧，Phi-4-Mini 在文本任务上展现出了卓越的能力。Microsoft 报告称，该模型"在各种语言理解基准测试中超越了同等规模的模型，并与两倍大小的模型相当"。

该模型在数学和编程任务上的表现尤为突出。根据研究论文，"Phi-4-Mini 由 32 个 Transformer 层组成，隐藏状态大小为 3,072"，并采用组查询注意力机制来优化长文本生成的内存使用。

在 GSM-8K 数学基准测试中，Phi-4-Mini 达到了 88.6% 的得分，超过了大多数 80 亿参数的模型，而在 MATH 基准测试中达到了 64%，远高于同等规模的竞争对手。

技术报告指出："在数学基准测试中，该模型以巨大优势超越了同等规模的模型，有时差距超过 20 分。它甚至超过了两倍大小模型的分数。"

变革性部署：Phi-4 在实际应用中的高效表现

AI 问答引擎 Capacity 已经利用 Phi 系列模型提升了其平台的效率和准确性。

Capacity 产品负责人 Steve Frederickson 在声明中表示："从初步实验来看，Phi 令我们印象深刻的是其出色的准确性和易于部署的特性，这甚至是在定制化之前就表现出来的。自那以后，我们能够在保持成本效益和可扩展性的同时，进一步提高了准确性和可靠性。"

Capacity 报告称，在预处理任务中，与竞争对手的工作流程相比，他们实现了 4.2 倍的成本节约，同时保持了相同或更好的质量结果。

无限可能的 AI：Microsoft 的 Phi-4 模型让先进智能无处不在

多年来，AI 发展一直遵循着"更大就是更好"的理念：更多的参数、更大的模型、更高的计算需求。但 Microsoft 的 Phi-4 模型挑战了这一假设，证明力量不仅在于规模，更在于效率。

Phi-4-Multimodal 和 Phi-4-Mini 的设计不是为了科技巨头的数据中心，而是为了现实世界——在这里，计算能力有限，隐私问题至关重要，AI 需要在没有持续云连接的情况下顺畅运行。这些模型虽小，但影响力巨大。Phi-4-Multimodal 将语音、视觉和文本处理集成到单一系统中，而不损失准确性，而 Phi-4-Mini 在数学、编程和推理方面的性能可与两倍于其规模的模型相媲美。

这不仅仅是让 AI 更高效，更是让它更易获取。Microsoft 通过 Azure AI Foundry、Hugging Face 和 Nvidia API Catalog 提供 Phi-4，使其可以广泛应用。目标很明确：打造不受昂贵硬件或庞大基础设施限制的 AI，让它能在标准设备上运行，在网络边缘运行，在计算资源稀缺的行业中运行。

日本 AI 公司 Headwaters Co., Ltd. 的董事 Masaya Nishimaki 亲身体验到了这一影响。他在声明中说："边缘 AI 在网络连接不稳定或对保密性要求极高的环境中都表现出色。"这意味着 AI 可以在工厂、医院、自动驾驶车辆等需要实时智能但传统云端模型难以胜任的场所发挥作用。

从本质上说，Phi-4 代表了思维方式的转变。AI 不再是那些拥有最大服务器和最深口袋的人的专属工具。如果设计得当，它可以在任何地方为任何人服务。Phi-4 最具革命性的不是它能做什么，而是它能在哪里做。

来源：VentureBeat

0赞

好文章，需要你的鼓励

Microsoft 新推出的 Phi-4 AI 模型：小巧身材蕴含强大性能

来源：VentureBeat

2025

02/27

16:18

分享

点赞

数智惠闽企，展车进福州｜华为坤灵中国行2025·福建站成功举办，推动闽企智能化发展新征程

AI时代的影像实验：记录你眼中的“变化”

大象转身，亦或重塑大象：Unity团结引擎的“中国本土”进化

无万卡，不VLA：元戎启行与阿里云的“想法”和“解法”

AI爬虫让“价格战”变成“算法战”，利润正在被看不见的流量吞噬 AI 爬虫程序流量在短短一年内暴增 300%

做好可持续数字化转型的“必答题”

SUSE Linux Enterprise Server (SLES) 16全新发布：AI赋能，智领企业管理

SAP商业AI获乌镇峰会精品案例奖，助推中国企业实现确定性增长

专访｜Cloudera致力于打造AI时代的企业级“数据操作系统”

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

SAP TechEd柏林观察：企业AI如何发挥飞轮效应?

CIO策略观察——软件测试：从传统困局到 AI 无人测试转型

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: