成本大降, OpenAI小型模型GPT-4o mini
GPT-4o mini输入价格为15美分/百万Tokens,输出价格为60美分/百万Tokens。而曾被视为OpenAI内部最轻量级且高性价比的GPT-3.5 Turbo,其输入价格为50美分/百万Tokens,输出价格为150美分/百万Tokens。
7月19日消息, OpenAI宣布推出GPT-4o mini模型,并称其为最智能、最实惠的模型,其性能和价格均已赶超GPT-3.5 Turbo。
作为直观对比,GPT-4o mini输入价格为15美分/百万Tokens,输出价格为60美分/百万Tokens。而曾被视为OpenAI内部最轻量级且高性价比的GPT-3.5 Turbo,其输入价格为50美分/百万Tokens,输出价格为150美分/百万Tokens。
最新的“GPT-4o mini”比GPT-4o便宜了96%~97%,比起GPT-3.5 Turbo也要便宜60%~70%。正因如此,随着GPT-4o mini上架,GPT-3.5 Turbo的历史使命到此结束。OpenAI还表示,GPT-4o mini是首个使用其全新安全策略“指令层级”的AI模型。
此前,一些没有足够资金的开发者可能对GPT高昂的价格望而却步,转而选择更便宜的模型,例如谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku来构建应用程序。而现在,OpenAI 也正式进入了轻量级模型的市场。
性能方面,目前GPT-4o Mini支持文本和视觉输入,未来将扩展至音视频。它拥有128K上下文窗口,每次请求最多可输出16K标记,知识库更新至2023年10月。而且由于与GPT-4o共享改进的分词器,使其处理非英语文本的成本效益更高。
根据OpenAI官方介绍,GPT-4o mini在学术测试中表现优异,超越了GPT-3.5 Turbo等小型模型。它在文本智能、多模态推理和语言支持方面水平与GPT-4o相当。在函数调用方面表现突出,有助于开发者创建能与外部系统交互的应用。此外还显著提升了长上下文处理能力,优于GPT-3.5 Turbo。
GPT-4o mini的高性能来源于GPT-4o,这是OpenAI目前最快、最强大的旗舰大模型。OpenAI在5月的一次直播活动中发布了GPT-4o,“o”代表omni(全能的),寓意了该模型对多模态的注重。彼时,团队表示GPT-4o对音频、视频和文本等多模态理解与生成功能进行了改进,能够以更高的速度和质量处理50种不同的语言。
目前,GPT-4o mini API接口已开放,支持文本和视觉,未来还将融入文本、图像、视频和音频的输入和输出。它将于当地时间周四向ChatGPT的免费用户、ChatGPT Plus和团队订阅者开放,ChatGPT企业用户将于下周开放。
0赞好文章,需要你的鼓励
推荐文章
AI正在彻底改变营销行业。IDC预测到2028年,五分之三的营销功能将由AI处理。传统搜索引擎优化正被"生成式引擎优化"取代,品牌需要在AI回答中被提及而非仅仅排名靠前。AI代理将实现自主商务交易,营销、销售和客服边界正在消失。78%的营销人员预计三年内四分之一的工作将被自动化。品牌实力和第一方数据成为关键资产,企业必须重新构想AI中介世界中的客户关系。
布朗大学研究团队开发AssertBench测试工具,首次系统评估AI在面对用户错误引导时的坚持能力。通过对比AI在正面、负面用户框架下的反应差异,研究发现多数模型存在"讨好倾向",容易为迎合用户而放弃正确判断。研究还发现知识不足的AI反而更固执的悖论现象,为AI训练和应用提供重要启示。
HPE在2025年Discover大会上发布GreenLake Intelligence代理式AI框架,将AI代理集成到网络、存储管理等各个系统中。虽然被称为"自主式",但仍需人工监督决策。HPE高管表示,在明确定义的单一领域内AI代理已实现自主运行,但企业全面自主化仍需时间。此外,HPE还发布支持英伟达Blackwell GPU的新硬件系统,扩大AI工厂联盟合作。
UC圣地亚哥和西蒙弗雷泽大学联合开发了GMT系统,这是首个能让机器人掌握多种人类动作的通用控制器。通过自适应采样和专家混合架构,单一系统可同时处理走路、跳舞、武术等复杂技能,在真实机器人上展现出卓越的稳定性和流畅性,为通用人形机器人的实现迈出关键一步。