就在推出最新大语言模型一个月之后,OpenAI 已宣布在 ChatGPT 中提供 GPT-4.1 选项。
该公司在 X 上发布消息称,应广大用户要求,于今日将 GPT-4.1 引入 ChatGPT。该模型将面向 ChatGPT Plus、Pro 以及 Team 用户开放,可通过模型选择器中“more models”下拉菜单进行访问。公司表示,Enterprise 和 Edu 用户也将在未来几周内能够使用这一新模型。
此外,OpenAI 表示,GPT-4.1 mini 将取代 ChatGPT 中原有的 GPT-4o mini 模型。在这种情况下,该模型将向所有用户开放,包括免费用户。
公司还介绍,对于所有免费用户,GPT-4o 仍将作为默认模型。GPT-4o 是 OpenAI 原先定位为推理模型,设计上更为谨慎地分析回答,并提供解释其思考过程的功能,使用户能够了解其结论的形成依据。
OpenAI 指出,免费用户仍将有每日使用额度,但一旦达到 GPT-4o 的最大查询次数,系统将不再切换回 GPT-4o mini(如以往那样),而改为切换至 GPT-4.1 mini。
应广大用户要求,GPT-4.1 从今天起将在 ChatGPT 中直接上线。
GPT-4.1 是一款专注于编码任务及指令跟随的专用模型。由于其运算速度更快,因此对于日常编码需求来说,是 OpenAI o3 和 o4-mini 的理想替代选择。
— OpenAI (@OpenAI) 2025 年 5 月 14 日
OpenAI 在四月发布了 GPT-4.1,同时推出了两个较小的模型——GPT-4.1 mini 和 GPT-4.1 nano,这两款模型在性能和响应质量上进行了折中,以实现更低的价格。公司当时表示,GPT-4.1 在编码任务上“显著优于”其前代产品,并针对程序员的需求进行了多项改进。例如,该模型在生成用户界面方面表现更佳,并且不易产生冗余代码,这意味着开发者在筛选输出结果时将节省更多时间。
GPT-4.1、GPT-4.1 mini 与 GPT-4.1 nano 均支持提示中最多一百万个 Token,这使得它们能够分析极大规模的文件上传,例如整个 GitHub 代码仓库。
早期使用 GPT-4.1 的用户表示,该模型比前代产品明显不那么“话多”,对大多数查询提供了更为直接的回答。然而,普遍共识认为,其实际性能仅略好于 GPT-4o。那些期待更大幅度性能提升的用户,可能需要等待 OpenAI 下一次重大升级——GPT-5,不过目前尚无其发布日期的消息。
OpenAI 在 GPT-4.1 的发布说明中指出,这一更新代表了 AI 实际应用领域的一大步。
公司表示:“通过密切关注真实世界中开发者的需求——涵盖编码、指令跟随以及长上下文理解——这些模型为构建智能系统和复杂代理应用开辟了全新可能。”
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
时尚零售巨头维多利亚的秘密因安全事件导致网站和线上订单服务中断,已立即启动应急响应、邀请第三方专家协助恢复运营,实体店仍正常营业。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。