搞了半天原来GPT-4o-mini是基于GPT-3.5架构的模型（Dify中接入GPT-4o mini模型）

GPT-4o mini（"o"代表"omni"）是小型型号类别中最先进的型号，也是OpenAI迄今为止最便宜的型号。它是多模态的（接受文本或图像输入并输出文本），具有比 gpt-3.5-turbo 更高的智能，但速度同样快。它旨在用于较小的任务，包括视觉任务。

GPT-4o mini模型自己承认是基于GPT-3.5架构的模型，有图有真相：

搞了半天原来GPT-4o-mini是基于GPT-3.5架构的模型（Dify中接入GPT-4o mini模型）

一.GPT-4o mini官网简介

GPT-4o mini（"o"代表"omni"）是小型型号类别中最先进的型号，也是OpenAI迄今为止最便宜的型号。它是多模态的（接受文本或图像输入并输出文本），具有比 gpt-3.5-turbo 更高的智能，但速度同样快。它旨在用于较小的任务，包括视觉任务。建议在之前使用 gpt-3.5-turbo 的地方选择 gpt-4o-mini ，因为此模型功能更强大且更便宜。

模型	描述	上下文窗口	训练数据
gpt-4o-mini	新款 GPT-4o-mini经济实惠且智能的小型型号，适用于快速、轻量级的任务。 GPT-4o mini 比 GPT-3.5 Turbo 更便宜、功能更强大。当前指向 gpt-4o-mini-2024-07-18 。	128,000 tokens	Up to Oct 2023
gpt-4o-mini-2024-07-18	gpt-4o-mini 当前指向此版本。	128,000 tokens	Up to Oct 2023

二.Dify中接入gpt-4o-mini

1.openrouter下的gpt-4o-mini配置

在Dify 0.6.14版本中没有包含gpt-4o-mini，因为当时还没发布。

在Dify官方仓库发现已经有人提交了，不过看清楚是提交给openrouter供应商的。

2.openai下的gpt-4o-mini配置

（1）_position.yaml文件

接下来修改下提交给openai供应商。主要是修改dify\api\core\model_runtime\model_providers\openai\llm\_position.yaml文件增加gpt-4o-mini如下：

（2）gpt-4o-mini.yaml文件

然后在dify\api\core\model_runtime\model_providers\openai\llm目录增加gpt-4o-mini.yaml文件即可：

具体就不详细解释了，仿照gpt-4o.yaml写一个，主要是修改模型的名字，以及价格。

model: gpt-4o-mini
label:
 zh_Hans: gpt-4o-mini
 en_US: gpt-4o-mini
model_type: llm
features:
 - multi-tool-call
 - agent-thought
 - stream-tool-call
 - vision
model_properties:
 mode: chat
 context_size: 128000
parameter_rules:
 - name: temperature
 use_template: temperature
 - name: top_p
 use_template: top_p
 - name: presence_penalty
 use_template: presence_penalty
 - name: frequency_penalty
 use_template: frequency_penalty
 - name: max_tokens
 use_template: max_tokens
 default: 512
 min: 1
 max: 4096
 - name: response_format
 label:
 zh_Hans: 回复格式
 en_US: response_format
 type: string
 help:
 zh_Hans: 指定模型必须输出的格式
 en_US: specifying the format that the model must output
 required: false
 options:
 - text
 - json_object
pricing:
 input: "0.15"
 output: "0.60"
 unit: "0.000001"
 currency: USD

3.模型供应商查看和对话测试

参考文献

[1] gpt-4o-mini.yaml：https://github.com/sinomoe/dify/commit/9ba76915187cef8914c0bd5f6d920c82456ffcce

[2] https://platform.openai.com/docs/models/gpt-4o-mini

来源：NLP工程化

0赞

好文章，需要你的鼓励

zip2zip：通过令牌压缩实现大语言模型的推理时自适应词汇表

zip2zip是一项创新技术，通过引入动态自适应词汇表，让大语言模型在推理时能够自动组合常用词组，显著提高处理效率。由EPFL等机构研究团队开发的这一方法，基于LZW压缩算法，允许模型即时创建和使用"超级tokens"，将输入和输出序列长度减少20-60%，大幅提升推理速度。实验表明，现有模型只需10个GPU小时的微调即可适配此框架，在保持基本性能的同时显著降低计算成本和响应时间，特别适用于专业领域和多语言场景。

人工智能

自然语言处理

仇恨言论无毒化

2025-06-05

LLM循环助力：创建PARADEHATE数据集实现仇恨言论无毒化

这项研究创新性地利用大语言模型(LLM)代替人类标注者，创建了PARADEHATE数据集，用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美，随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示，在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异，证明LLM生成的数据可作为人工标注的高效替代方案，为创建更安全、更具包容性的在线环境提供了新途径。

3D编辑

视觉一致性

渐进式视角范式

2025-06-05

Pro3D-Editor：一种实现3D模型一致精准编辑的渐进式视角方法

这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor，一种新型3D编辑框架，通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑，要么同时编辑多个固定视角，都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块：主视角采样器自动选择最适合编辑的视角，关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角，全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。

ComposeAnything：来自INRIA的人工智能新突破，让AI图像生成理解复杂空间关系

搞了半天原来GPT-4o-mini是基于GPT-3.5架构的模型（Dify中接入GPT-4o mini模型）

一.GPT-4o mini官网简介

二.Dify中接入gpt-4o-mini

1.openrouter下的gpt-4o-mini配置

2.openai下的gpt-4o-mini配置

3.模型供应商查看和对话测试

参考文献

来源：NLP工程化

人工智能

模型优化

大语言模型

zip2zip：通过令牌压缩实现大语言模型的推理时自适应词汇表

人工智能

自然语言处理

仇恨言论无毒化

LLM循环助力：创建PARADEHATE数据集实现仇恨言论无毒化

3D编辑

视觉一致性

渐进式视角范式

Pro3D-Editor：一种实现3D模型一致精准编辑的渐进式视角方法

人工智能

图像生成

空间关系理解

ComposeAnything：来自INRIA的人工智能新突破，让AI图像生成理解复杂空间关系

2024

07/23

19:04

分享

点赞

NLP工程化

专注于Python/C++/CUDA、ML/DL/RL和NLP/KG/DS/LLM领域的技术分享。

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: