DeepSeek-VL:深度求索的多模态大模型

DeepSeekVL是一款开源多模态模型,通过对训练数据、模型架构和训练策略的联合拓展,构建了7B与1.3B规模的强大模型。相关资源可通过论文链接、模型下载页面和GitHub主页获取。

DeepSeekVL,训练数据、模型架构和训练策略进行联合拓展,构建出最强开源7B与1.3B多模态模型。

DeepSeek-VL:深度求索的多模态大模型

DeepSeek-VL:深度求索的多模态大模型

DeepSeek-VL:深度求索的多模态大模型

参考文献:

[1] 论文地址https://arxiv.org/abs/2403.05525

[2] 模型下载:https://huggingface.co/deepseek-ai

[3] GitHub主页:https://github.com/deepseek-ai/DeepSeek-VL

 

来源:NLP工程化

0赞

好文章,需要你的鼓励

2024

03/12

15:04

分享

点赞

NLP工程化

专注于Python/C++/CUDA、ML/DL/RL和NLP/KG/DS/LLM领域的技术分享。

最近文章 :