/

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

这个模型一般的GPU肯定是跑不起来，如此大的参数在部署方面个人开发者也负担不起（如果你有一些H100也没问题），估计是给企业、政务公共部门用的。对于Meta即将发布的模型，就有网友泼冷水。相比OpenAI最新的GPT-4o mini版本，Llama 3.1-70B推理成本提升了3倍，但编码的性能却要差很多。

7月23日凌晨，有人爆料，Meta的Llama 3.1-405B评测数据遭遇泄漏，明天可能会发布Llama 3系列中最大的参数模型，同时还会发布一个Llama 3.1-70B版本。

这也是在3.0版本基础之上进行了功能迭代，即便是70B的基础模型的性能也超过了GPT-4o。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

就连磁力链接都流出来了，试了一下大约有763.84G。本来huggingface上也有的，后来库被删除了。

磁力地址：Magnet: magnet:?xt=urn:btih:c0e342ae5677582f92c52d8019cc32e1f86f1d83&dn=miqu-2&tr=udp%3A%2F%http://2Ftracker.openbittorrent.com%3A80

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

下载速度也还可以，每秒14M左右，看来确实是有不少人在下这个模型。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

但这个模型一般的GPU肯定是跑不起来，如此大的参数在部署方面个人开发者也负担不起（如果你有一些H100也没问题），估计是给企业、政务公共部门用的。

对于Meta即将发布的模型，就有网友泼冷水。相比OpenAI最新的GPT-4o mini版本，Llama 3.1-70B推理成本提升了3倍，但编码的性能却要差很多。

从性价比、功能来看，Meta的新模型也没什么值得期待的。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

还有人甚至在GitHub上看到了上述发布的模型，但很快就拿下来了，估计有一些人可能已经能使用了。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

也有人表示，对于这个泄漏事件他认为是真的，因为这是从微软的Azure Github流出来的。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

但是这个模型参数较大，对GPU的要求太高了，不如GPT-4o mini性价比高。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

虽然模型是免费的，想运行起来还是相当费劲的，没有企业级的算力基础真的无法使用。所以，这对于企业来说是一个不错的好消息。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

有人指出即便对Llama 3.1-405B模型进行大幅度优化，量化到5位数，仍然无法适用于消费级GPU，真的是对硬件要求特别高。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

如果这份评测数据是真的，那么对于全球多数国家来说都是一个天大的福利。因为这是Meta的Llama 3系列的顶级模型并且是全部开放权重，也就是说人人都能用上免费的AI模型。

但是如果想开发生成式AI应用，也需要强大的AI算力基础、高质量数据以及微调技术。

Meta的Llama-3.1-405B遭泄漏，可下载，性能超GPT-4o！

由于监管机构和各种法案的原因，Meta一直在推迟405B系列模型的发布。那么，本次泄漏是否是Meta特意放出来的呢，因为这是他们的老传统了，去年的Llama模型就干过一次。

来源：AIGC开放社区

0赞

好文章，需要你的鼓励

推荐文章

苹果在印度恢复银行卡支付功能，距暂停已逾四年

苹果

App Store

塔伦·帕塔克

2026-07-16

苹果在印度恢复银行卡支付功能，距暂停已逾四年

苹果已开始在印度分阶段恢复Apple账户的信用卡支付功能，用户可绑定Visa和Mastercard信用卡及借记卡，用于购买iCloud+、Apple Music订阅及App Store应用。此前，由于印度储备银行于2021年推出新的周期性支付监管框架，苹果于2022年5月暂停了该支付方式。此次恢复标志着苹果在适应各国本地化监管要求方面的持续努力，同时也引发外界对苹果是否将在印度推出Apple Pay的新猜测。

腾讯混元团队打破AI“记忆瓶颈“：让大模型像人一样拥有超长记忆的新突破

大语言模型

稀疏注意力机制

超长上下文外推

2026-07-16

腾讯混元团队打破AI“记忆瓶颈“：让大模型像人一样拥有超长记忆的新突破

腾讯混元等机构提出HiLS-Attention，通过端到端可学习的分层稀疏注意力机制，让大模型在超长上下文推理中比全量注意力快14倍，同时检索准确率更高。

Bookshop.org确认今年将推出Kobo电子书阅读器支持

Bookshop.org

Kobo

ChatGPT

2026-07-16

Bookshop.org确认今年将推出Kobo电子书阅读器支持

Bookshop.org创始人Andy Hunter证实，与Kobo的合作集成将于今年落地。此前该计划历经多次推迟，网页措辞一度从"2026年"改为"未来某时"。Hunter表示，双方已就商业条款达成一致，工程团队正将资源重新投入Kobo支持开发，但尚无具体上线日期。该集成将支持数字版权管理要求，让用户通过Bookshop.org购买电子书，同时支持独立书店。

DeepSeek-AI与北京大学联手破局：AI聊天机器人“慢速打字“的终极解决方案

大语言模型推理加速

投机解码

半自回归架构

2026-07-16

DeepSeek-AI与北京大学联手破局：AI聊天机器人“慢速打字“的终极解决方案

DSpark是DeepSeek与北京大学提出的投机解码框架，通过半自回归生成和置信度调度验证两项创新，将DeepSeek-V4用户生成速度提升60%至85%。

2024

07/24

11:04

分享

点赞

AIGC开放社区

专注AIGC领域的专业社区，关注微软OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

最近文章 :

阅读更多内容，猛戳这里

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

业界热点:

数字化转型

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号京网文(2025) 0096-033号京字第20868号

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　公开举报受理处置规则

网上有害信息举报专区：https://www.12377.cn

安全联盟认证