书生·浦语基于InternLM2模型迭代出了InternLM2.5系统

书生·浦语基于InternLM2模型与上一代 InternLM2 相比，推理性能提高了20%。数学推理性能超过了Llama3、Gemma2-9B等

书生·浦语基于InternLM2模型迭代出了InternLM2.5系统，7B参数！模型刚刚在 huggingface 上发布。该系列包含5个模型。

与上一代 InternLM2 相比，推理性能提高了20%。数学推理性能超过了Llama3、Gemma2-9B等
在1M上下文中实现高精度的“大海捞针”，在 LongBench 和 L-Eval 评测中达到同规模模型的领先水平
支持从100多个网页收集信息，在指令执行、工具选择和反思方面展现了更好的工具使用能力

参考文献：
[1] https://huggingface.co/collections/internlm/internlm25-66853f32717072d17581bc13

来源：NLP工程化

0赞

好文章，需要你的鼓励

戴尔

工作站

AI PC

2025-08-20

AI PC 时代来临：戴尔科技如何重塑生产力边界

从日常办公到AI开发，戴尔用新一代AI PC回应算力与协作的双重挑战。

人工智能

注意力机制

推理能力

2025-08-20

麻省理工学院发现LLM“幻觉“新根源：注意力机制竟然会自相矛盾

麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源：注意力机制存在固有缺陷。研究通过理论分析和实验证明，即使在理想条件下，注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点，为未来AI架构发展指明新方向，提醒用户在复杂推理任务中谨慎使用AI工具。