书生·浦语基于InternLM2模型迭代出了InternLM2.5系统,7B参数!模型刚刚在 huggingface 上发布。该系列包含5个模型。
与上一代 InternLM2 相比,推理性能提高了20%。数学推理性能超过了Llama3、Gemma2-9B等
在1M上下文中实现高精度的“大海捞针”,在 LongBench 和 L-Eval 评测中达到同规模模型的领先水平
支持从100多个网页收集信息,在指令执行、工具选择和反思方面展现了更好的工具使用能力


参考文献:
[1] https://huggingface.co/collections/internlm/internlm25-66853f32717072d17581bc13
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
牛津、MIT等机构联合发布GauntletBench,测试显示最强AI智能体完成率仅19%,而普通人类完成率超80%,揭示AI在时间感知、图形理解和三维推理上的真实短板。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
论文提出"盲目信任问题":现有视频AI将每帧画面等权处理,遭遇干扰时准确率暴跌却浑然不知。Robust-TO通过逐帧质量评估、置信度引导工具路由和分级证据推理三阶段框架解决这一缺陷。