阿里巴巴的Qwen大语言模型项目失去了一位重要的技术领导者,此事发生在这家中国科技巨头发布新的Qwen 3.5开放权重小模型的一天后。
阿里巴巴Qwen团队的核心技术负责人林俊扬周二在X平台上发布消息称,他将从该项目"离职",但未详细说明原因。根据他的LinkedIn资料显示,他于2019年7月加入阿里巴巴,并于2023年4月加入Qwen团队。
这次突然的离职引起了同事和行业合作伙伴的强烈反应,正值全球AI开发者之间竞争加剧,各公司都在竞相构建能够与OpenAI、谷歌和Anthropic媲美的模型。
阿里巴巴的Qwen模型系列已成为中国最突出的开放权重AI项目之一,最新发布的模型在基准测试中的表现经常能与美国领先开发商的系统相媲美。这家中国科技巨头于2023年4月推出该模型,并在获得监管批准后于同年9月向公众开放使用。
阿里巴巴周一推出了Qwen 3.5小模型系列,包含四个模型,参数规模分别为0.8B、2B、4B和9B。该公司表示,这些系统是原生多模态模型,设计用于从设备端AI部署到轻量级智能体等各种用途。此次发布引起了AI社区重要人物的关注,包括埃隆·马斯克,他在X平台上写道,这些模型显示出"令人印象深刻的智能密度"。
林俊扬的离职正值Qwen团队推进新版本发布之际,这引发了同事和合作伙伴异常强烈的反应,他们形容他在项目中发挥了核心作用。
Qwen团队的研究科学家赵文婷将林俊扬的离职形容为"一个时代的结束",在X平台上的帖子中感谢他帮助推动项目在开源AI和工程方面的进步。AI基础设施初创公司Hyperbolic的首席技术官金雨辰表示,林俊扬帮助Qwen与全球开发者社区建立联系,回忆起在模型发布期间与团队深夜合作的情况。Hugging Face亚太生态系统负责人王铁振也将林俊扬的离职形容为Qwen项目的"巨大损失"。
林俊扬离职的具体情况仍不清楚。林俊扬没有回应置评请求。
Qwen项目的贡献者陈诚写道,这个消息让他"心痛"。在他的X平台帖子中,陈诚似乎是在直接对林俊扬说话,写道:"我知道离开不是你的选择",并表示团队几小时前还在一起准备模型发布。
Qwen团队的另一位成员惠斌元已将他的X平台个人资料更新为"前阿里巴巴Qwen技术专家"。不过,目前尚不清楚他是否已离开公司,或者这一变更是何时进行的。
阿里巴巴没有回应关于此次人员变动原因或Qwen团队领导结构的置评请求。
Q&A
Q1:Qwen是什么?它在AI领域有什么地位?
A:Qwen是阿里巴巴开发的大语言模型系列,已成为中国最突出的开放权重AI项目之一。该模型于2023年4月推出,在基准测试中的表现经常能与美国领先开发商的系统相媲美,在全球AI竞争中占据重要地位。
Q2:林俊扬在Qwen项目中扮演什么角色?
A:林俊扬是Qwen团队的核心技术负责人,于2019年7月加入阿里巴巴,2023年4月加入Qwen团队。同事和合作伙伴形容他在项目中发挥了核心作用,帮助推动项目在开源AI和工程方面的进步,并帮助Qwen与全球开发者社区建立联系。
Q3:Qwen 3.5小模型系列有什么特点?
A:Qwen 3.5小模型系列包含四个模型,参数规模分别为0.8B、2B、4B和9B。这些是原生多模态模型,设计用于从设备端AI部署到轻量级智能体等各种用途,展现出"令人印象深刻的智能密度"。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。