3月6日,记者发现阿里AI To C业务旗下AI应用通义,已经接入阿里最新开源推理模型通义千问QwQ-32B,目前在移动端与网页端均可体验。
千问QwQ-32B是阿里最新发布的强大推理模型,其特点是兼具性能与效率。千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。
用户在通义App与通义网页版均可通过“Qwen-QwQ-32B”智能体入口体验。
此前,通义App也已通过智能体的形式,上线Qwen-QwQ-preview版推理模型,让国内用户第一时间体验到通义千问强大模型能力。有网友在社交媒体指出,其代码生成能力表现优异,“生成宏基本一次过”。
据了解,未来通义App与通义网页版也会持续上线通义千问最新模型能力,并将深度推理能力应用到其智能体生态当中,革新个人AI助手体验,进一步提升用户在生活、办公、学习上的效率。
此外记者还发现,通义App的产品交互也在悄然发生变化,首页变为一个可爱的邻家女孩作为主要交互对象,并且增加了拍照讲题等多个实用功能,原有智能体生态也得到了进一步丰富。
好文章,需要你的鼓励
巴克莱银行与 Microsoft 签订协议,将 Copilot 集成到内部生产力工具中,为全球 10 万员工打造一站式 AI 平台,提升工作效率。
这项由台湾大学与微软研究团队合作的研究探索了使用音频感知大语言模型(ALLMs)作为自动评判员来评估语音生成模型的说话风格。研究设计了"语音风格指令跟随"和"角色扮演"两个任务,测试了四种语音模型的表现,并比较了人类与AI评判的一致性。结果表明,特别是Gemini-2.5-pro模型,其评判结果与人类评判的一致性甚至超过了人类评判者之间的一致性,证明ALLMs可以作为可靠的自动评估工具。同时研究也发现,即使是最先进的语音模型在说话风格控制方面仍有显著改进空间。
思科调查全球逾8065名高级IT及业务领导发现,拥堵、网络攻击和配置错误引发的网络故障每年可能使企业损失达1600亿美元。为迎接AI、IoT和云环境的挑战,现代网络必须更智能、更安全、更灵活。
卡内基梅隆大学研究团队提出全新"Kinetics"缩放定律,揭示大语言模型测试阶段的资源分配策略需要重新思考。研究发现小型模型效率被严重高估,因为以往研究忽略了内存访问成本这一关键瓶颈。在测试阶段,注意力机制而非参数数量成为主要成本因素。基于此,团队提出以稀疏注意力为核心的新范式,显著提升问题解决准确率,在AIME测试中低成本场景下提升高达60个百分点,高成本场景下仍有5个百分点优势。