12月31日,搭载千问AI助手的夸克AI眼镜迎来首次OTA,AI能力进一步增强。新增录音纪要、图文备忘录、大模型多意图理解和执行、蓝环支付、社区服务五项新功能,并对受到用户欢迎的翻译、行程查询、音乐播放等功能场景进行优化。
在录音场景下,基于自研的Quark Audio语音增强模型和原有的5麦克风阵列加骨传导硬件配置,升级后的夸克AI眼镜支持十米范围内收音,并有效降噪。此外,眼镜能精准识别不同说话对象,根据录音内容进行AI要点提炼,自动生成待办事项等。目前,这一功能支持中文、英语、日语、韩语四种语言的录音转写及互译。

在备忘录场景下,夸克AI眼镜支持拍照和语音两种方式使用备忘录,如站在停车位前,只需要一句“千问同学,帮我记一下停车位”,眼镜就会拍下停车位照片并进行记录。更智能的是,系统具备AI分类与语义理解能力,当用户提问“最近一个月我想买的家具有哪些”,眼镜将自动检索历史记录并汇总回复。
此外,本次升级的一大亮点是大模型支持的多意图理解与执行。多数AI眼镜通常只能处理单一指令,而夸克AI眼镜已支持理解并执行2-3个复合任务。如“导航去公司,来点我喜欢的音乐”、“明天上午八点要去发布会、九点要赶飞机,记得提醒我”,夸克AI眼镜都能理解到位,并调度地图、音乐、日历等多项服务,提升在工作和生活中的效率与便捷性。
随身翻译功能也同步升级,支持89种语言翻译,不仅包括英、日、韩、法、德等主流语种,还覆盖多个国家和地区的小众语言,满足跨境旅行、商务交流等不同需求。
本次OTA通过夸克AI眼镜APP推送,用户可点击完成升级。APP端同步上线用户交流社区,用户可在社区内了解产品信息,并分享使用技巧和感受,还可参与官方组织的各种摄影、玩法、创作大赛。
作为阿里千问C端事业群的重要业务方向,夸克AI眼镜目前已推出S1、G1两个系列六个SKU产品。搭载的千问AI助手正以APP为核心入口,加速向眼镜、PC、汽车等多终端延伸。
好文章,需要你的鼓励
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
清华团队开发DKT模型,利用视频扩散AI技术成功解决透明物体深度估计难题。该研究创建了首个透明物体视频数据集TransPhy3D,通过改造预训练视频生成模型,实现了准确的透明物体深度和法向量估计。在机器人抓取实验中,DKT将成功率提升至73%,为智能系统处理复杂视觉场景开辟新路径。
2026年Linux将迎来重大发展机遇。AI将在Linux开发中发挥更大作用,但不会像Windows那样完全重写代码。随着微软持续向用户强推AI功能,更多Windows用户将转向Linux桌面。Rust已正式成为Linux核心语言,提升内存安全性。不可变Linux发行版因其安全性和稳定性获得企业青睐。开源供应链安全将通过SBOM等标准得到加强。然而Firefox因强推AI功能遭用户强烈反对,市场份额跌至1.7%,可能面临消亡危机。
字节跳动研究团队提出了专家-路由器耦合损失方法,解决混合专家模型中路由器无法准确理解专家能力的问题。该方法通过让每个专家对其代表性任务产生最强响应,同时确保代表性任务在对应专家处获得最佳处理,建立了专家与路由器的紧密联系。实验表明该方法显著提升了从30亿到150亿参数模型的性能,训练开销仅增加0.2%-0.8%,为混合专家模型优化提供了高效实用的解决方案。