此前处于严格保密阶段的阿里巴巴AI眼镜,首次以完整产品形态亮相。7月26日,2025世界人工智能大会(WAIC)开幕首日,阿里巴巴正式发布了首款自研AI眼镜——夸克AI眼镜的技术研发进展,并回应了外界对其AI硬件布局的关注。
据悉,阿里巴巴 AI 眼镜已完成研发,预计将于年内正式发布。当前,阿里凭借通义千问跻身全球基座模型第一梯队,应用侧夸克快速发展成为国内领先的AI应用。夸克AI眼镜标志着阿里在AI领域的又一次战略性下注,代表了其AI to C战略正从软件领域延伸至多形态硬件。
项目的整体研发由阿里巴巴智能信息事业群终端业务负责人宋刚负责。宋刚表示,AI眼镜会是智能穿戴方向最重要的产品形态,它将成为人类另一双“眼睛”和“耳朵”,具备极强的场景穿透能力。“眼镜一定会成为下一代人机交互的‘感官中枢’,这将催生个人数据量的急剧爆发。全场景的业务覆盖和领先的AI能力正是阿里巴巴最为擅长的。”
作为阿里巴巴AI能力与生态协同的集大成者,夸克AI眼镜将深度融合阿里及支付宝生态:具备通义千问大模型和夸克最新AI能力,还支持高德导航、支付宝看一下支付、淘宝比价、飞猪商旅提醒等。
以导航场景为例,研发团队联合高德地图开发了适配AI眼镜的近眼显示导航系统,可实现在骑行、步行等移动场景下的精准指引。夸克的视觉问答能力、学习办公能力都将提供原生适配,使AI眼镜从“听歌拍摄”进化为真正意义上的随身AI超级助理。
为支撑多模态AI能力的落地,夸克AI眼镜在硬件结构上进行了系统重构,具备通话、音乐、翻译、会议纪要等主流功能,同时在AI交互、佩戴、显示与影像、续航等方面实现突破。
“市面上现有产品多存在佩戴不适、续航短、AI交互弱等问题,并没有让AI眼镜真正进入大众消费领域”。宋刚透露,除了融合阿里巴巴自有生态,夸克AI眼镜将会联合全球领先的眼镜品牌,通过技术、渠道、服务以及C2M定制能力的整合,解决用户体验的关键瓶颈。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。