Nvidia 推出了一款名为 Signs 的手语学习平台,其中包含美式手语 (ASL) 词库,可帮助学习者提升词汇量,并配备了 3D 虚拟教师。学习者可以通过摄像头获得实时反馈,AI 工具会分析其手语动作。该平台目前收录了 100 个手语词汇,主要关注手部动作和手指位置。用户还可以学习不同面部表情和头部动作的含义。
Nvidia 表示,计划将手语词库扩展到 400,000 个视频片段,涵盖 1,000 个手语词汇。Signs 用户可以为这个开源视频数据集做出贡献。该公司还计划向公众开放这些数据集,用于构建无障碍 AI 助手、视频会议功能和其他 AI 工具。
美国聋童协会执行董事 Cheri Dowling 在一份声明中表示:"大多数聋童都出生在健听家庭。为家庭成员提供像 Signs 这样易用的工具来尽早学习美式手语,使他们能够在孩子 6 到 8 个月大时就建立起有效的沟通渠道。而且,由于所有词汇都经过专业美式手语教师的验证,用户可以对所学内容充满信心。"
目前,该公司正与罗切斯特理工学院的无障碍和包容性研究中心合作改进平台,并计划在 Signs 词库中加入地区性用语和俚语。Nvidia 表示,数据集将于今年某个时候发布,而美式手语学习服务已经上线。
与此同时,Nvidia 正在筹备三月份的年度 GPU 技术大会,与会者也可以使用 Signs。该公司将于下周发布第四季度财报。
好文章,需要你的鼓励
英特尔第三季度财报超华尔街预期,净收入达41亿美元。公司通过裁员等成本削减措施及软银、英伟达和美国政府的大额投资实现复苏。第三季度资产负债表增加200亿美元,营收增长至137亿美元。尽管财务表现强劲,但代工业务的未来发展策略仍不明朗,该业务一直表现不佳且面临政府投资条件限制。
美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。
微软发布新版Copilot人工智能助手,支持最多32人同时参与聊天会话的Groups功能,并新增连接器可访问OneDrive、Outlook、Gmail等多项服务。助手记忆功能得到增强,可保存用户信息供未来使用。界面新增名为Mico的AI角色,并提供"真实对话"模式生成更机智回应。医疗研究功能也得到改进,可基于哈佛健康等可靠来源提供答案。同时推出内置于Edge浏览器的Copilot Actions功能,可自动执行退订邮件、预订餐厅等任务。
纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。