近日,拥有近300家成员单位、汇聚中国AR半壁江山的中国增强现实核心技术产业联盟(China Augmented Reality Core Technology Industry Alliance,简称CARA)在江西南昌召开2020产业峰会。
会上,IEEE(Institute of Electrical and Electronics Engineers,电气电子工程师学会)消费电子协会-移动设备增强现实标准工作组宣布正式成立,商汤科技担任主席单位,牵头系统化引领国际先进增强现实标准制定工作。
狄拍(上海)科技有限公司CEO 李翔,IEEE中国代表处刘佳佳,商汤科技副总裁张望,中国增强现实核心技术产业联盟理事长、商汤科技联合创始人、研究院院长王晓刚, IEEE消费技术协会标准理事会主席袁昱,中国电子技术标准化研究院数字技术研究中心主任范科峰,浙江大学教授章国锋,北京灵犀微光科技有限公司副总裁陈飞,共同启动成立IEEE增强现实移动设备标准工作组
同时,工作组首个IEEE标准提案P2048.101(Standard for Augmented Reality on Mobile Devices: General Requirements for Software Framework, Components, and Integration)也已正式获得立项。
商汤科技副总裁张望,代表商汤接受IEEE消费电子协会-移动设备增强现实工作组主席单位授牌
作为国内最早布局AR技术研发和应用开发的人工智能企业,同时也是中国增强现实核心技术产业联盟理事长单位,商汤科技一直积极联合多方推动AR产业发展,从学术、人才、产业等多方面构建繁荣生态。
近年来,商汤自身也在AR技术应用落地中屡次创新,发布行业领先的SenseMARS火星混合现实平台,可在多种系统和终端设备上实现极具沉浸式的虚实融合视觉效果和互动体验,被广泛应用于商业、文旅、工业等场景,引领多行业实现与众不同和更高效的应用变革。
商汤科技当选IEEE移动设备增强现实工作组主席单位,将进一步发挥自身在AR/MR等多领域的技术优势和丰富经验,为AR国际标准化进程贡献智慧。
关于商汤科技
作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的首个“智能视觉”国家新一代人工智能开放创新平台。
商汤科技以“坚持原创,让AI引领人类进步”为使命和愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲领先的AI算法提供商。
商汤科技在多个垂直领域的市场占有率位居前列,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外1,100多家世界知名的企业和机构建立合作,包括SNOW、阿里巴巴、苏宁、中国移动、vivo、小米、微博、万科、融创等。
商汤科技现已在香港、上海、北京、深圳、成都、杭州、台北、京都、东京、新加坡、利雅得、阿布扎比及迪拜设立办公室。另外,公司在马来西亚、泰国、印度尼西亚、韩国、澳门等国家和地区均有业务。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。