人工智能与机器人技术是决定国家未来竞争力的重要核心,牢牢把握新一代人工智能与机器人技术发展战略机遇,是提高社会生产力、提升国际竞争力、增强综合国力、保障国家安全的战略支撑。“清华大学国强研究院杯”的举办,为人工智能和机器人领域培育创新技术和培养创新人才提供了重要平台,通过这一平台将挖掘创新技术、创新团队与人才,助力科技研发、产业集聚,为我国人工智能与机器人领域发展贡献智慧与力量,用科技创新迎接美好未来。
第三届“清华大学国强研究院杯”全球人工智能与机器人双创大赛即日正式启动,获奖者不但可获得最高20万元的奖金,还有机会对接清华大学、碧桂园集团和博智林公司的优质资源。
大赛已成功举办2届 遴选优秀创新创业项目645个
作为产学研深度融合的产业科技双创国际赛事,“清华大学国强研究院杯”全球人工智能与机器人双创大赛在各主办、承办、协办单位的共同努力下,已成功举办两届,参赛项目的数量和质量逐年提升,大赛在全球范围内累积遴选出645个创新创业项目,包括国内的环渤海地区、长三角地区、粤港澳大湾区、中西部地区,以及欧洲、北美等海外地区。
大赛不断完善赛事模式,自第二届开始使用双轨赛制,分别设置技术创新赛和应用场景赛,并于技术创新赛道设立初创组与成长组,旨在吸纳更多优质的项目、优秀的团队参与其中。
大赛现金奖励丰厚,往届比赛奖金累计超300万元。此外,大赛还特设“科技向善”奖以激励更多的优质科技项目持续为公益事业做出贡献,设置“伯乐奖”以表彰为大赛推荐优质项目的合作机构。
第三届大赛报名已启动 持续加大对参赛项目的服务力度
大赛以人工智能与机器人技术发展为主题,由清华大学国强研究院主办,清华大学人工智能研究院、广东省国强公益基金会、广东博智林机器人有限公司、力合科创集团有限公司承办,旨在深入贯彻实施党和国家创新驱动发展战略,紧密围绕清华大学建成双一流的高科技人才和创新高地,充分发挥碧桂园集团在产业发展上的号召力和影响力,协助博智林公司优化机器人和智能制造上下游产业链,借力力合科创集团产学研深度融合的科技创新服务体系,积极促成参赛项目与清华大学、碧桂园集团及博智林公司的密切互动及深度合作,不断提升“校企、产研深度融合的创新赛事品牌形象”。
本届大赛已正式启动,设置技术创新赛和应用场景赛两个赛道,参赛团队可以根据自身情况择一或同时参加,技术创新赛重点关注领域包括无人系统、智能感知、人机混合等创新性技术,而应用场景赛则针对建筑、社区服务、特种作业、教育、商业、工业、农业、医疗、家庭等领域着力寻找“针对应用场景已形成的机器人综合解决方案”。大赛不但提供总额200万元人民币的现金奖励,还为优秀项目持续提供应用研发、投资孵化、人才培训、创新基地、产业对接等多项增值服务。总决赛和颁奖仪式将于2023年1月进行。
感兴趣的创业者,可扫描下方二维码报名参赛。
详情了解
官方网站:http://gqcup-os.gqy.tsinghua.edu.cn:8080
电话:+86-0755-26550163
邮箱:gqcup@leaguer.com.cn
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。