深度学习深刻改变了计算机应用程序的功能与形态,为了加速深度学习模型的推理,NVIDIA 英伟达推出了高性能深度学习推理优化器TensorRT。经过多年的更新迭代,TensorRT不断为深度学习提供低延迟、高吞吐率的部署推理,在保持优越性能的同时极大提高了易用性,已经成为GPU推理计算的必备工具。
然而,随着版本的迭代,编程最佳实践也在不断演化,开发者们开始探索新的问题:把模型跑在TensorRT上,最高效省力的方式是什么?为了帮助开发者们解决这一问题,阿里云天池联合英伟达在4月份启动了“英伟达TensorRT加速AI推理Hackathon2022——Transformer模型优化赛”,助力开发者在编程实践中寻找更高效的解决路径,同时也让更多工程师通过大赛实践更好的掌握TensorRT这一高性能加速工具。
面向全社会开放,更关注选手学习交流过程
大赛面向全社会开放,个人、高等院校、科研单位、企业、创客团队等人员均可报名参赛,组队上限3人。参赛的开发者将在专家组的指导下在初赛中对给定模型加速,在复赛中则根据自选模型进行加速,并将得到专家组一对一指导。据了解,大赛初赛时间为4月2日-5月20日,系统进行实时评测并返回成绩;5月20日上午10点,初赛阶段未产出成绩队伍将被淘汰,初赛排名前40的队伍则进入复赛,并于5月23日-6月27日进入复赛调优阶段。
大赛还为选手们准备了丰厚的奖品,其中,冠军1名、亚军2名、季军3名分别享有10000元、5000元、3000元人民币奖励,优胜奖则选取20名,每支团队均可获得1000元人民币奖励。值得一提的是,阿里员工可参赛排名,但不参与评选及领取奖金,来自外界的开发者们将有更多机会赢取大赛奖励。
实际上,除了荣誉与现金奖励,此次大赛最大的意义在于通过比赛的形式,提高选手的开发应用能力,因此会在比赛周期中更加重视选手的学习过程以及选手与阿里云、英伟达专家之间的沟通交流。据了解,初赛刚刚开始,GPU计算专家就与各位参赛选手在活动钉钉群内展开了热火朝天的交流讨论,对于选手们遇到的问题,专家也非常重视,给予耐心的指导与解答。

推动行业交流与人才培养,为深度学习领域聚力
谈及举办TensorRT模型优化赛的初衷,英伟达GPU计算高级专家季光博士表示,“TensorRT Hackathon既是一场云集各路开发高手的竞赛,也是一场开发者与英伟达之间的交流大会。希望参赛选手们通过这项活动,让自己开发运用TensorRT的技能更加纯熟。”
作为此次大赛的合作方,阿里云同样凭借自身在公共云计算领域的优势和GPU计算领域积累的应用经验,为本次参赛队伍提供了强大的技术支持。阿里云天池数据科学家陈漠沙对参赛选手也寄予了技术突破的期望,“希望参加本次Hackathon的选手们能开阔视野,了解业界前沿的技术方向,通过加速语音识别模型-WeNet项目实践掌握TensorRT编程技术。”
综上,对参赛者而言,此次Transformer模型优化赛大赛不仅可以提高编程实践能力,解决AI加速发展过程中的具体应用问题,更是为AI开发者提供了技术交流与学习的平台,从而促进行业深度学习开发部署人才的培养。
目前,“英伟达TensorRT加速AI推理 Hackathon 2022 —— Transformer模型优化赛”报名与初赛已同步开启。5月15日之前,感兴趣的同学在阿里云天池平台完成个人信息注册及实名认证,即可报名参赛。快来加入2022年TensorRT Hackathon,一起冲上云端,探索未知吧!
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。