深度学习深刻改变了计算机应用程序的功能与形态,为了加速深度学习模型的推理,NVIDIA 英伟达推出了高性能深度学习推理优化器TensorRT。经过多年的更新迭代,TensorRT不断为深度学习提供低延迟、高吞吐率的部署推理,在保持优越性能的同时极大提高了易用性,已经成为GPU推理计算的必备工具。
然而,随着版本的迭代,编程最佳实践也在不断演化,开发者们开始探索新的问题:把模型跑在TensorRT上,最高效省力的方式是什么?为了帮助开发者们解决这一问题,阿里云天池联合英伟达在4月份启动了“英伟达TensorRT加速AI推理Hackathon2022——Transformer模型优化赛”,助力开发者在编程实践中寻找更高效的解决路径,同时也让更多工程师通过大赛实践更好的掌握TensorRT这一高性能加速工具。
面向全社会开放,更关注选手学习交流过程
大赛面向全社会开放,个人、高等院校、科研单位、企业、创客团队等人员均可报名参赛,组队上限3人。参赛的开发者将在专家组的指导下在初赛中对给定模型加速,在复赛中则根据自选模型进行加速,并将得到专家组一对一指导。据了解,大赛初赛时间为4月2日-5月20日,系统进行实时评测并返回成绩;5月20日上午10点,初赛阶段未产出成绩队伍将被淘汰,初赛排名前40的队伍则进入复赛,并于5月23日-6月27日进入复赛调优阶段。
大赛还为选手们准备了丰厚的奖品,其中,冠军1名、亚军2名、季军3名分别享有10000元、5000元、3000元人民币奖励,优胜奖则选取20名,每支团队均可获得1000元人民币奖励。值得一提的是,阿里员工可参赛排名,但不参与评选及领取奖金,来自外界的开发者们将有更多机会赢取大赛奖励。
实际上,除了荣誉与现金奖励,此次大赛最大的意义在于通过比赛的形式,提高选手的开发应用能力,因此会在比赛周期中更加重视选手的学习过程以及选手与阿里云、英伟达专家之间的沟通交流。据了解,初赛刚刚开始,GPU计算专家就与各位参赛选手在活动钉钉群内展开了热火朝天的交流讨论,对于选手们遇到的问题,专家也非常重视,给予耐心的指导与解答。

推动行业交流与人才培养,为深度学习领域聚力
谈及举办TensorRT模型优化赛的初衷,英伟达GPU计算高级专家季光博士表示,“TensorRT Hackathon既是一场云集各路开发高手的竞赛,也是一场开发者与英伟达之间的交流大会。希望参赛选手们通过这项活动,让自己开发运用TensorRT的技能更加纯熟。”
作为此次大赛的合作方,阿里云同样凭借自身在公共云计算领域的优势和GPU计算领域积累的应用经验,为本次参赛队伍提供了强大的技术支持。阿里云天池数据科学家陈漠沙对参赛选手也寄予了技术突破的期望,“希望参加本次Hackathon的选手们能开阔视野,了解业界前沿的技术方向,通过加速语音识别模型-WeNet项目实践掌握TensorRT编程技术。”
综上,对参赛者而言,此次Transformer模型优化赛大赛不仅可以提高编程实践能力,解决AI加速发展过程中的具体应用问题,更是为AI开发者提供了技术交流与学习的平台,从而促进行业深度学习开发部署人才的培养。
目前,“英伟达TensorRT加速AI推理 Hackathon 2022 —— Transformer模型优化赛”报名与初赛已同步开启。5月15日之前,感兴趣的同学在阿里云天池平台完成个人信息注册及实名认证,即可报名参赛。快来加入2022年TensorRT Hackathon,一起冲上云端,探索未知吧!
好文章,需要你的鼓励
购买笔记本电脑时,用户现在需要了解Copilot+ PC、NPU和本地AI处理等新概念。搭载专用神经处理单元(NPU)的Copilot+ PC能提供至少40 TOPS的AI算力,支持实时字幕翻译、视频通话优化、AI图像编辑等功能,同时提升续航表现。戴尔最新产品线涵盖多种选择:Dell 14 Plus适合学生和通勤族,Dell 16 Plus适合多任务办公用户,XPS 14面向轻度创作者,XPS 16则以31小时超长续航和3.6磅轻薄机身成为内容创作者的旗舰之选。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。
圣安德鲁斯大学博士Henry Legg在《自然》杂志发表同行评审论文,对微软拓扑间隙协议(TGP)框架提出质疑,认为该框架在推断Majorana粒子量子态存在方面存在缺陷,且实验数据分析结论可能有误。微软此前宣称将于2029年实现可扩展量子计算机,并推出Majorana 2芯片。对此,微软坚持立场,表示已发表正式反驳并获《自然》收录,对研发路线图充满信心。
上交大与爱丁堡大学提出InfoKV,将信息熵与注意力权重结合用于KV缓存压缩,让大模型在仅保留12.5%缓存的条件下实现接近甚至超越完整缓存的长推理性能。