2021年10月11-17日,两年一度的计算机视觉领域顶级学术会议 ICCV (International Conference on Computer Vision) 将在加拿大蒙特利尔召开。根据ICCV 2021官方议程,由美团视觉智能中心联合中科院计算所、北京智源、巴塞罗那大学共同主办的LargeFineFoodAI技术研讨会于大会召开期间举行。会议核心聚焦计算机视觉技术在大规模细粒度食品分析领域的应用,届时将邀请到业内顶尖专家学者、被接收的oral论文作者及挑战赛优胜团队带来前沿理论和实践成果分享,相关论文提交及挑战赛任务通道现已正式开放。
ICCV国际计算机视觉大会是计算机视觉方向的三大顶会之一,着眼于计算机视觉领域最新的发展水平和发展方向。大规模视觉分析与细粒度视觉分析正是当前备受行业关注的热门研究方向之一,相关论文及研究成果日益丰富,但以“LargeFineFoodAI”为研讨主题,聚焦大规模食品图像的细粒度识别与检索尚属首次。
与通用图像识别及检索相比,食品细粒度识别及检索技术难度更大。许多不同类型的食品外观看起来可能非常相近,而同一种类型的食品也可能由于做法不同看起来差异较大,此外光线、拍摄角度、不同的拍摄背景都可能对算法的精度产生影响,即便对于专业人员也较难快速准确的进行辨别。另一方面,相关技术具有广泛的应用场景和实际的应用价值,例如降低商家端食品图片的审核成本,提升C端食品图片和视频的分发效率等。美团作为国内领先的生活服务平台,准确把握住消费升级趋势给餐饮行业的经营、消费方式带来的革命性变化,率先提出借助计算机视觉算法对食品图像进行细粒度分析,来快速响应和满足商户和用户大量多样的在线食品图像审核、管理、浏览、评价等需求。
本次研讨会上,美团邀请了美国加州大学欧文分校Ramesh Jain教授等食品计算领域的专家作为特邀演讲者,共同探讨计算机视觉技术与食品科学、营养健康等领域的跨界融合;并开放提交通道,接收食品分析相关领域的论文,届时将同主会论文同时发表;此外,我们还将组织一场大规模食品图像细粒度识别和检索的竞赛,并为优胜团队提供总计12,000美元的资金奖励。美团希望能够借此次研讨交流活动,推动学术界和工业界对于大规模细粒度食品分析的研究,群策群力解决食品分析中的实际问题,加速实现“帮大家吃得更好,生活更好”的使命。
目前,研讨会论文招募通道已经开启,主题可涉及食品细粒度识别、检索、检测和分割,多标签食品属性(食材、风味、餐食类型)分析,跨模态食品图像菜谱检索与生成,多模态食品体量估计,卡路里预测,食品日志分析,烹饪动作识别与预测,新兴的食品视觉分析相关任务与应用等方向,被接收的oral论文作者将受邀参加LargeFineFoodAI研讨会分享。
此外,为了进一步推进食品视觉分析领域的研究与实践,吸引更多行业相关团队关注参与,美团发起了以LargeFineFoodAI为主题的挑战赛。该竞赛将分为两大赛道,其一是“大规模食品图像细粒度识别”,将采用Food1K数据集(包含1500种类别中的1000种食物类别),通过Top-1分类准确率进行算法评估;其二是“大规模食品图像细粒度检索”,将使用同赛道一的训练和验证集,使用剩余的Food500作为测试集,使用MAP@100进行算法评估。
值得一提的是,本次挑战赛所用数据集来自美团自建数据集"Food2K",该数据集每一张美食图片均由不同个人,采用不同设备,在不同环境场景下拍摄获取,是难得的可以公正评价算法鲁棒性和效果的图片数据,挑战也非常大。并且所有图像均由美团公司的食品专家进行评估,确保了数据的高质量。相比其他主流食品图像识别数据集,"Food2K"数据集完全人工标注,数据集噪声比例控制在 1% 以内;数据分布与真实场景相符,不平衡现象显著;而且类别粒度更细。以披萨为例,主流数据集(例如Food-101)仅具有披萨类,而"Food2K"进一步将其划分为多种多样的披萨,如鲜虾披萨、榴莲披萨等。
LargeFineFoodAI挑战赛已于6月1日正式启动报名,美团为每个赛道排名前三的队伍设立了奖金,金额依次为冠军3000美元、亚军2000美元和季军1000美元。希望通过本次竞赛收获更多优秀的研究方法与应用成果,为推进计算机视觉在食品分析领域的应用提供宝贵助力!
网站主页:
https://foodai-workshop.meituan.com/foodai2021.html#index
论文及挑战赛重要时刻表
参赛交流
参加挑战赛的团队请加入官方交流群:
1、微信搜索“MTtceh04”,添加好友。
2、回复“LargeFineFoodAI”,自动将您加入LargeFineFoodAI2021技术交流群。
其他研讨会相关问题可通过邮件咨询:wangzhiling02@meituan.com
*邮件标题请注明 “LargeFineFoodAI”
好文章,需要你的鼓励
目前市场上几乎所有电动车都支持苹果的 CarPlay 平台,包括福特 Mustang Mach-E、大众 ID.4、起亚 EV6、雪佛兰 Bolt 等等。特斯拉和 Rivian 是两个主要的例外,它们都不支持 CarPlay,并且没有显示出计划添加 CarPlay 支持的迹象。通用汽车当然也将在 2024 年开始放弃 CarPlay。
Oracle 凭借其庞大的企业客户群和领先的数据库技术,在人工智能市场占据有利地位。公司云业务增长迅速,基础设施服务收入增长尤为强劲。Oracle 正积极部署 GPU 集群,与 Nvidia 和 AMD 签订大额合同,为 AI 训练和推理提供强大算力支持。公司预计未来几年收入将大幅增长,有望成为 IT 史上第五家年收入突破 1000 亿美元的公司。
Snapchat 首次推出由自研生成视频模型驱动的 AI 视频滤镜。这三款新滤镜仅向付费用户开放,每月订阅费 15.99 美元。Snap 此举旨在保持竞争力,为用户提供独特功能。公司计划每周增加新滤镜,目前包括"浣熊"、"狐狸"和"春花"三款。用户可通过镜头轮盘访问并保存生成的 AI 视频。
Google最新的人工智能模型Gemma 3在参数和上下文窗口方面都有显著提升,旨在为开发者提供高效的单GPU或AI加速器解决方案。它支持多种数据类型的处理,并且可以在不同环境中运行。Gemma 3的上下文窗口扩展至128,000个token,适合各种硬件使用,且开源可供下载。