
2021年10月11-17日,两年一度的计算机视觉领域顶级学术会议 ICCV (International Conference on Computer Vision) 将在加拿大蒙特利尔召开。根据ICCV 2021官方议程,由美团视觉智能中心联合中科院计算所、北京智源、巴塞罗那大学共同主办的LargeFineFoodAI技术研讨会于大会召开期间举行。会议核心聚焦计算机视觉技术在大规模细粒度食品分析领域的应用,届时将邀请到业内顶尖专家学者、被接收的oral论文作者及挑战赛优胜团队带来前沿理论和实践成果分享,相关论文提交及挑战赛任务通道现已正式开放。

ICCV国际计算机视觉大会是计算机视觉方向的三大顶会之一,着眼于计算机视觉领域最新的发展水平和发展方向。大规模视觉分析与细粒度视觉分析正是当前备受行业关注的热门研究方向之一,相关论文及研究成果日益丰富,但以“LargeFineFoodAI”为研讨主题,聚焦大规模食品图像的细粒度识别与检索尚属首次。
与通用图像识别及检索相比,食品细粒度识别及检索技术难度更大。许多不同类型的食品外观看起来可能非常相近,而同一种类型的食品也可能由于做法不同看起来差异较大,此外光线、拍摄角度、不同的拍摄背景都可能对算法的精度产生影响,即便对于专业人员也较难快速准确的进行辨别。另一方面,相关技术具有广泛的应用场景和实际的应用价值,例如降低商家端食品图片的审核成本,提升C端食品图片和视频的分发效率等。美团作为国内领先的生活服务平台,准确把握住消费升级趋势给餐饮行业的经营、消费方式带来的革命性变化,率先提出借助计算机视觉算法对食品图像进行细粒度分析,来快速响应和满足商户和用户大量多样的在线食品图像审核、管理、浏览、评价等需求。

本次研讨会上,美团邀请了美国加州大学欧文分校Ramesh Jain教授等食品计算领域的专家作为特邀演讲者,共同探讨计算机视觉技术与食品科学、营养健康等领域的跨界融合;并开放提交通道,接收食品分析相关领域的论文,届时将同主会论文同时发表;此外,我们还将组织一场大规模食品图像细粒度识别和检索的竞赛,并为优胜团队提供总计12,000美元的资金奖励。美团希望能够借此次研讨交流活动,推动学术界和工业界对于大规模细粒度食品分析的研究,群策群力解决食品分析中的实际问题,加速实现“帮大家吃得更好,生活更好”的使命。
目前,研讨会论文招募通道已经开启,主题可涉及食品细粒度识别、检索、检测和分割,多标签食品属性(食材、风味、餐食类型)分析,跨模态食品图像菜谱检索与生成,多模态食品体量估计,卡路里预测,食品日志分析,烹饪动作识别与预测,新兴的食品视觉分析相关任务与应用等方向,被接收的oral论文作者将受邀参加LargeFineFoodAI研讨会分享。
此外,为了进一步推进食品视觉分析领域的研究与实践,吸引更多行业相关团队关注参与,美团发起了以LargeFineFoodAI为主题的挑战赛。该竞赛将分为两大赛道,其一是“大规模食品图像细粒度识别”,将采用Food1K数据集(包含1500种类别中的1000种食物类别),通过Top-1分类准确率进行算法评估;其二是“大规模食品图像细粒度检索”,将使用同赛道一的训练和验证集,使用剩余的Food500作为测试集,使用MAP@100进行算法评估。
值得一提的是,本次挑战赛所用数据集来自美团自建数据集"Food2K",该数据集每一张美食图片均由不同个人,采用不同设备,在不同环境场景下拍摄获取,是难得的可以公正评价算法鲁棒性和效果的图片数据,挑战也非常大。并且所有图像均由美团公司的食品专家进行评估,确保了数据的高质量。相比其他主流食品图像识别数据集,"Food2K"数据集完全人工标注,数据集噪声比例控制在 1% 以内;数据分布与真实场景相符,不平衡现象显著;而且类别粒度更细。以披萨为例,主流数据集(例如Food-101)仅具有披萨类,而"Food2K"进一步将其划分为多种多样的披萨,如鲜虾披萨、榴莲披萨等。


LargeFineFoodAI挑战赛已于6月1日正式启动报名,美团为每个赛道排名前三的队伍设立了奖金,金额依次为冠军3000美元、亚军2000美元和季军1000美元。希望通过本次竞赛收获更多优秀的研究方法与应用成果,为推进计算机视觉在食品分析领域的应用提供宝贵助力!
网站主页:
https://foodai-workshop.meituan.com/foodai2021.html#index
论文及挑战赛重要时刻表

参赛交流
参加挑战赛的团队请加入官方交流群:
1、微信搜索“MTtceh04”,添加好友。
2、回复“LargeFineFoodAI”,自动将您加入LargeFineFoodAI2021技术交流群。
其他研讨会相关问题可通过邮件咨询:wangzhiling02@meituan.com
*邮件标题请注明 “LargeFineFoodAI”
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。