2021年10月11-17日,两年一度的计算机视觉领域顶级学术会议 ICCV (International Conference on Computer Vision) 将在加拿大蒙特利尔召开。根据ICCV 2021官方议程,由美团视觉智能中心联合中科院计算所、北京智源、巴塞罗那大学共同主办的LargeFineFoodAI技术研讨会于大会召开期间举行。会议核心聚焦计算机视觉技术在大规模细粒度食品分析领域的应用,届时将邀请到业内顶尖专家学者、被接收的oral论文作者及挑战赛优胜团队带来前沿理论和实践成果分享,相关论文提交及挑战赛任务通道现已正式开放。
ICCV国际计算机视觉大会是计算机视觉方向的三大顶会之一,着眼于计算机视觉领域最新的发展水平和发展方向。大规模视觉分析与细粒度视觉分析正是当前备受行业关注的热门研究方向之一,相关论文及研究成果日益丰富,但以“LargeFineFoodAI”为研讨主题,聚焦大规模食品图像的细粒度识别与检索尚属首次。
与通用图像识别及检索相比,食品细粒度识别及检索技术难度更大。许多不同类型的食品外观看起来可能非常相近,而同一种类型的食品也可能由于做法不同看起来差异较大,此外光线、拍摄角度、不同的拍摄背景都可能对算法的精度产生影响,即便对于专业人员也较难快速准确的进行辨别。另一方面,相关技术具有广泛的应用场景和实际的应用价值,例如降低商家端食品图片的审核成本,提升C端食品图片和视频的分发效率等。美团作为国内领先的生活服务平台,准确把握住消费升级趋势给餐饮行业的经营、消费方式带来的革命性变化,率先提出借助计算机视觉算法对食品图像进行细粒度分析,来快速响应和满足商户和用户大量多样的在线食品图像审核、管理、浏览、评价等需求。
本次研讨会上,美团邀请了美国加州大学欧文分校Ramesh Jain教授等食品计算领域的专家作为特邀演讲者,共同探讨计算机视觉技术与食品科学、营养健康等领域的跨界融合;并开放提交通道,接收食品分析相关领域的论文,届时将同主会论文同时发表;此外,我们还将组织一场大规模食品图像细粒度识别和检索的竞赛,并为优胜团队提供总计12,000美元的资金奖励。美团希望能够借此次研讨交流活动,推动学术界和工业界对于大规模细粒度食品分析的研究,群策群力解决食品分析中的实际问题,加速实现“帮大家吃得更好,生活更好”的使命。
目前,研讨会论文招募通道已经开启,主题可涉及食品细粒度识别、检索、检测和分割,多标签食品属性(食材、风味、餐食类型)分析,跨模态食品图像菜谱检索与生成,多模态食品体量估计,卡路里预测,食品日志分析,烹饪动作识别与预测,新兴的食品视觉分析相关任务与应用等方向,被接收的oral论文作者将受邀参加LargeFineFoodAI研讨会分享。
此外,为了进一步推进食品视觉分析领域的研究与实践,吸引更多行业相关团队关注参与,美团发起了以LargeFineFoodAI为主题的挑战赛。该竞赛将分为两大赛道,其一是“大规模食品图像细粒度识别”,将采用Food1K数据集(包含1500种类别中的1000种食物类别),通过Top-1分类准确率进行算法评估;其二是“大规模食品图像细粒度检索”,将使用同赛道一的训练和验证集,使用剩余的Food500作为测试集,使用MAP@100进行算法评估。
值得一提的是,本次挑战赛所用数据集来自美团自建数据集"Food2K",该数据集每一张美食图片均由不同个人,采用不同设备,在不同环境场景下拍摄获取,是难得的可以公正评价算法鲁棒性和效果的图片数据,挑战也非常大。并且所有图像均由美团公司的食品专家进行评估,确保了数据的高质量。相比其他主流食品图像识别数据集,"Food2K"数据集完全人工标注,数据集噪声比例控制在 1% 以内;数据分布与真实场景相符,不平衡现象显著;而且类别粒度更细。以披萨为例,主流数据集(例如Food-101)仅具有披萨类,而"Food2K"进一步将其划分为多种多样的披萨,如鲜虾披萨、榴莲披萨等。
LargeFineFoodAI挑战赛已于6月1日正式启动报名,美团为每个赛道排名前三的队伍设立了奖金,金额依次为冠军3000美元、亚军2000美元和季军1000美元。希望通过本次竞赛收获更多优秀的研究方法与应用成果,为推进计算机视觉在食品分析领域的应用提供宝贵助力!
网站主页:
https://foodai-workshop.meituan.com/foodai2021.html#index
论文及挑战赛重要时刻表
参赛交流
参加挑战赛的团队请加入官方交流群:
1、微信搜索“MTtceh04”,添加好友。
2、回复“LargeFineFoodAI”,自动将您加入LargeFineFoodAI2021技术交流群。
其他研讨会相关问题可通过邮件咨询:wangzhiling02@meituan.com
*邮件标题请注明 “LargeFineFoodAI”
好文章,需要你的鼓励
打造“同路人”文化体系,优质资源向优质伙伴倾斜,共同投入构筑长效竞争力,共建公平公正、阳光透明的合作环境。
Honeywell 与通信服务商 Verizon 建立战略合作,通过整合 AI、云计算和 5G 技术,为公用事业公司提供智能电表解决方案。该方案将帮助用户远程访问关键数据,优化能源使用和资源管理,提升电网可靠性和弹性,同时简化运营流程以缓解电网压力。
Google DeepMind 推出最新大规模多模态 AI 模型 Gemini 2.5 Pro,内置"思考"能力以处理复杂任务。该模型在多个行业基准测试中领先,展现出强大的推理和编程能力。与传统基于模式预测的 AI 不同,Gemini 2.5 Pro 能够深入分析信息,进行逻辑推理,并在考虑细微上下文后做出明智决策。
Google 发布新一代 AI 模型 Gemini 2.5,在 LMArena 评测中位居榜首。该模型采用递归分析方法提供输出,在推理、科学、数学和代码生成等方面表现出色。目前已向付费高级用户开放使用,并将在 2025 年投入 750 亿美元用于 AI 开发,以争夺未来万亿规模的 AI 市场。