1月21日,2021国际AIOps挑战赛开启报名。自2017年首次举办以来,国际AIOps挑战赛吸引了大量AIOps从业者和关注者,旨在借助社区的力量,运用人工智能算法解决各类运维难题。
2021国际AIOps挑战赛迎来了重要的战略升级,将作为第一届国际互联网产业科技创新大会暨互联网创新产品展览会(NIICON,简称“科创会”)的重要组成部分,由科技部民营促进会国家产业技术创新战略培育联盟指导;国家互联网数据中心产业技术创新战略联盟(NIISA)、中国建设银行股份有限公司、中国民生银行股份有限公司、清华大学、中国计算机学会(CCF)主办;中国建设银行股份有限公司运营数据中心、中国民生银行股份有限公司信息科技部、清华大学计算机科学与技术系、北京必示科技有限公司承办;科大讯飞股份有限公司、华为技术有限公司NAIE产品部特别赞助。
本届国际AIOps挑战赛挑战度和精彩程度升级,首次将比赛环境部署在云上,以“云环境下商业银行应用系统的故障实时检测与根因定位”为赛题,数据来源于两家大型商业银行真实应用模拟,根据真实环境中常见的故障类型重放故障。参赛选手将在云环境下完成算法模型调优、线上评测等操作,挑战以一套代码,对两家银行的不同数据进行实时的故障检测,并准确定位出反映故障的指标或日志。
此次大赛将持续为期近4个月的时间,分为预赛、复赛和决赛三个阶段,评选出效果最好的前10支队伍进入决赛,预计在5月13日“科创会”新基建、投融资、金融科技、智能运维、智能制造、信创和信息安全等论坛中的“智能运维专题论坛”举办现场答辩,角逐最终大奖,最高奖金达到10万元。智能运维前沿论坛将预计在5月13日举办现场答辩,角逐最终大奖,最高奖金达到10万元。智能运维前沿论坛也将于决赛同期举办,邀请业界专家学者共同针对AIOps领域的技术与热点话题进行研讨,分享AIOps领域的前沿成果,共同推进AIOps产业的健康可持续发展。
目前报名通道已经正式对外开放,欢迎登录“建行云”官网https://yun.ccb.com/,第一时间了解大赛详情!
好文章,需要你的鼓励
NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理六种错误类型时表现差异巨大,特别是小型模型在空间推理修正上竟然超越了大型模型,颠覆了"越大越好"的认知。
牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时准确率仅34.5%,甚至低于不使用AI的对照组。问题源于用户提供信息不完整、LLM理解偏差等人机交互问题。专家指出,仅凭非交互式基准测试评估LLM存在误导性,需要真实的人机交互测试才能准确评估AI系统的实际性能。
上海交通大学研究团队开发出革命性AI图像检测系统,不仅能以98.1%准确率识别AI生成的假图片,更能像人类专家一样用自然语言详细解释判断依据并标出具体问题区域。该系统通过创新的多模态大语言模型训练方法,实现了从"黑盒判断"到"透明分析"的突破,为新闻、法律等领域提供可信赖的智能辅助工具。