近日,在全球权威的ICDAR Robust Reading大赛榜单中,紫光华智凭借领先的AI技术优势,在文本行检测与识别两项任务中均斩获第一,并一举刷新榜单记录,超越了榜单内其他知名AI公司和国内外学术研究机构,展现了紫光华智在自然场景文本检测与识别领域的创新突破能力。

▲ 紫光华智位居文本行检测榜单No.1

▲ 紫光华智位居文本行识别榜单No.1
ICDAR-ReCTS:全球OCR领域权威大赛
自然图像中的文本带有许多重要的语义信息,对文本的自动检测和识别也受到越来越多的关注。在街景招牌中,为了美观或突出某些元素,招牌中的汉字排列方式和字体与其他场景存在明显差异,排列方向不同、布局分布不规则、字体类型多样等难题极大制约了文本检测与识别的准确率。
ICDAR-ReCTS(International Conference on Document Analysis and Recognition)是首次提出大规模自然场景中英文招牌数据集的比赛,也是全球OCR领域最具挑战性、权威性的比赛之一,涵盖了各种复杂场景,吸引着众多国内外知名AI企业、学术研究机构参与。
紫光华智:以创新突破AI技术边界
为提升自然场景文本检测与识别能力,紫光华智基于深度学习算法,充分运用多层特征融合、跨层连接等技术,将不同级别特征结合,并运用文本注意力块来捕捉像素的长范围相关性以获得更可靠分割结果;同时,结合多尺度融合、注意力机制、多模型融合等先进技术及基础数据分析,对难例样本进行数据增强,实现了对图片像素低、质量差、艺术字体等识别效果的大幅提升。显著提高了自然场景文本检测与识别准确度,并成功跃居检测与识别两项榜单榜首。

▲ 各类复杂场景的文本检测与识别
技术与应用融合,使AI服务于实战
作为领先的AI视觉产品和解决方案提供商,紫光华智不仅注重核心技术的研发与投入,更注重技术与实际场景的融合应用,构筑二者间的相互进化机制,使技术真正服务于实战,通过实战反哺技术进化。
面对不同业务场景的实际需求,紫光华智将领先的文本检测与识别技术充分应用。
在道路交通场景,非机动车管理费神费力,不同地区非机动车牌格式和文本字符差异巨大,紫光华智车牌识别算法可自动读取车牌信息,实现非机动车的智能化管理,同时有效遏制了非机动车偷盗事件的发生。针对机动车管理,紫光华智车牌识别算法为监管部门在交通违法识别、高速违停等违法事件管理提供了有效帮助。

▲非机动车牌智能识别

▲ 机动车牌智能识别
在教育、金融等场景,不同证件票据格式不一,字符类型多样,字段长短不一,识别难度巨大。紫光华智文本识别算法可精确读取证件票据的文本信息,避免了人工手动录入产生的错误,同时大幅提升了输入工作效率,提高了工作智能化水平。

▲ 教育行业文本识别应用
在城市街道中,沿街商铺为了吸引客户存在设置多个招牌、招牌颜色各异、招牌大小不一、随意变更招牌等问题,不仅影响市容市貌也存在安全隐患。紫光华智街面OCR识别算法可准确识别不同招牌的文本和语义信息,提升城市智能化管理能力和效率,助力城市精细化管理。


▲街面招牌识别
除此之外,紫光华智也在积极布局企业、医疗、能源等更多行业场景,充分发挥AI核心技术优势,不断拓宽和挖掘AI技术应用的广度与深度,推进技术成果向实战价值的有效转化,覆盖更多行业需求,助力百行百业实现数字化转型。
好文章,需要你的鼓励
大众汽车旗下ID. Polo与Cupra Raval已在西班牙马托雷尔工厂正式下线投产。两款车型起售价分别为24,995欧元和26,000欧元,均基于MEB+平台打造,搭载37kWh或52kWh电池组,续航里程最高可达454公里。这是大众"电动城市车家族"系列的首批产品,预计今年夏末秋初开始交付。大众集团通过跨品牌资源整合,实现约6亿欧元的成本节约,后续还将推出ID. Cross等新成员。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
三星宣布将于6月8日起为Samsung Health应用推出重磅功能更新,赶在Galaxy Watch 9传闻发布之前落地。新版本将引入多项AI驱动的生物特征分析功能,包括:综合心率、血氧、皮肤温度等数据的每日活力评分(Vitals)、结合体成分数据评估长期心脏健康的心脏健康评分、优化训练强度的每日有氧负荷追踪,以及横向对比用户群体的健身指数。此外,应用界面将重新划分为睡眠、营养、活动、正念和体征五大板块,并新增抗氧化指数、年龄指数和听力保护等个性化功能。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。