随着一些预测显示多模态人工智能市场在未来几年将以每年超过 35% 的速度增长,Google LLC 正在努力争取领先地位。
该公司的云计算部门最近表示,将文本、图像、视频、音频和其他非结构化数据与生成式 AI 处理相结合的多模态 AI,将成为 2025 年五大 AI 趋势之一。
Google 数据、分析和 AI 产品战略及对外产品管理执行官 Yasmeen Ahmad 表示,BigQuery 是 Google 多模态 AI 战略的核心,该公司正将这个数据仓库重新定位为可以收集和分析多种数据类型的数据湖仓。
她说:"在'数据湖仓'这个术语出现之前,BigQuery 就是最初的数据湖仓。我们构建了一个关系型引擎来支持企业客户想要进行的所有结构化分析。"
在接受 SiliconANGLE 采访时,Ahmad 表示,Google 估计 90% 的企业数据是非结构化的。通过将图像和语音识别等技术与结构化数据相结合进行检索增强生成训练,组织可以从以前无法使用的数据中获取洞察。
快餐连锁店 Wendy's 就是其中之一。它正在测试一个结合了 BigQuery、Google 的 Vision AI 和 Gemini 的应用程序,分析得来速服务车流量的视频以识别瓶颈。将观察到的视频图像数据与员工配置和排班信息相结合,以优化人员配置水平。Ahmad 说:"这不仅仅是视频分析,视频数据与运营数据在一个统一的平台中并存。"
United Parcel Service Inc. 构建了一个仪表板,利用卡车上安装的传感器数据,通过实时向驾驶员发出具体指令来优化实时配送路线。Bell Canada 正在使用 AI 生成的客服中心通话记录来训练一个教练助手,为客服人员提供反馈。
多模态 AI 可以使零售商从呼叫中心、社交媒体评论和移动应用反馈等多个来源收集客户情绪,并将其输入生成式 AI 引擎,以发现新的目标营销活动细分市场。Ahmad 说:"多模态数据和 AI 的这种组合实现了以前无法达到的个性化和可扩展性水平。"
Gemini 可以直接在 BigQuery 的数据基础上运行,无需数据传输。这加快了应用程序开发速度。Ahmad 表示,许多组织现在能够在几周内推出试点项目。
由于组织对向客户开放生成式 AI 持谨慎态度,大多数早期应用都是内部使用。但在防火墙后面仍有大量机会,Ahmad 说:"最容易实现的是那些客户长期收集了大量数据但一直无法利用的场景。有了 BigQuery 的多模态数据基础、Vision AI 和 Gemini 的集成,很容易就能实现应用。"
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。