在生成式AI的淘金热潮中,人们很容易忘记,再先进的建模技术也无法弥补低质量数据的缺陷。当企业竞相部署人工智能时,往往忽视了一项看似平凡却至关重要的工作:保护、治理和准备数据基础。这种疏忽不仅是运营上的疏漏,更是战略层面的风险,特别是在AI数据保护方面。
theCUBE Research的Scott Hebner表示:"数据是AI的生命线。没有信息架构就没有AI。数据是任何AI系统的关键组成部分,因此数据必须具备最高质量。它必须在处理和使用过程中保持完整性,最重要的是,必须得到保护,既要符合监管要求,也要防范各种潜在威胁。因此,任何优秀的长期AI战略都必须从数据层开始,这包括数据保护。"
Hebner在数据保护与AI峰会上与theCUBE的Christophe Bertrand进行了对话,探讨了数据信任鸿沟、智能体AI带来的风险演变,以及保护在构建弹性智能AI基础设施中的基础作用。
大多数企业数据既未受到保护,也未为AI做好准备。根据Hebner的观察,由于风险担忧或缺乏治理,大部分企业数据实际上被搁置。如果没有强有力的AI数据保护,即使是先进的模型也只能在有限的可用信息上运行,这限制了质量和信任度。
"如果你观察组织拥有的绝大多数专有企业数据,实际上今天只有很少一部分被使用,在AI中使用的更少。当你深入研究这些AI项目时,你会发现这是因为他们不确定如何保护这些数据。这是一个风险评估问题。数据就在那里,但还没有准备好用于AI。我们估计企业约95%的数据根本没有准备好,而保护是其中的重要组成部分。"
有效的保护不仅使数据安全,还使其能够大规模地用于AI应用和重复使用。因此,AI数据保护必须被视为设计要求,而非部署后的补救措施。
Bertrand表示:"AI对你的工作流程很重要,对你的工作负载很重要,对你的业务也很重要。因此,AI基础设施的任何部分都必须受到保护。我认为这是基线要求。不要把它当作后续考虑的事情,它实际上是一个设计要求。"
随着AI智能体和自动化以前所未有的速度生成新数据,治理必须跟上步伐。AI数据保护在这一过程中发挥着关键作用,确保系统演进过程中的连续性、完整性和信任度。
Hebner认为:"AI将从这些数据中学习,开始理解什么是真正的高质量数据,什么是受保护的,什么不是。然后,它会从中学习并在下次做得更好。随着系统的不断构建,它在所做的事情上会变得越来越好。我确实认为构建一个支撑治理和信任管理的AI架构,包括保护、监管合规和企业政策在内的框架,有时你会想这是否已经成为基本要求。这只是你必须做的事情;否则,你如何跟上这一切?"
好文章,需要你的鼓励
旅游预订巨头Kayak和Expedia正在开发基于AI的智能旅行助手,能够将社交媒体内容转化为实际行程。Kayak推出了基于ChatGPT的AI聊天助手,提供个性化旅行规划服务。Expedia则发布了Trip Matching功能,用户可发送Instagram旅行视频,系统自动生成相应行程。两家公司都强调在为用户提供便捷体验的同时,需要平衡用户控制权与AI代理的自主性,利用海量数据为"搜索型"用户简化复杂的旅行规划流程。
香港大学团队开发了MiCo多图对比框架,通过自监督学习让AI学会像人类一样比较多张图片的细微差异。该方法无需人工标注,仅使用图像内在约束作为监督信号,在多项视觉理解测试中超越了GPT-4o等先进模型,为解决AI多图推理难题提供了新思路。
传统大型在线零售商的时代即将结束。OpenAI、Gemini等AI助手正在重新定义购物方式,消费者不再从零售商主页开始购物之旅。AI成为策展人和购物向导后,传统数字商城将面临死亡。这与十年前社交媒体颠覆新闻媒体的情况相似。零售商需要采用三种生存策略:价格领导、物流网络优势,以及内容咨询领导。未来将属于那些拥抱专业化、个性化和咨询能力的品牌。
这项由伊利诺伊大学香槟分校研究团队开发的突破性AI技术,首次让机器具备了类似人类的空间推理能力。通过创新的细粒度偏好优化训练方法,SpatialReasoner-R1不仅能准确判断图片中的空间关系,还能提供完整的逻辑推理过程。在空间质量和数量任务上分别实现4.1%和9.0%的性能提升,为自动驾驶、机器人导航、增强现实等领域带来重要应用前景。