在生成式AI的淘金热潮中,人们很容易忘记,再先进的建模技术也无法弥补低质量数据的缺陷。当企业竞相部署人工智能时,往往忽视了一项看似平凡却至关重要的工作:保护、治理和准备数据基础。这种疏忽不仅是运营上的疏漏,更是战略层面的风险,特别是在AI数据保护方面。
theCUBE Research的Scott Hebner表示:"数据是AI的生命线。没有信息架构就没有AI。数据是任何AI系统的关键组成部分,因此数据必须具备最高质量。它必须在处理和使用过程中保持完整性,最重要的是,必须得到保护,既要符合监管要求,也要防范各种潜在威胁。因此,任何优秀的长期AI战略都必须从数据层开始,这包括数据保护。"
Hebner在数据保护与AI峰会上与theCUBE的Christophe Bertrand进行了对话,探讨了数据信任鸿沟、智能体AI带来的风险演变,以及保护在构建弹性智能AI基础设施中的基础作用。
大多数企业数据既未受到保护,也未为AI做好准备。根据Hebner的观察,由于风险担忧或缺乏治理,大部分企业数据实际上被搁置。如果没有强有力的AI数据保护,即使是先进的模型也只能在有限的可用信息上运行,这限制了质量和信任度。
"如果你观察组织拥有的绝大多数专有企业数据,实际上今天只有很少一部分被使用,在AI中使用的更少。当你深入研究这些AI项目时,你会发现这是因为他们不确定如何保护这些数据。这是一个风险评估问题。数据就在那里,但还没有准备好用于AI。我们估计企业约95%的数据根本没有准备好,而保护是其中的重要组成部分。"
有效的保护不仅使数据安全,还使其能够大规模地用于AI应用和重复使用。因此,AI数据保护必须被视为设计要求,而非部署后的补救措施。
Bertrand表示:"AI对你的工作流程很重要,对你的工作负载很重要,对你的业务也很重要。因此,AI基础设施的任何部分都必须受到保护。我认为这是基线要求。不要把它当作后续考虑的事情,它实际上是一个设计要求。"
随着AI智能体和自动化以前所未有的速度生成新数据,治理必须跟上步伐。AI数据保护在这一过程中发挥着关键作用,确保系统演进过程中的连续性、完整性和信任度。
Hebner认为:"AI将从这些数据中学习,开始理解什么是真正的高质量数据,什么是受保护的,什么不是。然后,它会从中学习并在下次做得更好。随着系统的不断构建,它在所做的事情上会变得越来越好。我确实认为构建一个支撑治理和信任管理的AI架构,包括保护、监管合规和企业政策在内的框架,有时你会想这是否已经成为基本要求。这只是你必须做的事情;否则,你如何跟上这一切?"
好文章,需要你的鼓励
加利福尼亚大学和萨里大学研究团队开发了一种创新的AI系统,能够仅通过简单的手绘素描就在复杂照片中精确识别关键点。这项技术突破了传统机器学习需要大量同类数据的限制,实现了真正的跨模态学习。系统在动物关键点识别任务中达到了39%的准确率,超越现有方法约5个百分点,并且在真实手绘素描测试中表现稳定。该技术有望在生物学研究、医疗诊断、工业检测等多个领域找到广泛应用。
AI系统正变得越来越善于识别用户偏好和习惯,像贴心服务员一样定制回应以取悦、说服或保持用户注意力。然而这种看似无害的个性化调整正在悄然改变现实:每个人接收到的现实版本变得越来越独特化。这种认知漂移使人们逐渐偏离共同的知识基础,走向各自的现实世界。AI个性化不仅服务于我们的需求,更开始重塑这些需求,威胁社会凝聚力和稳定性。当真相本身开始适应观察者时,它变得脆弱且易变。
约翰霍普金斯大学发布DOTRESIZE技术,通过最优传输理论实现AI大模型智能压缩。该方法将相似神经元合并而非删除,在保持性能的同时显著降低计算成本。实验显示,压缩20%后模型仍保持98%性能,为AI技术普及和可持续发展提供新路径。