最近,Gartner发布了我们存储人士必看的一个报告《Hype Cycle for Storage Technologies, 2024》,我今天就和大家简单过一下。
英文报告原文,大家可以扫描上面的二维码阅读,可以利用微信的全文翻译功能辅助阅读。
今年的报告,和以前不同,把数据保护的技术成熟度曲线单列了,只剩下存储的,这是最大的不同。
这个是最终的存储技术成熟度曲线,我们看到,我原来预计超融合走向成熟,今年会离开这个曲线,但是Gartner还是保留了超融合,还是在最右边的位置。可能Gartner认为HCI还不够成熟吧。
从技术优先级矩阵看,今年变革性的技术,除了软件定义存储SDS外,还多了一个分布式混合基础设施。这是今年新引入的一个技术,我们来看看分析师的分析。
分布式混合基础设施
分析人:Julia Palmer、Philip Dawson作者:朱莉娅-帕尔默、菲利普-道森
效益评级:变革性
市场渗透率:5% 至 20% 的目标受众
成熟度早期主流
定义
Gartner 将分布式混合基础架构 (DHI) 定义为可提供云原生属性的产品,这些属性可根据客户的偏好进行部署和操作 - 在内部、边缘或公共云中。DHI 为在分布式环境中部署应用建立了基础设施框架,同时坚持以云为中心的方法。这增强了工作负载在公共云基础设施范围之外的敏捷性和灵活性。
为何重要
DHI 市场的出现是为了满足基础设施和运营 (I&O) 领导者的需求,他们正在寻找能够适应各种部署方案的标准化基础设施平台。DHI 解决方案吸引了需要云基础设施即服务(IaaS)解决方案的客户,包括计算资源(虚拟机 [VM]、裸机或容器)、存储和网络服务,而无需平台即服务(PaaS)产品。
业务影响
DHI 解决方案为基础设施调配提供了一种多功能方法,使企业能够充分利用类似云基础设施的优势,同时保持对部署位置的控制,避免依赖特定的云平台或 PaaS 产品。
驱动因素
DHI 解决方案的一个主要特点是其部署选项的灵活性。客户可以根据自己的喜好,在内部、公共云环境或边缘实施这些解决方案。这种灵活性使企业能够定制其基础设施部署,以满足特定要求,无论是与数据主权、延迟问题还是合规性相关的要求。
DHI 通过提供云运营模式的优势,以及在不同部署场景和使用案例中提供更高的一致性和可用性,解决了传统内部部署基础设施的限制。DHI 最突出的使用案例包括混合云基础设施、多云、云原生应用、边缘和保证工作负载。
障碍
要有效利用 DHI 的优势,企业必须克服一些障碍。这些障碍包括解决技能差距的复杂性、管理多样化环境、互操作性挑战、安全问题、成本管理问题、性能和延迟考虑、治理和合规性要求以及供应商锁定风险。
采用 DHI 的另一个障碍是,人们普遍倾向于采用集成的 IaaS 和 PaaS 解决方案,即所有服务都纵向集成并配备 API。
要解决这些障碍,就必须进行战略规划,实施适当的技术和工具,并持续监控和优化,以有效管理 DHI。
用户建议
评估首选的技术途径--是将公共云从云中分离出来,还是将企业内部基础设施纳入云中。为每种方案制定高级使用案例,并评估它们与贵组织采用云技术和内部部署 IT 基础架构的战略目标的一致性。
通过制定全面的使用案例,列出所需的基本服务和兼容性标准,编制一份 DHI 提供商短名单。确保这些要求充分反映贵组织的需求和目标。
根据详细的使用案例,划定一系列功能和非功能要求,执行功能试点或概念验证(POC)。利用试点或 POC 验证应用程序接口的一致性,并确保供应商保证维护与现有系统的兼容性。
供应商示例
阿里巴巴云、亚马逊网络服务、博通、华为、IBM、微软、Nutanix、甲骨文、腾讯
这个技术,大部分是从公有云向企业延伸,如AWS;也有从企业向公有云延伸的,如Nutanix。西瓜哥感觉和混和云技术有点类似。
这个就是Gartner发布的首个独立的备份和数据保护技术成熟度曲线,可惜这个报告我暂时还没有找到原文链接,如果大家有,可以在留言里发给我,方便其他读者学习。
由于计算存储(Computational storage )的复杂性、实用性有限以及在行业中缺乏采用,它已从技术成熟度曲线中剔除。这个非常可惜,不知道对ScaleFlux这些计算型存储厂商,是否会有所影响?
此外,Gartner 今年还推出了五种新的配置文件:分布式混合基础架构、冷存储、基础架构消费服务、自研 NVMe SSD 和企业存储平台(distributed hybrid infrastructure, cold storage, infrastructure consumption services, captive NVMe SSD and enterprise storage platforms).
报告中还提到,2024 年技术成熟度曲线中评估的技术中,超过一半将在未来五年内成熟,65%的技术有潜力带来巨大收益。
2024 年,Gartner 观察到某些技术在市场上获得了极大的关注。这些技术解决了混合云、容器支持、数据管理和即服务产品等重要趋势。老牌和新兴技术提供商都通过引入创新技术、服务和商业模式在塑造存储市场方面发挥了作用,这些创新技术、服务和商业模式允许在边缘和公共云等不同位置实现存储功能。其中一些创新侧重于网络安全、可持续性和支持生成式 AI 等新工作负载。
该领域值得注意的快速发展的技术包括网络存储、存储即服务和数据存储管理服务(cyberstorage, storage as a service and data storage management services )。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。