1、分布式存储定义
分布式存储是基于分布式架构,由多个软硬协同的存储节点组成并通过网络互联提供存储服务的系统;相比于传统存储,分布式存储将数据分散在多个相对独立的存储节点上,通过增加节点实现性能和容量的横向扩展,利用多节点数据冗余保障数据可靠性。分布式存储可提供 EB 级以上的存储空间,适用于海量数据的存储场景,如虚拟化/云计算、高性能计算、大数据分析、海量数据备份归档等。
3、中国分布式存储产业规模
根据中国信息通信研究院和分布式存储产业方阵的市场调研及分析,2021年中国分布式存储市场规模达到 178 亿元,年增长率达到 44%,高于中国企业级外置存储的 25%增长速度,预计未来 3 年中国分布式存储市场规模仍将保持40%以上的年增长。
2022 年,中国的分布式存储市场规模预计为 205 亿元,年复合增长率达到15%。其中,软硬一体的存储解决方案占据了市场的 91.3%,主要是满足 A 大型模型和大数据湖等场景下的非结构化数据需求。

4、分布式存储市场结构
2022 年,我国分布式存储市场中,分布式文件存储市场规模为 46.5 亿元,占比 44.63%;分布式块存储市场规模为 33.1 亿元,占比 31.77%;分布式对象存储市场规模为 24.6 亿元,占比 23.61%。整体来看,分布式文件存储凭借其对各类应用的强大兼容性,优势地位逐渐明显;分布式块存储的稳定性较高;而分布式对象存储的成本偏高,有待进一步优化。

5、中国分布式存储行业落地规模
根据 2020 年和 2021 年分布式存储在行业的市场空间观察可知,中国分布式存储市场 TOP5 行业是政府、电信、金融、教育和制造,TOP5 行业的份额占比达 73%。在电信、金融、制造、交通等行业数字化进程快的行业保持高速增长趋势。

6、中国分布式存储细分场景规模
根据中国信息通信研究院和分布式存储产业方阵的市场调研及分析,分布式存储应用分为九大场景。

其中虚拟化/云计算、电子票据影像、医疗影像非线性编辑是分布式存储的传统应用场景。受益于行业数字转型加速,分布式存储在虚拟化/云计算场景应用保持增长,在高性能计算、大数据分析等非结构化数据应用场景保持高速增长。2021 年,高性能计算场景应用增长率达 130%,大数据分析场景应用增长率达 105%,预计未来 3 年仍将呈现高速增长趋势。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。