数据库定义:核心基础软件
数据库处于IT架构的核心位置,向上支撑各类应用,大大降低了数据存储与处理的复杂性,向下负责调动计算、网络、存储等基础资源。
数据库产品按照其管理的数据结构,可分为关系型、非关系型(键值型、文档、图、时序等);按照设计架构,可分为集中式和分 布式数据库;按照部署模式,可分为本地数据库和云数据库;按照应用场景,可分为OLTP事务型数据库、OLAP分析型数据库、 HTAP混合型数据库;按照存储介质,可分为磁盘数据库和内存数据库。
数据库是信息时代的基石
一方面,非关系型数据库随着互联网、大数据的发展而发展,产品类型和数量不断丰富;另一方面,人类社会经济活动所依赖的重 要数据信息,如交易数据、储蓄数据、生产数据等,其表现形式和访问方法天然具有模式明确、关联清晰的特征,符合关系型数据 库的特点,并已形成基于关系型数据库的庞大信息技术生态。
据Gartner的数据,2022年全球数据库管理系统(DBMS)市场达到910亿美元,其中,关系型数据库市场份额为78%;2023年市场规 模将首次突破1000亿美元。
关系型与非关系型数据库交融,多模数据库成为技术趋势
目前关系型和非关系型数据库技术的交融已成为一种趋势,可支持多种数据模型的多模数据库技术应运而生。多模数据库发展呈现 两种形态,一是出现了多款原生的多模数据库系统,二是关系型数据库系统也陆续增加了对多模数据处理的支持。
许多厂商纷纷推出多模数据库方案,以提供更灵活、更强大的数据存储和处理方案,例如Oracle融合数据库集成了Oracle Graph作 功能,用户可进行实时图形分析,无需额外采用单独的图形数据库;达梦数据推出的新一代大型通用关系型数据库DM8(多模) 也具备文档类型、空间类型、对象类型的非关系型数据支持能力。
数据库发展技术趋势:人工智能快速发展,AI与数据库深度融合
AI for Database: AI在数据库结构设计、架构设计、数据分析挖掘等方面可以不同程度简化人员操作、提高开发、运维、分析的效 率,2023年Databricks将大型语言模型(LLMs)引入SQL和MLflow2.3,阿里巴巴开源了支持自然语言与SQL互相转换的数据库开发 工具Chat2DB。
Database for AI: 对于多模态数据存储和计算的需求随大语言模型的快速发展而增加,向量数据库可有效支持多模态数据的存储、 索引和查询,2023年除了Pinecone、Milvus等特化的向量数据库备受关注外,许多数据库厂商也开始在原有产品上拓展向量检索 能力。
国内数据库市场广阔,信创迎来中场关键节点
根据大数据技术标准推进委员会的测算,中国数据库市场规模将从2023年的522.4亿元,增至2028年的930.29亿元。
2022年9月,国资委下发79号文件,全面指导并要求国央企落实信息化系统的信创国产化改造,2027年底,国央企完成信息化系 统的信创改造工作,并制定了”2+8+N”的信创三步走战略:先党政,后覆盖金融、电信、电力、石油、交通、航空航天、教育、医 疗八大关键行业,最终将信创产品扩展到全行业;2023年12月,中国信息安全测评中心发布《安全可靠测评结果公告(2023年第 1号)》,公布安全可靠测评结果,包括多款操作系统、CPU和集中式数据库。
国内数据库市场广阔,信创迎来中场关键节点
根据第一新声调研,党政数据库国产替换率已达80%,基本完成国产数据库的应用系统改造和建设工作;八大行业的数据库与业务 紧密关联,迁移难度更高,导致国产替换率依然有较大提升空间,金融行业非核心系统数据库国产替换率约40%,能源行业国产替 换率不足15%,医疗、智造行业国产替换率不足5%。
好文章,需要你的鼓励
人工智能领域正在通过改进模型工作方式来释放新功能。研究人员开发了一种名为"SVDquant"的4位量化系统,可以使扩散模型运行速度提高3倍,同时提升图像质量和兼容性。这种技术通过压缩参数和激活值来大幅降低内存和处理需求,为资源受限的系统带来新的可能性。
Meta公司开发了一种机器学习模型SEAMLESSM4T,能够实现36种语言之间的近即时语音翻译。该模型采用创新方法,利用互联网音频片段避免了繁琐的数据标注。这一突破性技术有望简化多语言交流,但仍需解决噪音环境、口音等挑战,并关注技术可能带来的偏见问题。
生物制药行业正积极拥抱人工智能技术,大型企业投入巨资,小型公司谨慎布局。行业面临人才、数据和工作流程等挑战,但预计到2025年将在AI就绪度方面取得实质性进展。AI有望加速药物研发,提高效率,最终造福患者,重塑医疗保健的未来。
随着 AI 需求激增,数据中心行业面临严峻挑战。能源消耗激增威胁可持续发展目标,新项目遭遇公众反对。电力供应和分配方式亟需改革,行业或将迎来动荡的 2025 年。