今天,企业及IT从业者们对数据库的期望比以往任何时候都高,我们希望数据库必须以极高的效率运作的同时,还要向人工智能(AI)等创新应用敞开大门。出于这个原因,企业应该考虑一个既由人工智能赋能又为人工智能构建的数据库。它应该由人工智能驱动,以帮助提高优化和可用性;它同时还应该为人工智能而构建,以帮助开发人员和数据科学家能够利用最新技术来推动深入的洞察力。
有这样一个先驱示例的数据库是Db2 11.5,IBM已经正式宣布这个版本面市。由于其高可靠性、高弹性和高安全性,许多公司目前依赖于Db2来支持其任务关键型应用程序。IBM在这个新的版本中,添加机器学习(ML)和其他功能,将Db2转换为IT组织和开发人员所需的AI数据库。
由AI赋能
一个由人工智能驱动的数据库使企业能够更好地专注于增值任务。比起手动优化数据库以节约成本,ML(机器学习)可以帮助以更自动化的方式不断提高效率。人工智能还可以帮助用户更容易地获得洞察力。特别是,您可以更容易地使用在搜索功能或报表中使用自然语言。因此,用户可以将更多的时间花在发掘数据洞察上,而不是处理底层数据库。
认识到这一点,Db2 11.5将提供基于机器学习的优化器的技术预览。ML优化器将补充现有的基于成本的优化器,以进一步增强和改进性能。作为一个技术预览,它最初将着重于改进基数估计。另一个新的免费工具——增强数据浏览器(ADE)的技术预览版也将在DB211.5中提供。ADE使用自然语言查询、分面搜索和自然语言生成功能,使数据科学家、数据工程师和业务分析师能够轻松地探索存储在Db2中的数据。
为AI而生
使用人工智能优化数据库是不够的,开发人员还需要在他们的应用程序中轻松地利用人工智能。对流行语言和框架的支持能够节省时间,否则可能会浪费在寻找新的或专有的东西上。数据联合功能为人工智能模型打开了新的数据源。而且,访问用于AI应用程序开发的兼容代码模式意味着用户可以立即跳转到他们的项目中,更快地返回成品。
Db2 11.5提供了所有这些特性,它支持Python、Ruby、Go、Java、PHP、Node.js和sequentize的本地语言,并且支持流行的框架,如Visual Studio Code和Jupyter notebooks。Db2 11.5还将提供区块链联合支持,帮助应用程序开发人员直接从区块链源中提取数据,并将其与其他数据源结合起来用于分析或仪表板。此外,code patterns现在可以用来加速人工智能应用程序的开发。
便捷地升级
为了充分利用人工智能数据库的功能,组织必须选择适合其项目规模和范围的数据库, 这包括与公司一起轻松成长的能力, 这样做有助于确保他们拥有充分利用人工智能模型所需的存储和计算能力。
为了方便客户采用和升级部署,Db2最近将其版本整合为三个版本。用户可以免费使用community edition,它具有Db2的全部功能,包括高可用性、灾难恢复和pureScale。它可以作为本机安装、docker安装或云中的托管服务提供。然后,如果用户想增加内存、内核或数据库大小,他们可以升级到标准版或高级版。
其它性能
当他们添加新的人工智能功能时,企业不能忽视对传统的数据库功能(如弹性和性能)的需求。新的数据库已经改进了这些功能,超越了以前版本中已经令人印象深刻的功能。
例如,Db2 11.5对pureScale进行了增强,pureScale是一种高级集群功能,具有更好的弹性,包括:
•支持成员间当前提交的语义
•改进了群集范围的可用空间管理
•具有范围分区表的更好的加载/删除性能
•默认启用联机索引创建和范围声明
•安全功能增强
IBM对Db2进行了许多性能和可用性改进,包括:
•压缩增强
•内置空间支撑
•ETL优化
•额外的SIMD利用
•仓库查询优化
•对柱状引擎的LOB支持,通常称为BLU引擎
•支持4K扇区存储,有利于现代存储设备
•支持外部表,便于从Db2加载或归档数据
随着企业越来越善于管理和利用各种各样的数据,企业应该寻找利用他们的数据库采用和开发人工智能的方法。要做到这一点,需要一个使用人工智能来提高效率,同时支持人工智能应用程序的使用,可以很容易地升级,并具有高性能和高弹性。
作为人工智能数据库,是专门为满足所有这些需求而构建的,IBM并将继续更新其人工智能功能。有了这个新的愿景,IBM混合数据管理平台的核心组件Db2也将使客户能够加速他们的AI应用程序开发,同时自动化他们的一些数据管理。
来进一步探索Db2 11.5吧!
了解更多IBM AI解决方案,请访问IBM数据与人工智能专区http://www.zhiding.cn/special/IBM_2020_AI?from=article_c4_1
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。