12月13日,阿里云计算平台负责人贾扬清在Flink Forward Asia 2020峰会上指出,拥抱“融合”是大数据演进的新方向,大数据和人工智能一体化是必然趋势,而人工智能是大数据业务发展的终极出口。同时,他从不同角度讨论了Flink的开源技术,以及云时代下开源技术的发展和未来思考。
Flink开源社区 “渐入佳境”
从一个普通开源技术爱好者视角,贾扬清将2020年Flink发展定义为“渐入佳境”,主要体现在三大方面:
● 技术。今年Flink在技术方面取得两大新突破:一是Flink流批一体技术在阿里双11核心数据业务场景规模化成功应用; 二是Flink实时计算峰值首次突破40亿条/秒。同比去年,不增加集群规模情况下提升了一倍的计算性能。
● 应用。Flink不再是一个居庙堂之高的技术,而是成为开源流式处理的事实标准,飞入“寻常百姓家”。比如中国信通院使用了Flink作为技术蓝本设计流式处理标准,云计算公司包括阿里云等均使用Flink作为流式处理的底层引擎。
● 社群。Flink开源社区高速增长,登顶Apache最活跃的邮件列表; Flink项目是Github提交次数最多的Apache顶级项目之一。去年Flink Forward Asia 参会人数达2000人,Flink 极客挑战赛吸引了4000+开发者参与;今年大会切换到线上、线下同时举办,Flink 极客挑战赛的颁奖更让大家看到了越来越多开发者对于开源技术的热情以及勇于挑战的精神。

开源让云更标准化
贾扬清认为:开源让云更标准化。他提到,云计算越来越趋于标准化对其自身发展非常有利。云上大量的开发技术体系日趋一致,这意味着大量云计算开发者熟悉这套体系后更容易把自己的应用变成云的一部分。
开源有助于阿里云打破自有技术体系,在充分尊重用户原有使用习惯基础上,形成标准、开放、公共的技术体系。单靠一家公司去制定标准非常难。
阿里云对于开源意味着什么?贾扬清提到以下三点:
● 从组织来看,去年阿里巴巴集团成立开源技术委员会,从集团层面统一梳理和推进阿里巴巴开源技术战略的执行。
● 从参与度来看,阿里巴巴集团一开始就广泛采用开源技术构建自己的技术体系。以阿里云计算平台事业部大数据产品为例,比如实时计算 Flink都在大量使用Hadoop/K8S生态的技术;机器学习PAI同样使用TensorFlow等开源深度学习框架。
● 从贡献度来看,阿里巴巴集团持续为开源社区贡献力量。以Flink技术社区为例,仅去年一年阿里云就贡献百万行代码给Apache Flink社区。当前,集团开源项目数已超过1000个,覆盖大数据、AI、云原生、数据库、中间件、硬件等多个领域,全世界有70多万开发者为阿里点亮GitHub Star,成千上万的爱好者参与到项目贡献之中。
拥抱“融合”是大数据演进的新方向
贾扬清表示,云的三大发展趋势主要是IT基础设施的云化、核心技术的互联网化、应用的数据化和智能化,这也是云的核心价值所在。
企业在IT上云和业务互联网化之后,其应用必将从流程驱动变为数据智能驱动,实现数据化和智能化。云计算、底层IaaS技术在比拼基础设施的成熟度、稳定性和价格,而上层PaaS技术要比的是数据能力、智能能力。
目前包括数据库、IOT等泛大数据仍然处于大数据最基础的使用方式,需要整合更多大数据和AI能力。

所以,拥抱“融合”是大数据演进的新方向,大数据+人工智能一体化是大数据发展的必然方向,而人工智能是大数据业务发展的终极出口 。
只有AI化,大数据才能发挥真正的业务价值。阿里云大数据之所以有核心竞争力,就是因为大数据是结合AI能力的大数据,是智能化升级的大数据。比如Flink+Alink,Flink不仅能够提供流批一体的处理能力,还能借助已开源的Alink机器学习算法库,实现Flink的大数据+人工智能一体化。
未来,社会经济将与互联网更加融合,企业机构的业务也将全面转变为互联网业务。一个企业仅仅有IT基础设施并不够,企业应用也将实现从流程驱动变为数据智能驱动,阿里云计算平台将输出全栈大数据技术能力,并提供全球顶尖的AI技术,一起实现数据化和智能化。
好文章,需要你的鼓励
在技术快速发展的时代,保护关键系统越来越依赖AI、自动化和行为分析。数据显示,2024年95%的数据泄露源于人为错误,64%的网络事件由员工失误造成。虽然先进的网络防御技术不断发展,但人类判断仍是最薄弱环节。网络韧性不仅是技术挑战,更是人员和战略需求。建立真正的韧性需要机器精确性与人类判断力的结合,将信任视为战略基础设施的关键要素,并将网络韧性提升为国家安全的核心组成部分。
南洋理工大学团队开发了Uni-MMMU基准测试,专门评估AI模型的理解与生成协同能力。该基准包含八个精心设计的任务,要求AI像人类一样"边看边想边画"来解决复杂问题。研究发现当前AI模型在这种协同任务上表现不平衡,生成能力是主要瓶颈,但协同工作确实能提升问题解决效果,为开发更智能的AI助手指明了方向。
自计算机诞生以来,人们就担心机器会背叛创造者。近期AI事件包括数据泄露、自主破坏行为和系统追求错误目标,暴露了当前安全控制的弱点。然而这种结果并非不可避免。AI由人类构建,用我们的数据训练,在我们设计的硬件上运行。人类主导权仍是决定因素,责任仍在我们。
360 AI Research团队发布的FG-CLIP 2是一个突破性的双语精细视觉语言对齐模型,能够同时处理中英文并进行精细的图像理解。该模型通过两阶段训练策略和多目标联合优化,在29个数据集的8类任务中均达到最先进性能,特别创新了文本内模态对比损失机制。团队还构建了首个中文多模态评测基准,填补了该领域空白,为智能商务、安防监控、医疗影像等应用开辟新可能。