7月8日,第四届世界人工智能大会在上海召开。华为轮值董事长胡厚崑在开幕式发表演讲,主题为 “根深叶茂,共筑人工智能新生态”。胡厚崑强调:“只有基础打得牢,根技术扎得深,应用创新跑得快,才有人工智能产业的参天大树和生态的持续繁荣。”

AI正处于行业规模应用推广的关键时期
胡厚崑表示,AI的技术和应用,像春雨润物细无声一样在改变各行各业。以上海12345热线为例,这条热线的响应速度非常快,而且能回答的问题非常多。这是因为该热线系统自去年开始引入了人工智能技术,用到了如自动派单、语义识别,甚至有情绪感知等功能。有了这些技术加持,整个热线的服务速度加快了,过去派一张单要好几分钟的时间,现在几秒钟就搞定了。去年疫情期间,上海12345热线平均一个月要处理60多万单市民诉求,没有这种效率的提升是完全不可想象的。
除了效率提升,这条热线系统变得越来越智能,甚至可以主动预警风险事项,比如说寒潮来了以后哪些地方的水管会爆裂,它会提前做出预测,让城市管理部门做好预案,快速处理。得益于人工智能的加持,不仅是热线的服务效率和质量提升了,更让市民感受到了城市管理的温度。
去年以来,华为云联合数字政通等伙伴打造的12345政务热线智能感知平台、城市运行一网统管、城市综合管理服务平台、市域社会治理和城市级停车等多个解决方案,为智慧城市建设提供高水平服务。
6月18日的华为云TechWave全球技术峰会(人工智能&数据)期间,华为云还发布了城市智能中枢,通过打造一个城市AI开发运营平台,提供全域感知引擎、知识计算引擎、机器人引擎三大引擎,实现对城市状况的跨模态、跨部门协同以及全域精准感知,助力实现智能化城市治理和精准服务。
大胆运用技术手段,改变AI应用开发模式,突破AI普惠瓶颈
上海12345热线只是AI带来改变的一个例子。胡厚崑表示,当前,AI正处于行业规模应用推广的关键时期,从天上的云变成了地下的雨,改变每个行业。
在演讲中,胡厚崑代表华为就如何促进人工智能产业规模化发展,提了三条建议:第一,汇聚各方力量,大力发展以人工智能计算中心为代表的新型城市基础设施,让AI的算力像水和电一样,成为新型的城市公共资源,让智能触手可及。第二,技术要扎到根,根深才能叶茂。第三,大胆运用技术手段,改变AI应用开发模式,突破AI普惠瓶颈。
随着技术的不断发展,需求的持续涌现,当前应用开发效率成了最大的瓶颈,这严重阻碍了技术和需求的结合。现在业界AI开发高度依赖专家和数据,不仅需要花费大量时间收集和处理数据,还要消耗大量专家精力进行参数调优,很难在短时间内就达到产品化要求,这种模式被称作“手工作坊模式”。
华为认为要用技术手段去改变这样的开发方式,提高开发效率。超大规模预训练模型这项技术,有望解决这个难题。基于预训练大模型,开发者只需要少量行业数据就可以快速开发出精度更高、泛化能力更强的AI模型。这种工业化的AI开发新模式,将极大促进AI在产业的发展。
为了支持新的开发模式,今年华为云推出了盘古系列预训练大模型。华为云盘古系列大模型包含视觉(CV)、中文语言(NLP)、多模态、科学计算大模型,可以实现一个AI大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,并使用华为云一站式AI开发平台ModelArts,让AI开发由作坊式转变为工业化开发的新模式。
盘古NLP大模型具备广泛的运用场景,在金融领域,可以辅助识别企业风险,助力企业尽调和项目审核。在医疗方面,其强大的信息抽取能力,可以帮助科研人员和医生从海量文献中快速提取关键知识。
华为云盘古系列大模型还包括30亿参数的中国最大视觉(CV)预训练模型,其在多项公测任务评比中大幅领先,是目前各项泛化性能最优的预训练视觉大模型。截至目前,盘古CV大模型已经在医学影像、金融、工业质检等100余项实际任务中得到了验证,平均缩短开发时间 80% 以上,极大地提升了开发效率以及模型性能。
未来,华为云盘古大模型将上线华为云AI Gallery(AI资产共享社区),提供多种使用方式,降低人工智能的使用门槛,服务更广大的开发者群体。
胡厚崑表示,希望有更多的合作伙伴和企业能通过盘古大模型实现AI应用的快速开发,让AI普惠千行百业。
好文章,需要你的鼓励
滑铁卢大学研究团队开发出LOCKET技术,解决AI服务"按需付费"的商业化难题。该技术通过创新的"适配器融合"方式替代易泄露的密码验证,实现100%有效拒绝未授权功能,同时保持已授权功能性能损失不超过7%。面对恶意攻击的成功率控制在5%以下,为AI服务提供商提供了可行的精细化定价解决方案。
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
KAIST研究团队开发出Diffusion-Link技术,通过扩散模型解决AI系统中音频与文字信息的"沟通障碍"。该技术采用轻量级设计,无需外部知识即可将音频特征转换为文字特征,在音频字幕生成任务上取得突破性成果,零样本性能提升52.5%,为多模态AI系统发展开辟新路径。