在7月6日举办的昇腾人工智能产业高峰论坛 2023 上,中国科学院院士、清华大学计算机系教授、清华大学人工智能研究院名誉院长张钹院士被聘请为昇腾荣誉顾问。现场华为轮值董事长胡厚崑先生为张钹院士颁发昇腾荣誉顾问聘请证书及奖杯。张钹院士可以说是中国人工智能领域的奠基人,分享了他对人工智能发展的深度思考。他认为Chat GPT的出现,让人工智能通用理论形成成为可能,只有理论的支撑,AI才能实现革命性发展;同时他认为通用人工智能的三要素数据、算力和算法,应该升级为四个要素,分别是知识、数据、算法和算力。
以下是演讲内容:
张钹:各位专家、各位嘉宾、大家好!非常高兴被聘请为昇腾 AI 的荣誉顾问,这可能是对人工智能工作者的一种鼓励,我觉得人工智能工作者需要鼓励, 因为人工智能是闯无人区非常艰难,大家不要认为人工智能取得的每一个进步都是那么容易的,都是非常困难的。
首先,我想谈一个问题,怎么样估计 Chat GPT 有两种说法,首先一种说法是 Chat GPT 是通用人工智能,还有一种说法它不是通用人工智能,哪个对呢? 我的观点是哪个都不对,哪个都不对。怎么样估计 Chat GPT 的成果呢?我认为最恰当的估计是向通用人工智能迈出一步。按照微软的说法是通用人工智能的火花,我赞成这种观点。
为什么呢?首先先看一下 Chat GPT 具有通用人工智能的两个特征,头一个 特征是在对话和聊天这个领域,它达到了人工智能的目标,或者是达到了行为主 义主张的人工智能的目标。行为主义人工智能是人工智能的主流,背后的哲学是 唯物主义、实用主义。它追求的人工智能目标是什么?使得机器的行为跟人类的 行为相似,所以为什么说 Chat GPT 达到了这个指标呢?因为我们跟 Chat GPT 对 话的时候,和人类的对话很相近,因此它达到了头一个通用人工智能的特征。
第二个特征,Chat GPT 是开领域、多任务的,在对话这个问题里跟领域无 关,这是一个重大的突破。大家知道人工智能经历过第一代知识驱动,第二代数据驱动,都只能在限定领域里面完成单个任务。所以 Chat GPT 就变成开领域, 走向通用。作这两个特征之上,通用人工智能这个最重要的两个特征之上,一个 达到人类水平,一个跟领域无关。所以,我们可以说它是通用人工智能。但是因 为它只是在对话,或者讲得宽一点,是在语言处理这个领域里面达到这个目标, 所以我们还不能把它称作通用人工智能,因为在别的智能领域里面,它是不是能 通用呢?现在还说不清楚,所以我觉得这样的估计是非常恰当的。我们只有在这样的估计情况之下,才能讨论下面的问题。
首先一个问题,Chat GPT 为什么能够达到现在这样的水平?甚至很多地方 使大家感到非常惊奇,主要由于人工智能经过六七十年的努力,在三个问题上实 现了突破,或者是三个关键技术的突破。
第一个技术,基于词嵌入的文本语意表示。
第二个技术,是大家非常熟悉的转换器,就是基于注意机制的转换器,就是 刚刚高院士谈的大模型,我们现在说的大模型就是大转换器。
第三个技术,最后一个就是基于预测下一个词的自监督学习,我们应该说 Chat GPT 是经过人工智能领域里头或者是其他领域里头大量的科学家和工程师, 经过六七十年共同努力的结果,因为经过六七十年这三个问题才得到突破。这三 个问题的突破,使得机器在处理文本上起到了本质的变化,过去我们在处理文本 的时候,我们往往把它称作处理数据,到现在为止,大家还是用的这个词,但是 这个词在 Chat GPT 里头不成立。
因为 Chat GPT 是在我们找到了文本语意表示这个条件下再处理文本,所以 它处理的不是文本的形式,不是把文本当成数据来处理,而是把文本当成知识来 处理。 所以,Chat GPT 成功并不是仅仅归功于三个要素,也就是数据、算力和算 法,我觉得应该强调四个要素,分别是知识、数据、算法和算力。也就是说,我 们有三个关键技术的突破,就使得我们能够从大量的文本这里我们叫做数据,从大量的数据中间可以获取到知识,只有出现这个转变才有现在的 Chat GPT,不 然我们还是停留在那个认识上肯定是错的。
这个突破可能带来三件事情是不可阻挡的: 第一件事就是必然带来科技的革命,首先会带来人工智能本身的革命。大家知道人工智能发展到 Chat GPT 以前,我们不能说它是一个科学,为什么呢?它没有理论,人工智能为什么理论建立不起来?非常重要的原因我们在第一代人工智能做的知识驱动也好,第二代人工智能做的数据驱动也好,我们都是在限定领 域中完成单个任务。你在单领域单任务里面不可能建立一个通用理论。Chat GPT 扫除了这个障碍,至少在自然语言处理上扫除了这个障碍,因为它跟领域无关。 一旦跟领域脱钩了,你才有可能建立起来它的通用理论。
所以,现在去建立人工智能理论是有可能的,在 Chat GPT 没出现以前,这种可能性不存在。所以,这个问题对我们来讲是一个激励。什么是突破口呢?突破口就是 Chat GPT,如果我们没把 Chat GPT 内部的工作原理搞清楚,我们就找不到进入人工智能理论的钥匙。 大家想一想 Chat GPT 里面很多现象,我们说不清楚,但是一方面它能够生 成一个非常出人意料非常好的结果,它同时又会出现幻觉,什么是幻觉呢?就是 胡说八道。所以,为什么会出现这个现象呢?这个根本不清楚,所以头一个必然会迎来的科技的革命,首先这个革命会从 AI 本身开始。
第二个事情,大家讨论得非常多,就是产业的变革。首先是人工智能产业本 身的产业变革,大家知道人工智能产业的发展跟信息技术的产业发展是非常不一 样的,信息科技的发展,我们可以用 4 个字来形容“高速持续”但是人工智能产业的发展是“缓慢曲折”,什么原因呢?一个最重要的原因就是信息科技从一开 始理论就建立起来了,计算机的理论是 1936 年建立的,通讯理论是 1948 年建立 的,所以它在理论指导下,它的技术和它的产业发展都非常顺利。
人工智能只有算法和模型,而且这些算法和模型都是领域限定和任务限定的, 所以你开发出来的所有人工智能的硬件或软件全是专用的,跟信息产业完全不同, 信息产业的所有硬件和软件全是通用的,市场非常之大,而信息产业的硬件或软 件通常是专用的,都是跟领域紧密结合的,信息产业不跟领域结合根本不可能有 这个产业,但是拿计算机来讲,完全不跟应用结合,它生产出来的计算机什么地方都能用。
但是有了 Chat GPT 之后,告诉大家人工智能有可能建立一个跟领域无关的模型和算法,只有这个算法和模型摆脱了领域的限制,你将来生产出来的硬件和 软件才会是通用的,或者是一定范围里头通用的,你才有很大的市场。这就是今后信息产业革命的一个方向。
第三个事情,人工智能治理。Chat GPT 大家看正面得比较多,其实反面的东西也很成问题,因为我们用的方法是叫预测下一个词,这种模式的学习,必然带来两个大问题: 首先,它的结果不确定,受提示词的影响极大,这就影响 Chat GPT 输出有三个不可避免的缺点:
第一个缺点,错误是必然的。所以我们说的那个胡说八道是必然的。
第二个缺点,它的输出非常受输入的影响,受提示词的影响,所以它的输出不主观的,问同样的问题改变输入就会得到一个完全不同的结果。
第三个缺点,它不知道自己错了,错了也改不了,必须依靠后面刚刚高院士也提到了 AI 对齐等等。我到现在问 Chat GPT,我问它清华大学校歌的歌词是什么?它自己编了一套,我一年多我以前就这么问它,它到现在还这样,我说不对,清华大学校歌不是你这样的,应该是“西山苍苍东海茫茫”,我把这个歌词唱给它,它马上回复说对不起我说错了,清华大学歌词应该是这个,我退出来再进去, 问它清华大学的校歌是什么?它又自己编了一套,说明它不知道自己错了,告诉了它错误它也改不过来。
想一想,这些情况说明 Chat GPT 的输出往往不会符合我们的要求,我们的 道德、伦理、政治的要求。所以 Chat GPT 出现以后,人工智能的治理是不可避 免的,我认为这三个趋势一定是这样的。
我们怎么办呢?我觉得我们是主张要发展第三代人工智能,这个第三代人工 智能包含了三个内容,一个内容就是要建立可解释鲁棒的人工智能理论。Chat GPT 出现以后建立这个理论才成为可能,过去实际上是不可能建立的。 第二个内容,发展安全、可信、可控、可靠、可拓展的人工智能技术,只有 建立了这个理论之后,我们才有可能得到一个安全的人工智能技术。换句话说, 现在的人工智能技术是不安全的,不可靠的,也是不可信的。特别是利用大数据 的机器学习,结果一定是这样的。最后才能推动产业化的创新应用和产业发展。 我相信通过国家全国的规划,通过产学研的结合,我觉得我们这个目标一定会达 到的。 谢谢大家
好文章,需要你的鼓励
Intermedia 推出业内首个将统一通信和客户体验功能完全嵌入微软 Teams 的服务。这项创新不仅提升了 Teams 用户的生产力,还改善了客户体验。新功能支持多渠道通信、企业级通话功能和 AI 分析,为企业提供了一个强大的通信和客户体验平台。
Komprise 推出了 AI 驱动的数据管道,可自动检测和保护个人隐私信息 (PII)。这项新功能旨在帮助企业防止 PII 和其他敏感数据泄露,应对非结构化数据增长和生成式 AI 带来的风险。通过系统化方法减少敏感数据风险,提升网络安全和 AI 数据治理能力。
Oumi PBC公司宣布推出全球首个"无条件开放的AI平台",旨在通过提供开放访问基础模型、数据集和开发工具,创建协作式AI研发生态系统。该平台支持从1000万到4050亿参数的模型训练,适用于文本和多模态模型,并集成了多种流行的推理引擎。Oumi致力于打破当前AI研究领域的创新壁垒,加速AI领域的进展和发现。
阿里云发布最新大语言模型 Qwen 2.5-Max,声称性能超越当前最强 AI 模型。该模型采用专家混合架构,经过 20 万亿 token 预训练和后续强化学习,在多项基准测试中超越 DeepSeek-V3 等模型。Qwen 2.5-Max 目前通过阿里云 API 提供服务,但尚未开源。