微软人工智能首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)与《时代科技》节目(Times Techies)进行了独家互动,在互动中,苏莱曼表示,经过15年的持续进步,神经网络技术在预测复杂环境事件方面显示出了巨大的潜力,这不仅推动了技术的发展,也为人类提供了一个强大的辅助工具,他预见,随着成本的降低和技术的普及,人工智能将在未来几年内变得更加智能和个性化,成为教育、医疗和创意等领域的变革力量。
在讨论技术进步时,苏莱曼强调了神经网络在处理复杂问题和进行预测方面的能力。他指出,公众常常有一种误解,认为这些技术突破是突然之间出现的,好像它们是凭空出现的奇迹,实际上,这些技术进步建立在长达15年的持续改进基础之上。在这15年的时间里,技术的发展稳定而连续,每年都在专注于相同的几个目标:获取更多的数据、增强计算能力、进行更大规模的训练,并且坚持使用相同的核心架构。
他提到,这种核心架构,基于一个理念:利用神经网络来表示复杂的思想,神经网络能够捕捉和学习数据中的复杂模式,从而在各种预测任务中表现出色,这种预测能力是智能的一个主要技能,也是人类作为物种的一个显著特点。我们擅长预测未来可能发生的事情,并利用这些猜测进行创造性的干预,无论是在制造物理产品、编写软件、与人交流还是参与体育比赛,这种预测能力现在已经成为现实,神经网络和深度学习技术已被证明是一种通用且非常有效的方法,可以在非常复杂的环境下预测几乎任何事情,这种技术的发展和应用在实践中也取得了显著的成果,使得它成为了一个值得长期追求和投资的领域。
苏莱曼特别提到了AlphaGo作为一个重要的转折点。他认为,AlphaGo不仅是深度学习和人工智能领域的一个重要里程碑,而且它标志着大规模应用GPU的开始,在AlphaGo之前,人们并没有将单个GPU以这种方式完全连接起来,而AlphaGo的成功展示了这种连接方式的潜力,这为黄仁勋提供了灵感,确认了他对于GPU的长期投资是正确的方向。
他提到,黄仁勋早在2012年就看到了深度学习中的Cat neuron论文,这是第一次有人使用神经网络在YouTube上识别视频中的猫,展示了深度学习的能力,这种对大量数据的处理能力是现代人工智能技术的核心。例如,为了在视频流中识别出猫、狗或斑马,需要能够每秒进行数千甚至数万亿次的并行操作,以找到正确的像素组合,这种技术突破不仅在图像识别领域产生了影响,人们还开始意识到,同样的核心技术可以不断扩展和应用,也为创造更复杂、更有趣、更有创意的技术体验提供了可能。比如,这些模型能够实时生成新的音频,给人一种正在与真人进行对话的体验。他表示,这种技术的发展让他感到震撼,因为它不仅仅是技术上的一个进步,更是在用户体验上带来了革命性的变化,虽然他一直紧密关注着这些技术的发展,但当这些技术能够如此无缝地工作,并且变得自然而然时,他仍然感到惊讶。
在讨论人工智能的发展时,苏莱曼强调了“记忆”在人工智能中的重要性。他指出,当前的人工智能系统在每次与用户的交互中都像是一个新的会话,它们只能记住最近几次的对话内容,而无法回忆起更早之前的交流,这种局限性导致用户体验变得单调,因为用户不会深入分享信息或查询以往的对话内容。为了解决这个问题,他们正在开发具有近乎无限记忆的AI原型,这种能力使得AI能够提供更连贯、更个性化的支持和建议,从而极大地增强AI的实用性和用户的信任感。他预期,到2025年,这种具有无限记忆能力的AI将变得可用,尽管一开始可能会比较昂贵,但随着技术的发展和规模化生产,成本将会降低,最终普及到更广泛的用户群体中。
苏莱曼进一步讨论了成本下降的循环效应。他指出,随着技术成本的降低,越来越多的人能够负担得起并开始使用这些技术,这种增加的需求反过来又会推动技术成本的进一步下降。他以电视和相机为例,说明了一旦技术变得有用且一些人能够负担得起,就会形成一种自然的趋势,即每个人都希望拥有这项技术,当需求变得普遍时,规模经济就会起作用,从而进一步降低成本。他提到,目前他们提供的最好的模型在Azure平台上的成本已经是两年前的1%,在未来几年内,成本曲线将会更积极地下降,这种下降不仅仅是因为技术本身的改进,还因为随着更多人使用技术,可以收集到更多的数据和反馈。他强调,这种成本下降和技术使用的增加之间的反馈循环已经持续了一个世纪,到目前为止,更多的计算资源总是能够带来更多的价值,这使得技术更加准确、更容易控制,并且可以根据个人的风格进行调整,这种循环不仅推动了技术的进步,也使得技术更加普及,从而进一步降低了成本,形成了一个自我强化的正向循环。
苏莱曼强调了跨学科能力和多学科知识的重要性。他认为,未来的高影响力个体将能够掌握一系列不同的技术和社会语言,并在不同学科的交汇处发挥作用,虽然专业化仍然重要,但他认为必须将专业化与广度结合起来,因为现在我们生活在一个全对全信息交换的世界中。他观察到,许多年轻的在线创作者和社交媒体上的人在编程、使用新工具、创意设计、制作短片和音乐等方面都表现出色,他们之所以能够成为多学科的人才,是因为他们几乎可以实时地从其他人那里学习。这种全对全的连通性降低了获取工具的门槛,使得集体智能得以释放,人类物种的集体智能因此变得更加强大。他鼓励人们对技术的未来持开放态度,并拥抱跨学科合作的可能性,因为这将有助于在技术快速发展的今天,实现更广泛的创新和进步。
好文章,需要你的鼓励
人工智能领域正在通过改进模型工作方式来释放新功能。研究人员开发了一种名为"SVDquant"的4位量化系统,可以使扩散模型运行速度提高3倍,同时提升图像质量和兼容性。这种技术通过压缩参数和激活值来大幅降低内存和处理需求,为资源受限的系统带来新的可能性。
Meta公司开发了一种机器学习模型SEAMLESSM4T,能够实现36种语言之间的近即时语音翻译。该模型采用创新方法,利用互联网音频片段避免了繁琐的数据标注。这一突破性技术有望简化多语言交流,但仍需解决噪音环境、口音等挑战,并关注技术可能带来的偏见问题。
生物制药行业正积极拥抱人工智能技术,大型企业投入巨资,小型公司谨慎布局。行业面临人才、数据和工作流程等挑战,但预计到2025年将在AI就绪度方面取得实质性进展。AI有望加速药物研发,提高效率,最终造福患者,重塑医疗保健的未来。
随着 AI 需求激增,数据中心行业面临严峻挑战。能源消耗激增威胁可持续发展目标,新项目遭遇公众反对。电力供应和分配方式亟需改革,行业或将迎来动荡的 2025 年。