距离2024 AI创新者大会暨PEC·提示工程峰会顺利召开已经半月有余。
在这场大会上,我们邀请的近百位人工智能领域知名专家、学者、从业者,思辨的问题、表达的观点、形成的共识,对人工智能产业的影响依然在不断扩散。
据PEC•AI创新者大会组委会会后统计数据显示,2024 AI创新者大会暨PEC·提示工程峰会在会议当天吸引了超1300+位专业观众线下参会,超150万+人线上观看大会直播,媒体曝光量更是超过了800万+。
在现场观众中,超80%的观众为企业技术、产品、业务线管理者,以及开发者、工程师等一线从业者,CXO和创新企业管理者在其中占比超过25%,企业开发、技术管理者在其中占比超过20%。
大会当日,在以超级个体、落地场景、产品创收为主题的三大年度提问中,人工智能、提示工程的当下困境和未来图景逐渐清晰。
这近百位AI专家在大会上发表了哪些精彩观点?
让我们一起来回顾一下:
一句提示词,一个新世界。
中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃在大会上预言:
“正如快递员在电商时代连接商家与用户,提示工程师将在AI时代担任人类需求与机器智能之间的关键桥梁。”
人工智能将是未来全球产业升级的技术底色,提示工程师将会成长为未来社会产业结构中一个不可忽视的新兴群体。
这也是我们看到的未来,是我们在2024年年底举办这样一场AI大会的初心。
PEC China发起人、至顶科技CEO兼总编辑高飞表示:
“至顶科技长期关注技术的进步,当生成式AI出现后,新的AI进入公众视野时,我们意识到,这次我们不只要作为一个AI的报道者,还要成为一个AI产业的推动者,怀着这个目的,我们与软积木一同筹办了这场大会。
在这个过程中,我们有幸遇到了软积木和百十余家社区、媒体等优秀的合作机构,也很荣幸能在这个时代参与到推动提示工程落地这项事业中,我们希望未来能够有更多伙伴加入到这一平台中,共同推动第四次工业革命浪潮。”
PEC China发起人&微软MVP&软积木CEO刘海峰表示:
“我们最早接触OpenAI ChatGPT时发现,ChatGPT用得好不好与提示词有很大关系,在全球有PEC这样一个组织关注这件事,我们觉得提示词是一个很好的工程,所以我们发起了提示词工程大会。
提示词不依赖于某个大模型,可以形成一个独特方法论,最重要的是,提示工程没有行业和专业限制,对提示词进行优化或掌握了相关方法后,应用者与大模型交互会得到很好的收益,很多人说大模型不好用,一个很重要的原因是提示词没写好,所以这件事我们会持续做下去。”
2024 AI创新者大会暨PEC·提示工程峰会是我们一个新的起点,会后,我们向与会嘉宾征集了他们的参会感受和对未来的期待。
其中,中国信通院人工智能研究所所长魏凯表示:
“在本届大会上,我切身感受到了提示词工程的热度,无论是开发者还是大模型研发公司都对提示词工程的发展给予了高度热情,这让我感受到了AI原生应用巨大的前景,更加坚定了我对我们国家人工智能发展的信心。”
钉钉副总裁、解决方案&战略客户部总经理邱达表示:
“我觉得这场大会办得特别好,希望可以通过这样的大会让越来越多的人用好提示词,用好大模型,积极拥抱人工智能。”
2025年,必将是又一个人工智能日新月异的一年。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。