Scale AI创始人兼首席执行官亚历山大·王(Alexandr Wang)参加了由SPC(South Park Commons)组织的访谈节目,在节目中,王分享了对中美人工智能竞赛的见解,并就下一代人工智能公司需要如何在竞争中取胜提出了具有启发性的意见。
王在访谈中表示,目前人工智能模型在单次提示响应方面展现出了相当不错的能力,能够较为准确和有效地对用户的单个问题或指令做出回应,为用户提供有价值的信息或解决方案。然而,一旦涉及到多轮交互的场景,其性能就会出现明显的下降,会出现前后回答不一致、逻辑连贯性变差等问题。这也要求模型公司需要着重提升模型的可靠性和内部连贯性,让模型在面对连续的交互时,能够始终如一地给出准确、合理且逻辑连贯的回答。另外,产品设计已成为阻碍人工智能技术全面推广的主要因素。现有的聊天模式使得其应用场景和用户体验都受到了较大的约束,若能够突破这种传统的聊天模式,将人工智能模型巧妙地融入到人们的基本工作流程之中,那将会开启一个全新的局面,为创业者带来前所未有的巨大机遇。
王提到,在人工智能模型发展的早期,行业内的竞争主要围绕着谁拥有更多的计算资源、更大的芯片集群。然而,随着技术的不断推进,实际情况发生了显著变化,如今,计算集群的规模在不断扩大,甚至已经达到了相当可观的程度,但数据的限制却愈发凸显。可用于训练模型的数据难以满足需求,模型的发展受到了极大的阻碍,当前模型的发展更多地依赖训练后的数据处理。为了确保模型的持续优化和进一步发展,数据生产必须与计算能力同步扩展,只有这样,才能使模型在性能和应用范围上不断取得突破,满足日益增长的人工智能应用需求。
在AI行业的创业建议方面,王表示,在当今的AI行业中,充满了各种各样的不确定性因素,与之相伴的是大量错误观点的泛滥。由于技术处于快速发展和变革阶段,许多概念和方向尚未完全清晰,导致整个行业像是一片迷雾笼罩的领域,在这样的环境下,各种未经证实的说法和片面的见解四处传播,使得创业者很容易陷入困惑和误导之中。创业者必须拥有独立思考的能力,不能仅仅依赖外界的声音和流行的趋势来做出决策。他们需要深入地自我剖析,并且坚定不移地依据这些信念去执行计划,才能在纷繁复杂的信息洪流中保持清醒,避免盲目地追随那些看似热门但实则缺乏根基的潮流。
同时,在AI领域竞争,筹集大量资金并非是取得成功的必然途径。对于大多数公司而言,更为重要的是构建一个能够长期盈利并且可持续发展的业务模式,这就要求企业注重创新,不断挖掘新的技术应用、产品功能或商业模式,从而在市场中脱颖而出。在这个过程中,要善于避开与那些资金雄厚的巨头企业进行正面的直接竞争。巨头企业往往拥有巨大的资金储备和广泛的资源网络,与之正面交锋很可能会使初创企业陷入劣势,相反,创业者应寻找巨头尚未充分关注或尚未形成垄断的细分市场或创新方向,逐步积累实力,实现稳健发展。
地缘政治对人工智能领域的影响方面,王表示,中国实验室Deepseak的模型性能已经与美国领先实验室达到了相当的水平。过去,美国在人工智能的研究和发展方面曾占据一定优势,但随着中国科研力量的不断投入和创新能力的提升,如今这种差距已不再明显。人工智能技术的全球采用情况将成为各方关注的焦点,其中,美国和中国在AI技术出口方面的竞争尤为激烈。两国都希望自己的AI技术能够在全球范围内得到更广泛的应用和推广,与此同时,世界各国在面对中美两大AI技术阵营时,需要谨慎权衡并做出对自己有利的AI技术栈选择。
此前,拜登政府针对芯片实施了严格的出口限制措施,然而,这也引发了一系列连锁反应,使得全球AI产业格局面临重新洗牌的可能。在未来的发展进程中,美国是否会继续维持这种强硬的出口控制立场,以及由此引发的中美之间相关谈判的走向,都充满了不确定性,特别是中国可能在2027年的行动,将进一步增加局势的紧迫性和复杂性。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。