Grok,来自 Elon Musk 的 AI 公司 xAI 的聊天机器人,如今新增了一款类似画布的功能,用于编辑和创建文档及基本应用程序。
这项功能名为 Grok Studio,于周二晚间在 X 平台上发布。Grok Studio 现已面向在 Grok.com 上注册的免费及付费用户开放。
官方 Grok 账号在 X 平台上写道:“现在,Grok 不仅可以生成文档,还能生成代码、报告和浏览器游戏。Grok Studio 会在一个独立窗口中打开您的内容,从而让您和 Grok 可以共同协作完成内容。”
今日,我们发布了 Grok Studio 的首个版本,新增了代码执行功能和 Google Drive 支持。
Grok Studio:Grok 现可生成文档、代码、报告和浏览器游戏。Grok Studio 会在一个独立的窗口中打开您的内容,从而让您和 Grok …… pic.twitter.com/lyQh06F8eP
— Grok (@grok) 2025年4月16日
Grok 只是最新获得专用工作空间以便调试软件和撰写项目的聊天机器人而已。OpenAI 在十月推出了针对 ChatGPT 的类似功能 Canvas。而 Anthropic 则是最早推出相应功能(Artifacts 用于 Claude)的公司之一。
Grok Studio 在实质上似乎与此前的类似画布工具并无太大差异。它可以让您预览 HTML 代码片段,并运行 Python、C++ 和 JavaScript 等代码。所有内容均会在 Grok 回答的右侧以窗口形式打开。
此外,今日宣布的另一个 Grok 升级——与 Google Drive 的整合,或将使 Grok Studio 的功能更加强大。如今,您可以将 Google Drive 账户中的文件附加到 Grok 的提示中。根据 xAI 的介绍,Grok 可以处理文档、电子表格和幻灯片等文件。
好文章,需要你的鼓励
本文探讨了一种防范通用人工智能(AGI)和人工超级智能(ASI)存在性风险的方法:将它们置于计算机仿真世界中进行测试。虽然这种方法看似合理,但存在诸多挑战。AGI可能会隐藏恶意行为,或因被欺骗而转向恶意。此外,仿真环境可能无法完全模拟真实世界,导致测试结果不准确。构建高质量仿真系统的成本和技术难度也不容忽视。文章认为,仿真测试虽有价值,但并非万能解决方案。
这项研究关注语音中的句子强调(即说话时对特定词的重音),它能传达说话者的潜在意图。耶路撒冷希伯来大学的研究团队发现,尽管现代语音语言模型进步显著,它们在理解句子强调方面表现不佳。团队创建了StressTest基准测试和Stress-17k合成数据集,并开发了StresSLM模型,使强调理解能力大幅提升。研究表明,通过特定训练策略,可以让AI不仅理解"说了什么",还能理解"怎么说的",从而捕捉人类交流中的微妙含义。
尽管AI在围棋等复杂游戏中表现出色,但在简单的井字棋游戏中却屡屡失败。研究显示,AI代理在模拟商业环境中的表现同样令人失望,经常出现幻觉、欺骗和任务未完成等问题。游戏测试为评估AI能力提供了直观方式,帮助普通用户理解AI的真实水平。面对当前AI行业的过度宣传,通过游戏化测试揭示AI的实际局限性,对于防范AI泡沫具有重要意义。
ViStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20多种方法,发现UNO在开源方法中表现最佳,而商业软件如豆包和GPT-4o在提示一致性方面表现突出。该基准为故事可视化研究提供了统一标准,推动这一领域的创新发展。