Quora 旗下的 Poe 平台整合了多个 AI 模型,最近推出了一项新功能,允许用户在任意组合的模型之上构建可视化界面,也就是应用程序。
这项名为 Poe Apps 的功能让用户可以在新的 App Creator 工具中描述他们想要创建的应用。用户可以在描述中指定希望应用使用的特定模型 (例如 OpenAI 的 o3-mini 或 Google 的视频生成模型 Veo 2),也可以提供更广泛、更一般的规格说明。
App Creator 工具由 Anthropic 最近发布的 Claude 3.7 Sonnet 驱动,可以将描述转换为应用界面代码以及用 JavaScript 表达的自定义逻辑。Poe Apps 可以与 Poe 的聊天机器人窗口并排运行,也可以完全以可视化方式呈现,其底层代码对外开放,可以进行手动调整和微调。
Quora 创建了一些示例应用,包括一个使用 OpenAI 的 GPT-4o 和 Black Forest Labs 的 Flux-Pro-1.1 将照片转换为 3D 动漫风格艺术的应用。另一个示例应用则利用 Bria 的 Bria Eraser 模型从图像中移除不需要的对象。
目前 Poe Apps 只能在网页端与其他 Poe 用户分享 (Quora 表示 iOS 和 Android 支持即将推出)。每次应用使用 AI 模型时,都会消耗用户在 Poe 平台上的积分。免费用户每天都会获得一定的积分配额,而订阅 Poe 每月 5 美元高级会员的用户则可以获得灵活的每日或每月积分包。
在一篇博文中,Quora 提到 App Creator 目前以优惠的早期访问价格提供,并暗示了未来可能的应用变现选项。
公司写道:"这只是一个早期发布,我们还有很长的路要走,以给创作者更多的能力,包括直接从他们的应用中赚钱的能力。我们很期待看到大家会创造出什么。随着今年模型在编写代码方面不断进步,我们也很期待看到 Poe Apps 能变得多好。"
Poe Apps 是对去年 7 月推出的网页应用功能的扩展,与 Anthropic 的 Artifacts 和 OpenAI 的 ChatGPT Canvas 工具很相似:它们都是专门的工作空间,用户可以在其中编辑和添加 AI 生成的内容,如代码和文档。虽然这些工具能够生成的应用还比较有限,但它们确实展示了模型的编程能力已经取得了多大的进步。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。