5月8日,夸克升级AI超级框,全新发布“深度搜索”产品,通过深度思考能力、智能检索技术和精准回答功能,为用户“高搜商”地解决多样化复杂问题。作为阿里巴巴AI旗舰应用,夸克AI超级框同时迭代“图片智能处理”功能,持续刷新AI全能助手的用户体验和能力边界。
随着AI能力提升,很多出现在生活中的复杂问题有了全新解法。基于阿里自研的推理大模型和夸克每天处理数十亿次的搜索请求,夸克 “深度搜索” 拥有超高的“搜商”。首先,它能够深入分析用户提出的复杂问题,逐步分析问题并进行充分地思考,从而提炼出关键信息和真实意图。
其次,“深度搜索”采用“先思考,再检索”的全新方式。它会去全网检索和匹配优质信息源,精读数百个页面中的核心信息,根据情况调用不同的Agent,使搜索结果的内容更加深入和全面。
最终,“深度搜索”能把关键内容和跨领域知识进行深度融合,生成一份精确、可靠的详细解释和解决方案。尤其在日常生活、旅游规划、医疗健康、学习教育等领域中,进一步帮助用户解决实际问题,显著降低用户决策成本。
以搜索“男生,体重85kg,身高180cm,可通过运动+改善饮食进行减肥,请给出一份6个月内减到75kg的详细减肥计划”为例,“深度搜索”会调用健康Agent-阿夸,输出一份非常专业的减肥计划,包括减重目标、饮食计划、运动计划、生活习惯调整、分阶段执行计划和注意事项等核心内容。
此外,夸克AI超级框还升级“图片智能处理”功能。在编辑创作方面,用户可以用对话的方式实现去路人、换穿搭和改表情等特色功能,轻松拯救废片。在图片创作功能上,用户能以图生图,将一幅普通风景照转变为动漫、油画等风格的艺术照,把优质内容进行二次创作。
华创证券最新研报指出,随着阿里巴巴对AI领域的持续加码,夸克有望成为国民级的“AI 超级入口”。苹果App Store数据显示,夸克在近期接连登顶中国港澳台及新加坡App Store免费榜及工具榜榜首,成为华语圈最受欢迎的AI应用之一。
夸克搜索负责人张帆表示:“夸克AI超级框将坚持以用户需求为中心,持续优化具备高搜商能力的‘深度搜索’,同时拓展更多元的应用场景和多模态能力,让夸克成为有用的AI全能助手。”据悉,夸克还将推出思考能力更强、调用Agent更多以及能提供专业报告的新产品,其能力可以比肩全球顶尖的DeepResearch产品。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。