Microsoft 正在为其 AI 聊天助手应用 Microsoft 365 Copilot 引入一款 "深度研究" AI 工具。
最近,多个聊天机器人都推出了深度研究代理,包括 OpenAI 的 ChatGPT、Google 的 Gemini 和 xAI 的 Grok。这些工具背后的支撑是所谓的推理 AI 模型,它们具备思考问题和自我事实核查的能力——这些能力对于开展深入研究而言至关重要。
Microsoft 推出的两个版本分别名为 Researcher 和 Analyst。
Researcher 结合了 OpenAI 的深度研究模型 (该模型也为 OpenAI 自家的 ChatGPT 深度研究工具提供支持) 以及 "高级编排" 和 "深度搜索功能"。Microsoft 表示,Researcher 可以执行多种分析任务,包括制定市场进入策略和为客户创建季度报告。
至于 Analyst,它基于 OpenAI 的 o3-mini 推理模型构建,Microsoft 称其 "针对高级数据分析进行了优化"。Analyst 通过迭代方式处理问题,通过多个步骤来完善其 "思考" 过程,并为查询提供详细答案。Microsoft 还表示,Analyst 可以运行 Python 编程语言来处理复杂的数据查询,并能够展示其 "工作" 过程以供检查。
与竞争对手相比,Microsoft 的深度研究工具的独特之处在于它们不仅能访问互联网数据,还能访问工作数据。例如,Researcher 可以通过第三方数据连接器从 Confluence、ServiceNow 和 Salesforce 等 AI "代理"、工具和应用程序中获取数据。
当然,真正的挑战在于确保 Researcher 和 Analyst 等工具不会产生幻觉或编造内容。包括 o3-mini 和深度研究模型在内的模型并非完美无缺;它们有时会出现错误引用、得出错误结论,并从可疑的公共网站获取信息来支持其推理。
Microsoft 正在推出一个新的 Frontier 计划,Microsoft 365 Copilot 用户可以通过该计划获取 Researcher 和 Analyst 的使用权限。从 4 月开始,注册 Frontier 计划的用户将率先体验到 Researcher 和 Analyst 等实验性 Copilot 功能。
好文章,需要你的鼓励
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
本文提出一种评估人工智能风险的新方法,借鉴生态学与演化论视角,从理论生态模型中推导出三项风险指标,涵盖种群模型与生态系统模型。研究旨在为AI治理策略提供量化工具,并对分析局限性及政策改进方向进行了深入探讨,为构建更科学的AI风险评估体系提供参考框架。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。