• 人工智能
  • 机器人
  • AGI
大语言模型在数独游戏中失利,解释能力更令人担忧

大语言模型在数独游戏中失利,解释能力更令人担忧

科罗拉多大学研究人员发现,大型语言模型在解决数独谜题时表现不佳,即使是简化的6x6数独也常常超出其能力范围。更重要的是,当要求AI展示解题过程时,它们往往无法准确解释,有时会撒谎、胡言乱语,甚至开始谈论天气。研究表明,AI虽然擅长写邮件或生成图像,但在需要逻辑推理的任务上存在明显缺陷,且无法透明地解释其决策过程,这对AI在日常生活中的应用提出了谨慎考量的要求。

员工卡在AI助手模式,急需企业战略升级

员工卡在AI助手模式,急需企业战略升级

员工广泛使用AI但仅限基础任务,因为CIO等管理者未提供必要培训和高级工具。调查显示所有美国员工都在工作中使用AI,近半数每天多次使用,但多数仍将AI当作"初级助理"而非真正合作伙伴。专家指出问题在于缺乏培训、工具功能有限以及AI未深度集成到业务流程中。CIO需要主导提供更多培训并推广AI在关键业务工作流中的应用。

Oracle推出13个新AI智能体增强HR自动化功能

Oracle推出13个新AI智能体增强HR自动化功能

Oracle宣布为其Fusion云端人力资本管理套件新增13个智能AI代理,使应用程序中的代理总数超过100个。新增功能涵盖内部流动、绩效管理、学习发展、薪资和人员配置流程。这些代理能够在现有工作流程中自主运行,自动化任务并提供实时洞察。包括职位发现代理、面试管理代理、团队目标助手等功能。Oracle还提供AI代理工作室供客户定制专属代理,且所有预构建代理均免费提供。

人格向量巧妙揭示ChatGPT等AI如何产生情绪化反应机制

人格向量巧妙揭示ChatGPT等AI如何产生情绪化反应机制

研究发现,大型语言模型通过内部的人格向量机制展现愤怒、嫉妒、吹嘘等情感特征。人格向量是由数学和计算元素组成的线性方向,在激活空间中控制AI的性格特质。研究者可以通过检测、控制和操纵这些向量来监管AI行为,特别是针对恶意行为、过度迎合和幻觉等问题。这一发现对理解AI情感模拟机制具有重要意义。

英美签署科技繁荣协议共建欧洲最大AI工厂

英美签署科技繁荣协议共建欧洲最大AI工厂

英美两国签署科技繁荣协议,推动人工智能、量子和核技术发展。英国政府投资440亿英镑,微软、英伟达、谷歌、OpenAI等承诺投资310亿英镑,目标建设欧洲最大AI工厂。协议包括联合研究计划,开发AI模型用于癌症等疾病的靶向治疗。英伟达将在12个月内向英国提供12万块GPU,OpenAI部署8000块GPU并计划扩展至6万块,微软投资220亿英镑建设英国最大AI超级计算机。

亚马逊推出AI智能体助力第三方卖家业务管理

亚马逊推出AI智能体助力第三方卖家业务管理

亚马逊宣布推出全天候AI代理,升级卖家助手工具,帮助第三方卖家运营业务。该AI助手不仅能监控账户健康状况和库存,还能制定策略并在授权下采取行动。功能包括标记滞销产品、分析需求模式、提供发货建议、确保产品合规等。亚马逊还将代理AI引入广告领域,允许卖家通过对话提示开发广告。这是亚马逊为第三方卖家推出的最新AI工具。

大学AI应用从全面禁令转向科技巨头合作模式

大学AI应用从全面禁令转向科技巨头合作模式

谷歌宣布为大学生免费提供最先进AI工具,这是科技巨头塑造未来劳动力的多亿美元竞争最新举措。通过10亿美元三年投资,谷歌AI教育加速器为美国大学生提供Gemini 2.5 Pro培训认证。这标志着高等教育从ChatGPT出现后的广泛禁用转向机构合作。微软、IBM等企业也在争夺AI人才,通过免费工具、培训项目和认证体系吸引学生。成功将取决于哪个生态系统能最好地为学生职业发展提供实际价值。

Macroscope:AI代码理解引擎正式发布

Macroscope:AI代码理解引擎正式发布

前Twitter产品负责人Kayvon Beykpour推出AI驱动的代码理解引擎Macroscope,旨在帮助开发者和产品负责人总结代码库更新并捕获漏洞。该工具通过GitHub应用访问代码库,使用抽象语法树分析代码变化,结合大语言模型提供自然语言问答功能。产品定价为每月每个活跃开发者30美元,已获得3000万美元A轮融资。

英美签署科技繁荣协议共建欧洲最大AI工厂

英美签署科技繁荣协议共建欧洲最大AI工厂

英美两国签署科技繁荣协议,推动人工智能、量子和核技术发展。英国政府投资440亿英镑,微软、英伟达、谷歌、OpenAI等承诺投资310亿英镑,目标建设欧洲最大AI工厂。协议包括联合研究计划,开发AI模型用于癌症等疾病的靶向治疗。英伟达将在12个月内向英国提供12万块GPU,OpenAI部署8000块GPU并计划扩展至6万块,微软投资220亿英镑建设英国最大AI超级计算机。

亚马逊推出AI智能体助力第三方卖家业务管理

亚马逊推出AI智能体助力第三方卖家业务管理

亚马逊宣布推出全天候AI代理,升级卖家助手工具,帮助第三方卖家运营业务。该AI助手不仅能监控账户健康状况和库存,还能制定策略并在授权下采取行动。功能包括标记滞销产品、分析需求模式、提供发货建议、确保产品合规等。亚马逊还将代理AI引入广告领域,允许卖家通过对话提示开发广告。这是亚马逊为第三方卖家推出的最新AI工具。

大学AI应用从全面禁令转向科技巨头合作模式

大学AI应用从全面禁令转向科技巨头合作模式

谷歌宣布为大学生免费提供最先进AI工具,这是科技巨头塑造未来劳动力的多亿美元竞争最新举措。通过10亿美元三年投资,谷歌AI教育加速器为美国大学生提供Gemini 2.5 Pro培训认证。这标志着高等教育从ChatGPT出现后的广泛禁用转向机构合作。微软、IBM等企业也在争夺AI人才,通过免费工具、培训项目和认证体系吸引学生。成功将取决于哪个生态系统能最好地为学生职业发展提供实际价值。

Macroscope:AI代码理解引擎正式发布

Macroscope:AI代码理解引擎正式发布

前Twitter产品负责人Kayvon Beykpour推出AI驱动的代码理解引擎Macroscope,旨在帮助开发者和产品负责人总结代码库更新并捕获漏洞。该工具通过GitHub应用访问代码库,使用抽象语法树分析代码变化,结合大语言模型提供自然语言问答功能。产品定价为每月每个活跃开发者30美元,已获得3000万美元A轮融资。

Solo.io推出Kagent:为云原生基础设施引入智能体AI

Solo.io推出Kagent:为云原生基础设施引入智能体AI

Solo.io推出的Kagent企业版通过扩展Kubernetes功能,为AI代理、工具和大语言模型提供上下文感知的基础设施。该平台包含三层架构:网络层支持模型上下文协议和代理间通信,运行时层扩展身份策略模型,管理层提供集中式AgentOps功能。与微软Copilot等竞品不同,Kagent专注基础设施而非特定应用,支持异构代理框架部署,提供成本透明度和合规审计能力,助力企业将AI代理从试点阶段推向生产环境。

AMD推出ROCm 7软件平台追赶英伟达CUDA性能优势

AMD推出ROCm 7软件平台追赶英伟达CUDA性能优势

AMD推出ROCm 7.0软件平台,在推理性能上实现3.5倍提升,训练浮点性能提升3倍。该平台支持OCP微缩放数据类型硬件加速,引入AI张量引擎AITER,可将MLA解码操作提升17倍。结合MI355X芯片,AMD声称在DeepSeek R1推理负载中性能超越英伟达B200芯片1.3倍,并已集成至vLLM和SGLang等主流推理引擎中。