亚马逊网络服务(AWS)今日宣布,在其AI模型组合中新增两款全托管开放权重模型——Qwen3和DeepSeek-V3.1。
这些新模型为依赖Amazon Bedrock生成式AI服务的客户提供了更大的灵活性,以满足其不断发展的业务需求。
开放权重模型为开发者提供了关于模型权重的更高透明度,这使得为特定用例定制模型变得更加容易。Amazon Bedrock中的这些新开放权重模型与来自Meta Platforms、Mistral AI和OpenAI等领先开发商的其他模型共同组成了丰富的模型生态系统。
不同模型在各个领域都有其独特优势。来自阿里巴巴的Qwen3为复杂编程和通用推理提供了模型选项,而DeepSeek-V3.1模型在数学、编程和智能体任务方面表现出色。Qwen3是Amazon Bedrock产品组合中首个全托管的Qwen模型系列。
虽然这些模型可以免费获得,但通过在Bedrock中使用这些模型,客户可以利用亚马逊的企业级安全性,包括数据加密和严格的访问控制,这有助于维护数据隐私和法规合规性。客户保持对其数据的完全控制,AWS不会与模型提供商共享模型输入和输出数据,也不会用于改进基础模型。
AWS技术总监Shaown Nandi表示,AWS将在亚洲、拉丁美洲、欧洲和北美等关键全球市场推出这些新模型。他指出,大型通用AI模型对于许多企业中常见的窄用例来说可能过于庞大。"你想要一个更小的模型,或者更便宜的模型,这是可以的,因为用例的多样性,"Nandi说。"我们在开放权重模型中看到的是成本优势和选择优势。"
Qwen3系列提供四个新的开放权重模型,这些多语言模型可以规划多步骤工作流程,与工具和API集成,并在任务中处理长上下文窗口。两个通用模型提供"思考"和"非思考"推理模式。
DeepSeek-V3.1模型的优势在于混合推理能力,能够平衡快速响应与深度、透明的思考,使客户能够根据要解决的问题类型在模式之间切换。该模型能耗效率很高,很少将基本查询转化为冗长的讨论,同时在制定战略决策方面保持高水平的专业性。
AWS通过客户反馈、使用情况分析和对部署及更新计划的educated guess来决定在哪些市场推出什么模型。目前,AWS提供数百种模型,并正在扩大添加新模型的区域范围。
Q&A
Q1:Qwen3和DeepSeek-V3.1模型有什么特色功能?
A:Qwen3是来自阿里巴巴的多语言模型,擅长复杂编程和通用推理,可以规划多步骤工作流程,提供"思考"和"非思考"推理模式。DeepSeek-V3.1则在数学、编程和智能体任务方面表现出色,具有混合推理能力,能够平衡快速响应与深度思考。
Q2:开放权重模型相比其他模型有什么优势?
A:开放权重模型提供更高的透明度,使开发者更容易为特定用例定制模型。它们具有成本优势和选择优势,通过模型蒸馏技术,客户可以将模型训练到更小尺寸,保持准确性的同时运行成本可降低多达30倍。
Q3:AWS在哪些地区提供这些新的AI模型服务?
A:AWS将在亚洲、拉丁美洲、欧洲和北美等关键全球市场推出这些新模型。特别是拉丁美洲和亚洲部分地区的客户对能够为本地需求调优模型表现出特别的兴趣,而开放权重模型更容易实现这一点。
好文章,需要你的鼓励
ChatGPT发布三年后,物理AI成为行业最新热词。物理AI是指在硬件中实现的AI系统,能够感知周围世界并进行推理以执行操作。与传统机器人不同,物理AI具备推理、行动和与环境交互的能力。智能眼镜是物理AI的典型代表,能够看到和听到用户所体验的内容。高通专家指出,AI可穿戴设备可以为机器人提供基于真实人类体验的高质量数据集,形成良性生态系统。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
来自加州大学伯克利分校和康奈尔大学的研究团队,通过分析130万篇学术论文发现,使用ChatGPT等AI工具的科学家论文产出平均提升40-60%,且英语非母语研究者受益最大。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。