OpenAI 在周四宣布了 GPT-4.5 的预览版,该公司称这是迄今为止最大和最好的聊天模型。他们承诺这个新版本将在语气、交互和通用知识方面更具人性化特征。
根据 OpenAI 发布的新闻稿,该模型可以带来更温暖、更自然流畅的对话,具备更强的情感智能和更先进的能力,包括识别模式、建立联系和更具创造性思维的能力。
公司详细说明,这个模型能够理解更多细微差别和上下文,更善于协作,并且整体知识储备更为丰富,有效降低了产生幻觉的可能性。
这一消息发布之际,科技公司正在追求开发能够匹敹或超越人类能力的 AI 这一更宏大的目标。虽然 GPT-4.5 是一次进步,但相比于传闻即将发布的、更先进的 GPT-5 模型而言,这可能只是一个渐进式的改进。此次新版本的发布也紧随中国 DeepSeek 以其低成本模型震动生成式 AI 领域,以及 Google 发布 Gemini AI 2.0 版本之后。
OpenAI 持续扩展其各种产品供应。本周早些时候,该公司向所有付费 ChatGPT 用户开放了 Deep Research 工具,并推出了免费版的 Advanced Voice Mode 功能,使用户能够与 ChatGPT 进行实时语音交互。
公司表示,强大的预训练有助于 GPT-4.5 等模型更好地吸收通用知识,理解上下文关系,并学习高层次的推理模式。
OpenAI 在一份声明中表示:"随着 GPT-4.5 等模型通过预训练变得更加智能和知识渊博,它们将为未来的推理和工具使用代理提供更强大的基础。"
该公司表示,模型将在研究预览期间继续训练,预览版将向付费的 ChatGPT Pro 用户和开发者开放。预览阶段的时长将取决于用户反馈。
好文章,需要你的鼓励
Akamai坚持“简而未减、网络先行、拥抱开源”的独特定位。凭借“鱼与熊掌兼得”的特色,过去几年,Akamai在电商、流媒体、广告科技、SaaS、金融科技等行业客户中获得了广泛认可。
复旦大学研究团队开发的AnyI2V系统实现了从任意条件图像到视频的生成突破。该系统无需训练即可处理多种输入模态(包括3D网格、点云等),支持用户自定义运动轨迹控制,并通过创新的特征注入和语义掩模技术实现了高质量视频生成,为视频创作领域带来了革命性的便利工具。
谷歌宣布为Chrome iOS版推出新功能,用户可在工作和个人谷歌账户间轻松切换,无需反复登录登出。该功能支持托管账户浏览,实现严格的数据分离,工作账户的标签页、历史记录和密码等本地数据与个人浏览完全隔离。随着企业不再提供公司手机,员工常需在个人设备上访问公司资源,此更新有助企业允许员工使用自选设备。
斯坦福大学研究团队开发了KL-tracing方法,能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记,利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中,相比传统方法性能提升16.6%,展现了大型生成模型在计算机视觉任务中的潜力。