在访问中国期间,苹果 CEO Tim Cook 在北京参加中国发展高层论坛时,称赞 DeepSeek AI 为"出色"。
DeepSeek 是一款在中国开发的 AI 聊天机器人,迅速登上了苹果 App Store 排行榜榜首。
中国发布的基准测试表明,其性能可与世界上现有最佳模型相媲美。专家们迅速验证了这些声明,对中国能够以远低于美国模型的开发成本,并在配置适中的 PC 上本地运行达到如此水平表示震惊 —— 尽管后来有人指出成本差异被夸大了。
由于隐私问题的担忧,美国和欧洲都开始展开调查。
随后出现了上述提到的其他问题。
Cook 正在参加中国发展高层论坛,并在微博上分享了他的访问经历:
"虽然 Henry Lau 是独立表演者,但有了 iPhone 16 Pro Max 作为伙伴,他能把每个舞台都变成盛大的音乐会。感谢你与我们分享你非凡的才华!"
"看到 iPad 和 Mac 帮助乡村教师为学生们带来生动的课程,真是令人惊叹。我们很自豪能够扩大与中国发展研究基金会的合作,因为我们知道教育能为中国农村社区创造机会。"
"物理课程已经发生了巨大的变化!很高兴看到教育工作者用 Apple Vision Pro 突破学习的界限!"
"我们很自豪地宣布在中国设立新的清洁能源基金!我们在这里的供应链中已有三分之二使用可再生能源,这将进一步帮助我们实现到 2030 年 100% 使用可再生能源的目标。"
"感谢春晓分享你如何通过 iPhone 16 Pro 的现代镜头捕捉昆曲这门传统艺术!"
据《南华早报》报道,他在接受官方媒体采访时称 DeepSeek "出色"。
该报道称,在北京举行的旨在吸引全球投资者的国家级论坛 —— 中国发展高层论坛期间,Cook 在接受中国新闻社采访时表示 DeepSeek 的模型"出色"。Cook 没有进一步详述。
由于苹果在制造业和销售方面都高度依赖中国,这迫使 Cook 经常不得不对这个国家做出外交性发言,无论该国的政策和行为可能与 iPhone 制造商的价值观有多大冲突。
苹果不得不做出的一个重大妥协是在中国推出 Apple Intelligence 时与当地公司合作,这将涉及所有的政治审查。政府已经明确表示这一点是不容商议的。
看来 Cook 很可能是被要求对 DeepSeek 发表评论,因此给出了最简短的外交性回答。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。