9月24日,阿里巴巴AI旗舰应用夸克正式发布全新AI创作平台“造点”。平台集成AI生图与AI生视频两大核心能力,率先接入通义万相Wan2.5,成为国内首个支持音画同步视频生成的平台。在生图方面,“造点”引入了全球领先的图像生成模型 Midjourney V7。结合夸克自研技术,“造点”为用户提供了图像与视频兼备的一站式创作体验。
对通义万相Wan2.5的集成是平台的一大亮点。依托于最新模型能力,“造点”能生成和画面匹配的人声、音效和背景音乐,支持10S时长,单次生成即可实现更完整的剧情故事;支持24帧/秒的1080P高清视频,画面质量能够满足电影级场景的创作需求。模型具备极强的指令遵循能力,可在视频生成中完成运镜等复杂连续变化的控制。
在AI生图方面,“造点”全面支持 Midjourney V7的多项核心能力,包括多图参考、风格代码、精细化参数控制等,可满足专业创作者在构图、风格表达与细节打磨上的高阶需求。结合夸克自研能力,“造点”在亚洲人像生成、中文文字生成、国风元素等方面尤为突出,适用于电商、平面设计及影视游戏等应用场景。
内测期间,“造点”吸引了大量专业AIGC创作者,诞生了如“中世纪油画大合唱”、“文物吃月饼”、“巨物猫咪去旅行”等爆款作品。视频中的人物口型、动作、神态、配乐一气呵成。一位创作者表示:“Midjourney生成图片,再配合Wan2.5生成视频,画质细腻稳定,尤其是这次视频模型的升级,音频视频可以同步输出,大大提升了创作效率。”
创作者在夸克“造点”制作的创意内容
目前,用户可直接访问 zaodian.quark.cn,或通过夸克PC端“AI生图”进入“造点”。即日起至9月30日,所有用户均可限时7天免费体验通义万相Wan2.5的视频生成能力。
在夸克APP端,“造点”提供轻量化的创作体验,满足更多普通用户的需求。用户既可实现“一句话P图”“AI创意视频”等趣味玩法,也能满足日常修图需求,如滤镜、美颜、去路人等;同时支持换发型、换背景、风格转换、3D手办生成等热门AI场景。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
Google DeepMind团队发布了EmbeddingGemma,这是一个仅有3.08亿参数的轻量级文本理解模型,却能达到7亿参数模型的性能水平。该模型在权威的多语言文本嵌入基准测试中排名第一,支持250多种语言,特别适合移动设备部署。研究团队通过创新的编码器-解码器初始化、三重损失函数训练和模型融合技术,实现了性能与效率的完美平衡,为AI技术普及化开辟了新路径。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
日本奈良先端科学技术大学等机构首次深入研究AI编程工具Claude Code在真实开源项目中的表现。通过分析567个代码贡献,发现83.8%被成功接受,54.9%无需修改直接使用。AI擅长重构、测试和文档工作,但需要人工修正bug处理、代码风格等问题。研究揭示了AI编程工具的实际能力边界和改进方向。