9月24日,阿里巴巴AI旗舰应用夸克正式发布全新AI创作平台“造点”。平台集成AI生图与AI生视频两大核心能力,率先接入通义万相Wan2.5,成为国内首个支持音画同步视频生成的平台。在生图方面,“造点”引入了全球领先的图像生成模型 Midjourney V7。结合夸克自研技术,“造点”为用户提供了图像与视频兼备的一站式创作体验。

对通义万相Wan2.5的集成是平台的一大亮点。依托于最新模型能力,“造点”能生成和画面匹配的人声、音效和背景音乐,支持10S时长,单次生成即可实现更完整的剧情故事;支持24帧/秒的1080P高清视频,画面质量能够满足电影级场景的创作需求。模型具备极强的指令遵循能力,可在视频生成中完成运镜等复杂连续变化的控制。
在AI生图方面,“造点”全面支持 Midjourney V7的多项核心能力,包括多图参考、风格代码、精细化参数控制等,可满足专业创作者在构图、风格表达与细节打磨上的高阶需求。结合夸克自研能力,“造点”在亚洲人像生成、中文文字生成、国风元素等方面尤为突出,适用于电商、平面设计及影视游戏等应用场景。
内测期间,“造点”吸引了大量专业AIGC创作者,诞生了如“中世纪油画大合唱”、“文物吃月饼”、“巨物猫咪去旅行”等爆款作品。视频中的人物口型、动作、神态、配乐一气呵成。一位创作者表示:“Midjourney生成图片,再配合Wan2.5生成视频,画质细腻稳定,尤其是这次视频模型的升级,音频视频可以同步输出,大大提升了创作效率。”

创作者在夸克“造点”制作的创意内容
目前,用户可直接访问 zaodian.quark.cn,或通过夸克PC端“AI生图”进入“造点”。即日起至9月30日,所有用户均可限时7天免费体验通义万相Wan2.5的视频生成能力。
在夸克APP端,“造点”提供轻量化的创作体验,满足更多普通用户的需求。用户既可实现“一句话P图”“AI创意视频”等趣味玩法,也能满足日常修图需求,如滤镜、美颜、去路人等;同时支持换发型、换背景、风格转换、3D手办生成等热门AI场景。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
这项由香港中文大学和AWS团队联合开发的研究推出了TALK2MOVE系统,实现了用自然语言精准操作图片中物体的位置、角度和大小。该系统采用强化学习训练方式,通过空间感知奖励机制和智能步骤采样技术,在移动、旋转、缩放三类操作上的准确率显著超越现有方法,同时大幅降低了对昂贵训练数据的依赖,为AI图像编辑领域带来重要突破。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
斯坦福大学等知名机构联合研究发现,企业AI助手在执行组织政策时存在严重"偏科"问题:处理允许请求时成功率超95%,但拒绝违规请求时仅13-40%。研究团队开发的COMPASS评估框架通过8个行业5920个测试问题,揭示了AI助手普遍缺乏"拒绝技能"的问题,并提出了针对性训练解决方案。