9月24日,阿里巴巴AI旗舰应用夸克正式发布全新AI创作平台“造点”。平台集成AI生图与AI生视频两大核心能力,率先接入通义万相Wan2.5,成为国内首个支持音画同步视频生成的平台。在生图方面,“造点”引入了全球领先的图像生成模型 Midjourney V7。结合夸克自研技术,“造点”为用户提供了图像与视频兼备的一站式创作体验。

对通义万相Wan2.5的集成是平台的一大亮点。依托于最新模型能力,“造点”能生成和画面匹配的人声、音效和背景音乐,支持10S时长,单次生成即可实现更完整的剧情故事;支持24帧/秒的1080P高清视频,画面质量能够满足电影级场景的创作需求。模型具备极强的指令遵循能力,可在视频生成中完成运镜等复杂连续变化的控制。
在AI生图方面,“造点”全面支持 Midjourney V7的多项核心能力,包括多图参考、风格代码、精细化参数控制等,可满足专业创作者在构图、风格表达与细节打磨上的高阶需求。结合夸克自研能力,“造点”在亚洲人像生成、中文文字生成、国风元素等方面尤为突出,适用于电商、平面设计及影视游戏等应用场景。
内测期间,“造点”吸引了大量专业AIGC创作者,诞生了如“中世纪油画大合唱”、“文物吃月饼”、“巨物猫咪去旅行”等爆款作品。视频中的人物口型、动作、神态、配乐一气呵成。一位创作者表示:“Midjourney生成图片,再配合Wan2.5生成视频,画质细腻稳定,尤其是这次视频模型的升级,音频视频可以同步输出,大大提升了创作效率。”

创作者在夸克“造点”制作的创意内容
目前,用户可直接访问 zaodian.quark.cn,或通过夸克PC端“AI生图”进入“造点”。即日起至9月30日,所有用户均可限时7天免费体验通义万相Wan2.5的视频生成能力。
在夸克APP端,“造点”提供轻量化的创作体验,满足更多普通用户的需求。用户既可实现“一句话P图”“AI创意视频”等趣味玩法,也能满足日常修图需求,如滤镜、美颜、去路人等;同时支持换发型、换背景、风格转换、3D手办生成等热门AI场景。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。