9月24日,阿里巴巴AI旗舰应用夸克正式发布全新AI创作平台“造点”。平台集成AI生图与AI生视频两大核心能力,率先接入通义万相Wan2.5,成为国内首个支持音画同步视频生成的平台。在生图方面,“造点”引入了全球领先的图像生成模型 Midjourney V7。结合夸克自研技术,“造点”为用户提供了图像与视频兼备的一站式创作体验。
对通义万相Wan2.5的集成是平台的一大亮点。依托于最新模型能力,“造点”能生成和画面匹配的人声、音效和背景音乐,支持10S时长,单次生成即可实现更完整的剧情故事;支持24帧/秒的1080P高清视频,画面质量能够满足电影级场景的创作需求。模型具备极强的指令遵循能力,可在视频生成中完成运镜等复杂连续变化的控制。
在AI生图方面,“造点”全面支持 Midjourney V7的多项核心能力,包括多图参考、风格代码、精细化参数控制等,可满足专业创作者在构图、风格表达与细节打磨上的高阶需求。结合夸克自研能力,“造点”在亚洲人像生成、中文文字生成、国风元素等方面尤为突出,适用于电商、平面设计及影视游戏等应用场景。
内测期间,“造点”吸引了大量专业AIGC创作者,诞生了如“中世纪油画大合唱”、“文物吃月饼”、“巨物猫咪去旅行”等爆款作品。视频中的人物口型、动作、神态、配乐一气呵成。一位创作者表示:“Midjourney生成图片,再配合Wan2.5生成视频,画质细腻稳定,尤其是这次视频模型的升级,音频视频可以同步输出,大大提升了创作效率。”
创作者在夸克“造点”制作的创意内容
目前,用户可直接访问 zaodian.quark.cn,或通过夸克PC端“AI生图”进入“造点”。即日起至9月30日,所有用户均可限时7天免费体验通义万相Wan2.5的视频生成能力。
在夸克APP端,“造点”提供轻量化的创作体验,满足更多普通用户的需求。用户既可实现“一句话P图”“AI创意视频”等趣味玩法,也能满足日常修图需求,如滤镜、美颜、去路人等;同时支持换发型、换背景、风格转换、3D手办生成等热门AI场景。
好文章,需要你的鼓励
当前世界充满变数,IT领域除AI外鲜少受到关注。从气候变化到地缘政治紧张局势,IT在公众讨论中边缘化。这在技术变革关键时刻十分危险。CEO、高管和媒体对IT缺乏深度思考,普遍持"不坏就别谈"的态度。CIO需要重新获得利益相关者关注,克服对IT运营的冷漠和无知。技术文盲问题严重,大多数人从未构建过IT系统。IT行业需要重新赢得人心,大幅提升公众IT知识水平。
OpenAI团队的最新研究揭示了大语言模型产生幻觉的根本原因:AI就像面临难题的学生,宁愿猜测也不愿承认无知。研究发现,即使训练数据完全正确,统计学原理也会导致AI产生错误信息。更重要的是,现有评估体系惩罚不确定性表达,鼓励AI进行猜测。研究提出了显式置信度目标等解决方案,通过改革评估标准让AI学会诚实地说"不知道",为构建更可信的AI系统指明方向。
技术驱动的变革比以往更加频繁,但成功并不能得到保证。Gartner研究显示,只有五分之一的组织能够在75%或更多时间内从转型项目中获得预期收益。其余都是昂贵的失败。有效的变革管理能够提高技术采用率,服务于业务目标。变革管理不再是边缘活动或软技能,而是决定新举措是否能够创造商业价值的核心绩效学科。
字节跳动AI实验室提出"逆向工程推理"新范式,通过从优质作品反推思考过程的方式训练AI进行创意写作。该方法创建了包含2万个思考轨迹的DeepWriting-20K数据集,训练的DeepWriter-8B模型在多项写作评测中媲美GPT-4o等顶级商业模型,为AI在开放性创意任务上的应用开辟了新道路。