过去,营销人员通常需要依赖设计师和其他创意专业人士,才能为个性化在线广告活动制作图片和视频素材。
2024 年底,成立七年的初创公司 Hightouch 推出了一项由 AI 驱动的服务,使营销专业人员无需借助品牌设计团队或广告代理机构,便能为达美乐、Chime、PetSmart 和 Spotify 等品牌创作定制化内容。
这项服务取得了显著成效。Hightouch 向 TechCrunch 透露,自 20 个月前推出 AI 产品以来,公司新增了 7000 万美元的年度经常性收入(ARR),使总 ARR 达到 1 亿美元。
"在生成式 AI 出现之前,没有多年设计经验的人几乎不可能创作出消费级素材。"Hightouch 联合 CEO Kashish Gupta 表示。公司的另一位联合 CEO Tejas Manohar 曾担任 Segment 的工程经理,该客户数据平台于 2020 年以 32 亿美元被 Twilio 收购。
不过,Hightouch 的方案远不止于通用 AI 模型所能实现的范围。
Hightouch 表示,许多品牌最初尝试使用通用基础模型来生成广告活动——这类宽泛的 AI 系统虽然能驱动聊天机器人等工具,但缺乏对特定品牌的了解——结果发现生成的图片和视频往往无法达到"品牌一致性"的要求。
"基础模型对具体的消费品牌一无所知,无论是品牌色彩、字体、语调还是素材资产,它们都不了解。"Gupta 说,"大语言模型会凭空生成根本不存在的产品,而你无法基于不存在的产品来做广告和邮件营销。"
为确保品牌一致性,Hightouch 直接与客户现有的创意工具对接,例如广受欢迎的设计平台 Figma、图片素材库以及内容管理系统(CMS)。
通过抓取这些来源的数据,平台得以"学习"一家公司特定的品牌形象。Hightouch 的 AI 智能体随后利用这些照片、设计稿和客户洞察,帮助营销人员自主构建个性化广告活动,无需等待设计师或开发人员介入。
Hightouch AI 的目标是生成看起来出自专业设计师之手的图片和视频,从而避免 AI 内容常见的"廉价感"或千篇一律的视觉风格。
"例如,达美乐永远不会让 AI 凭空生成一张披萨图片,"Gupta 说,"他们始终使用现有的披萨实拍图,然后将其嵌入广告中,背景部分可能是由 AI 生成的,周围的其他元素也可能由 AI 生成。"
该公司目前拥有约 380 名员工,并于 2025 年 2 月在由 Sapphire Ventures 领投的 8000 万美元 C 轮融资后,估值达到 12 亿美元。
Q&A
Q1:Hightouch 的 AI 营销工具与普通 AI 模型有什么区别?
A:普通 AI 基础模型缺乏对特定品牌的了解,容易生成不符合品牌规范的内容,甚至凭空生成不存在的产品。Hightouch 的方案是直接对接客户的 Figma 设计平台、图片素材库和内容管理系统,让 AI 智能体"学习"品牌的色彩、字体、语调等元素,从而生成符合品牌一致性的广告素材,避免出现"廉价感"或不符实际的内容。
Q2:Hightouch 的 ARR 是如何在短时间内增长到 1 亿美元的?
A:Hightouch 于 2024 年底推出 AI 驱动的营销内容生成服务,在此后的 20 个月内新增了 7000 万美元的年度经常性收入(ARR),总 ARR 达到 1 亿美元。这一增长主要得益于该服务帮助达美乐、Spotify 等知名品牌的营销团队绕过设计团队和广告代理机构,自主完成个性化广告活动的创作,大幅提升了效率。
Q3:Hightouch 目前的融资情况和公司规模如何?
A:Hightouch 于 2025 年 2 月完成了由 Sapphire Ventures 领投的 8000 万美元 C 轮融资,公司估值达到 12 亿美元。目前公司共有约 380 名员工,由联合 CEO Kashish Gupta 和 Tejas Manohar 共同领导,后者曾任 Segment 工程经理,该平台于 2020 年以 32 亿美元被 Twilio 收购。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。