AI 驱动的头像内容创作初创公司 Akool 宣布对 Akool Streaming Avatars 进行升级,实现头像与 AI 模型的连接。
Akool 增加了先进的视频生成技术,现在可以与大语言模型 (LLM) 无缝集成,帮助模型开发者创建动态、逼真的 2D 头像。
用户只需上传照片并提供语音录音,就能创建个性化头像,使其成为 LLM 的自然延伸。通过熟悉的面孔和声音,让用户与头像的互动更接近真实人类交流。
人际互动对消费者来说至关重要 - 82% 的美国消费者和 74% 的非美国消费者表示希望获得更多互动。目前已经推出的 Akool Streaming Avatars 显著缩小了 AI 模型与终端用户之间的差距,让 AI 更易接近、更具吸引力和人性化,使企业能够差异化其产品并推动用户采用。
最终,Akool Streaming Avatars 通过富有情感的实时互动,让传统的基于文本的 LLM 更具人性化。
Akool CEO Jiajun Lu 在声明中表示:"消费者认为静态头像枯燥、单调且效果不佳,但 Akool Streaming Avatars 具有动态性和表现力,创造了新的互动层次。从个人内容创作者到大型企业,我们的 Streaming Avatars 大大降低了视频制作成本,是任何希望通过 AI 以新颖高效方式接触全球受众和客户的理想选择。"
在给 GamesBeat 的信息中,Lu 表示他的灵感来自兴趣和市场需求的结合,但主要是出于创造数字人类的热情。
跨行业应用
Akool 头像定制。
这项先进创新使企业能够构建和交付先进的情境感知头像,提供实时响应,正在改变以下行业:
电子商务: 虚拟销售助手指导客户进行产品咨询和购买决策。Akool 的头像使客服响应时间减少 40%,同时用户满意度提高 30%。
教育: 开发互动性强的课程,配备逼真的虚拟教师提供实时反馈。
医疗保健: 头像通过访问患者数据并提供富有同理心的回应,以熟悉的面孔提供个性化医疗建议。
客户服务: LLM 驱动的头像以情感智能处理查询,缩短响应时间并提高满意度。
通过利用 Akool 的专业级视频生成技术,客户还可以更轻松地进行集成。即用型应用程序接口 (API) 和软件开发工具包 (SDK) 允许快速部署并将头像集成到现有移动和网络应用中。
Akool 还表示这些头像具有情感智能。Akool Streaming Avatars 自然地传达说话者的情感,增强实时互动的真实性并促进更深层次的受众互动。该公司表示,凭借市场上最低的延迟,终端用户可以获得自然和互动的体验。
它还支持具有手势能力的头像。通过呈现面部表情、肢体语言和手势等细节,Akool Streaming Avatars 能够创建高度逼真和富有表现力的角色。
探索 AI 头像的未来
该公司提供两种 AI 头像变体,包括流式头像。这种设计用于实时互动的 AI 头像可以动态响应输入,适用于实时客户支持等互动场景。
此外还有会说话的头像。这种工具根据文本输入或预录音频生成头像说话的视频,设计用于以动态和吸引人的方式传递预录或脚本信息。头像模仿人类的唇形同步和面部表情,适用于营销视频、在线学习内容、个性化消息和社交媒体内容。
公司成立于 2022 年,已实现近 4000 万美元的已开票年度经常性收入 (ARR),是生成式 AI 驱动技术的全球领导者,正在改变数字内容创作格局。Akool 表示,其解决方案已为卡塔尔航空、可口可乐和跨国科技公司等全球领先品牌节省了数百万生产成本,提升了参与度,加快了市场覆盖。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。